Blank white background with no objects or features visible.

NOVA PESQUISA: 80% dos custos de IA são invisíveis na fatura. Mais de 200 líderes revelam para onde o dinheiro vai. Leia→

Preços do Cloudflare AI Gateway [Um Detalhamento Completo]

By TrueFoundry

Updated: January 23, 2026

O Cloudflare AI Gateway rapidamente se tornou uma escolha popular para equipes que buscam gerenciar, monitorar e rotear o tráfego de LLMs através de um proxy centralizado. À medida que a adoção de LLMs acelera em todas as indústrias, as equipes estão cada vez mais introduzindo gateways de IA para adicionar observabilidade, segurança e controle entre suas aplicações e modelos de terceiros.

Mas à medida que o uso de IA aumenta, a clareza dos preços se torna um fator crítico. As equipes precisam entender não apenas os custos por chamada, mas também a infraestrutura e os padrões operacionais que influenciam o gasto a longo prazo.

À primeira vista, os preços do Cloudflare AI Gateway parecem simples, especialmente com acesso gratuito a recursos essenciais. No entanto, o uso no mundo real frequentemente revela custos ocultos ligados ao registro (logging), retenção de dados e limites de escalabilidade.

Neste blog, detalhamos:

  • Exatamente o que você paga ao usar o Cloudflare AI Gateway
  • Os custos indiretos que as equipes frequentemente ignoram
  • Por que empresas em crescimento eventualmente migram para alternativas in-VPC como o TrueFoundry para ter mais controle

O Que É o Cloudflare AI Gateway?

Antes de abordar o custo do Cloudflare AI Gateway, é importante entender o que ele faz e onde se encaixa na pilha de IA.

O Cloudflare AI Gateway atua como uma camada centralizada para equipes que implementam aplicações de IA que dependem de provedores de LLMs de terceiros. Ele permite que as equipes:

  • Roteie o tráfego de IA com segurança entre aplicações e múltiplos provedores de modelos de base como OpenAI, Anthropic e Hugging Face.
  • Obtenha visibilidade sobre prompts, respostas, latência e métricas de uso para observabilidade e monitoramento.
  • Integre diretamente com a pilha de IA mais ampla da Cloudflare, incluindo Workers AI, cache, limitação de taxa e infraestrutura de borda global.

Recursos do Cloudflare AI Gateway que Afetam Seu Custo

Embora o Cloudflare AI Gateway não cobre por token, vários recursos afetam indiretamente o custo total de propriedade (TCO) à medida que o uso aumenta:

  • Roteamento de requisições e limitação de taxa: Ajuda a controlar o fluxo de tráfego, mas aumenta o número de eventos registrados à medida que o uso de IA cresce. Requer um plano pago do Cloudflare Workers para execução de alto volume.
  • Cache de prompts e respostas: Reduz chamadas repetidas a modelos upstream (economizando dinheiro em taxas de token), mas a eficiência depende dos padrões de tráfego e da taxa de acerto do cache.
  • Análise de uso e rastreamento de tokens: Requer registro persistente, o que pode introduzir custos adicionais relacionados ao armazenamento e retenção.
  • Integração com múltiplos provedores de IA: Aumenta a flexibilidade, mas torna os fatores de observabilidade de custos de IA, como atribuição e previsão entre provedores, mais complexos.
  • Faturamento Unificado (Novidade para 2026): A Cloudflare agora permite que você pague pelo uso de modelos de terceiros (OpenAI, etc.) diretamente através da sua fatura Cloudflare, adicionando uma pequena taxa de conveniência de transação.
  • Integração Logpush: O streaming de logs para um bucket S3 externo ou ferramenta SIEM é um recurso pago que incorre em custos adicionais ($0,05 por milhão de registros após 10 milhões/mês em planos pagos).

Níveis de Preço do Cloudflare AI Gateway

A Cloudflare utiliza um modelo "freemium" onde o próprio gateway está disponível para todos os usuários, mas escalar sua aplicação geralmente requer uma transição do nível Gratuito para o nível Pago do Workers.

Workers Pricing & Limits
Features Workers Free Workers Paid Enterprise
Monthly Subscription $0 Starts at $5 / month Custom
AI Gateway Logs 100,000 total 1,000,000 total Custom
Max Storage Capacity 10M per gateway 10M per gateway Unlimited
Request Limit 100,000 / day 10M / month (included) Custom

O AI Gateway da Cloudflare está disponível em todos os planos de preços da Cloudflare, e os recursos principais são de uso gratuito. Não há taxa de gateway por chamada além do seu plano Cloudflare: você simplesmente adiciona o gateway e começa a enviar tráfego.

Por padrão, a Cloudflare inclui um painel/análise gratuito, cache, limitação de taxa e camada de registro, assim, muitas equipes podem ativá-lo sem custo adicional.

No entanto, no plano gratuito, aplicam-se alguns limites. Por exemplo, o nível gratuito da Cloudflare (Workers Free) inclui um total de 100.000 registos do AI Gateway por mês (em todos os gateways) e para de registar após esse limite.

Para aumentar os limites, deve fazer upgrade para um plano Workers Paid, que oferece um total de 1.000.000 de registos. É importante notar que a Cloudflare não cobra por registo nos níveis gratuito ou pago – ou se mantém dentro dos registos incluídos ou faz o upgrade.

Planos de Preços Cloudflare AI: Gratuito vs. Pago

Como o Cloudflare AI Gateway é construído sobre Workers, o uso intenso do gateway pode acionar a faturação de Workers.

O plano Workers Paid da Cloudflare começa com uma subscrição mensal de $5 (https://developers.cloudflare.com/workers/platform/pricing/) e inclui uma grande franquia de uso. Por exemplo, os Workers Standard (Pagos) incluem 10 milhões de pedidos e 30 milhões de CPU-ms de execução por mês.

Além disso, a Cloudflare cobra $0,30 por milhão adicional de pedidos e $0,02 por milhão adicional de milissegundos de CPU.

Na prática, isto significa que um gateway que serve 15 milhões de pedidos (com uso médio de CPU) custa cerca de $8 no total por mês. Em contraste, o plano gratuito para Cloudflare AI inclui apenas 100 mil pedidos/dia e uso mínimo de CPU — uma vez excedidos esses limites, os seus Workers simplesmente deixarão de funcionar (sem custos inesperados, mas com uma interrupção do serviço).

💡 Em resumo: Aplicações de IA de baixo uso podem permanecer no nível gratuito da Cloudflare, mas cargas de trabalho de produção frequentemente precisam do Workers Paid (uso de $5+) para escalar de forma fiável.

Volume de Pedidos e Custos de Registo

No plano Workers Pago, o Cloudflare AI Gateway ainda possui diretrizes de uso. O plano Workers Pago inclui até 1.000.000 de logs do AI Gateway por mês (em todos os gateways).

Se você enviar logs além desse limite, não poderá pagar um excedente — você deve excluir logs antigos ou fazer upgrade do seu plano para Enterprise. O armazenamento de logs é limitado: por padrão, cada gateway pode armazenar cerca de 10 milhões de logs (você pode definir seu próprio limite) e, uma vez cheio, nenhum novo log é salvo.

Assim, embora o registro de logs esteja "incluído", há um limite efetivo para a quantidade de histórico que você mantém.

A Cloudflare também oferece uma integração Logpush (https://developers.cloudflare.com/logs/logpush/) que transmite logs para o seu armazenamento, mas apenas no plano pago: você recebe 10 milhões de solicitações de Logpush por mês gratuitamente, e depois $0,05 por milhão adicional.

Em essência, o próprio gateway de IA da Cloudflare não tem uma taxa por solicitação, mas o suporte a um alto volume de logs acarreta custos ocultos. Manter mais logs (além do limite gratuito) pode forçar o armazenamento em sistemas externos ou levar a uma exclusão de logs mais agressiva. E se você quiser o envio automático de logs (para SIEM ou conformidade), esse recurso está disponível apenas em planos pagos com taxas de uso.

Todos esses fatores significam que os custos do gateway da Cloudflare podem aumentar indiretamente com o uso -- você paga pelo plano Workers mais qualquer registro/armazenamento de logs além do básico.

Custos de Uso Indiretos

Além do serviço AI Gateway, lembre-se de que cada solicitação que o gateway processa ainda chama um provedor de modelo subjacente. A Cloudflare não substitui o modelo: ela atua como proxy para suas chamadas para OpenAI, etc., então você ainda paga as taxas de token do modelo separadamente.

💡 Em outras palavras: A Cloudflare remove a imprevisibilidade da camada de rede, mas não elimina as cobranças por token da OpenAI/Anthropic/etc.

Além disso, o uso intenso de Workers (por exemplo, lógica de solicitação complexa ou cache) acarreta custos de computação, conforme observado acima. Essencialmente, usar o Cloudflare AI Gateway tem um custo base do plano Workers e limites de registro de logs, além do que você gasta chamando os modelos reais.

Os Custos Ocultos: O Que Não Está Incluído no Preço do Cloudflare AI Gateway

Além das taxas publicadas, existem vários custos ocultos e riscos a serem considerados com o AI Gateway da Cloudflare.

1. Limites de Retenção de Logs

Embora o registro básico seja gratuito, o Cloudflare impõe limites rigorosos de retenção. Se o seu aplicativo precisar reter mais de 100 mil (gratuito) ou 1 milhão (pago) de logs por mês, você não pode simplesmente pagar por logs extras — o armazenamento simplesmente para.

Para manter históricos longos, você deve excluir manualmente entradas antigas ou fazer um upgrade (potencialmente para um plano empresarial). Isso pode ser um problema orçamentário inesperado se você depender de logs para depuração ou auditoria.

2. Privacidade e Soberania de Dados

Por padrão, o gateway do Cloudflare captura todos os dados de solicitação e resposta (incluindo prompts, respostas do modelo, tokens, etc.) em sua própria infraestrutura. Embora o Cloudflare permita desativar o registro para conformidade com a privacidade, optar por não fazê-lo significa perder a visibilidade.

Caso contrário, você estará enviando dados potencialmente sensíveis (consultas de usuários, saídas, possivelmente PII) para a nuvem do Cloudflare. Muitos fornecedores se referem a isso como a abordagem de "caixa preta": logs e métricas ficam fora do seu controle.

Como uma análise observa, isso pode "forçar os dados do cliente — incluindo PII ou informações proprietárias — a sair de seu ambiente seguro". Em suma, se você precisa de governança de dados rigorosa ou conformidade com isolamento de rede, entregar prompts/respostas brutos ao Cloudflare pode ser inaceitável.

3. Roteamento de Caixa Preta

Relacionado a isso, o roteamento dinâmico e a lógica de fallback do Cloudflare são opacos. Internamente, o gateway decide qual endpoint do provedor ou resposta em cache usar. Os clientes não conseguem ver o roteamento detalhado ou as heurísticas de desempenho.

Este plano de controle "fechado" significa que você deve confiar nos algoritmos do Cloudflare para seleção de modelo, cache e failover, sem uma visão granular. Para algumas organizações (como aquelas sob auditoria rigorosa), essa falta de transparência é um custo oculto: você não pode certificar totalmente o que aconteceu dentro do gateway.

4. Limites de Recursos e Escalabilidade

Os limites rígidos do plano gratuito (limites diários de solicitação, limites de log) podem causar estrangulamento repentino ou falhas para aplicativos em crescimento. Ao contrário das nuvens de pagamento conforme o uso, o nível gratuito do Cloudflare simplesmente para, não cobra.

A mudança para planos pagos pode exigir alterações arquitetônicas. Por exemplo, atingir 100 mil logs/dia sem perceber fará com que o registro seja interrompido inesperadamente. Essas restrições operacionais se traduzem em custos de produtividade "ocultos"; você pode precisar de trabalho extra de DevOps para lidar com logs excluídos ou fazer um upgrade no meio do processo.

💡 Resumo: O preço do AI Gateway do Cloudflare pode parecer "gratuito", mas qualquer implantação não trivial deve considerar as taxas de uso do Workers, as necessidades de log/armazenamento e os problemas de governança de dados. As equipes devem orçar o monitoramento do uso do Workers, o possível envio ou armazenamento de logs e o potencial esforço de engenharia para permanecer dentro dos limites do Cloudflare.

Quando o Preço do Cloudflare AI Gateway Faz Sentido

O Cloudflare AI Gateway se destaca em cenários específicos. Para recursos de IA leves ou centrados na borda, ele oferece um caminho rápido. Se você já usa o CDN/Workers do Cloudflare, pode adicionar chamadas de IA com alterações mínimas (basta trocar o endpoint da API).

Isso é ideal para pequenas equipes ou startups que desejam um gateway implantado na borda instantaneamente, sem a sobrecarga de DevOps. Projetos em estágio inicial podem aproveitar o plano de preços gratuito do Cloudflare para prototipar experiências globais alimentadas por IA, armazenando em cache respostas populares para maior velocidade.

Também se encaixa em casos de uso onde a distribuição global é fundamental. Por exemplo, chatbots ou inferência executados diretamente na rede da Cloudflare podem se beneficiar dos mais de 250 PoPs da Cloudflare e da proteção DDoS integrada. Limitação de taxa simples e novas tentativas via Cloudflare também são atraentes para aplicativos que precisam de resiliência básica.

Em essência, a precificação do Cloudflare AI Gateway faz sentido quando você valoriza a velocidade de integração e a amplitude da rede da Cloudflare, e quando seu uso é modesto o suficiente para permanecer dentro (ou apenas exceder moderadamente) o plano gratuito.

No entanto, para grandes organizações com cargas de trabalho de alto volume ou altamente regulamentadas, essas vantagens podem ser superadas pelos custos ocultos da Cloudflare AI. A falta de controle granular e alocações de uso fixas pode dificultar o orçamento e a conformidade.

Por que Algumas Equipes Buscam Além do Cloudflare AI Gateway

À medida que os sistemas de IA amadurecem, as prioridades mudam da configuração rápida para a previsibilidade de custos, segurança e propriedade. As equipes começam a ultrapassar o Cloudflare AI Gateway devido a:

  • Uso crescente de IA: À medida que o uso do modelo escala, o volume de tokens aumenta e a necessidade de precificação alinhada à infraestrutura torna-se urgente. As abstrações da Cloudflare podem dificultar a previsão.
  • Requisitos de conformidade e residência de dados: Indústrias regulamentadas frequentemente precisam de controle total sobre onde os prompts e as conclusões são processados. O modelo SaaS da Cloudflare introduz complicações legais e de auditoria em relação à conformidade com a residência de dados.
  • Fluxos de trabalho agentivos e pipelines RAG: Cargas de trabalho de raciocínio multi-etapas e geração aumentada por recuperação exigem controle rigoroso, logs mais profundos e, às vezes, hospedagem de modelo local, tudo isso é limitado sob a infraestrutura de "caixa preta" da Cloudflare.

Como a TrueFoundry Aborda a Precificação do AI Gateway de Forma Diferente

Se você precisa dos benefícios de um AI Gateway, mas não pode comprometer a segurança, a observabilidade ou o controle da infraestrutura, a TrueFoundry oferece uma abordagem fundamentalmente diferente.

A TrueFoundry implanta o AI Gateway diretamente dentro da sua própria conta de nuvem (AWS, GCP, Azure) ou servidor. O plano de controle (que gerencia a configuração e as definições) é operado pela TrueFoundry, mas o plano de dados, onde os prompts e as respostas reais são processados, permanece inteiramente na sua VPC.

Seus dados nunca saem da sua infraestrutura, a menos que você escolha explicitamente movê-los. Na prática, isso significa:

  1. Você hospeda o serviço de gateway na sua infraestrutura, direcionando todo o tráfego LLM através da sua própria rede.
  2. Logs, requisições e respostas nunca saem da sua conta na nuvem, a menos que você configure exportações externas.
  3. A observabilidade é nativamente integrada – os logs vão para o seu bucket S3, banco de dados ou ferramentas de análise internas, preservando a soberania total dos dados.
  4. Você controla backups, alocação de recursos, políticas de criptografia e escalabilidade usando sua própria infraestrutura e protocolos de segurança.

Isso elimina o comprometimento de "caixa preta" visto em plataformas SaaS-first como o Cloudflare. Você obtém desempenho transparente, visibilidade de custos e propriedade total com o TrueFoundry AI Gateway.

Preços do TrueFoundry

Se auto-hospedado sob um plano Enterprise, o único custo marginal é a infraestrutura (tipicamente ~$600–$1.000/mês, dependendo da escala). Mesmo na versão SaaS, o TrueFoundry não cobra taxas de hospedagem além do seu armazenamento selecionado ou uso da nuvem.

Isso resulta em uma estrutura de custos altamente previsível — as equipes podem prever o crescimento, fazer upgrade de níveis gradualmente e manter o controle em nível de infraestrutura durante todo o processo.

Com o TrueFoundry, você pode:

  • Garantir um orçamento granular: Atribuir limites de uso por equipe, por exemplo, "Engenharia recebe $500, Marketing recebe $200" e monitorar o uso em tempo real.
  • Implementar roteamento aberto: Conectar-se a APIs comerciais (OpenAI, Anthropic) ou rotear o tráfego para seus próprios modelos ajustados em execução em instâncias EC2, GKE ou spot.
  • Habilitar isolamento de nível empresarial: Manter total conformidade com IAM, redes privadas e mandatos de localidade de dados.

Cloudflare AI Gateway vs TrueFoundry: Comparação Detalhada

Empresas que avaliam gateways de IA frequentemente comparam um serviço gerenciado como o Cloudflare com uma plataforma auto-hospedada como o TrueFoundry. Abaixo está uma comparação dos principais fatores:

AI Gateway Comparison
Aspect Cloudflare AI Gateway TrueFoundry AI Gateway
Pricing Model Free core features; usage via Cloudflare Workers plan ($5/month + usage fees). Unpredictable per-request costs depending on traffic and logs. No fixed token pricing. Tiered subscription based on usage. Known allowances (e.g. X requests / Y users) per plan, with clear overage pricing. Option for flat monthly licensing at Enterprise scale.
Data Control & Privacy Hosted by Cloudflare; logs and analytics are stored in Cloudflare’s infrastructure by default. Customers must trust Cloudflare’s environment. Can be deployed in the customer’s own cloud/VPC (even air-gapped). Logs and telemetry stay on the organization’s storage (e.g., S3), preserving data sovereignty.
Cost Predictability Pay-as-you-go with variable costs. Usage surges (tokens, logs, Workers) directly increase bills. Fixed tiers provide budgeting clarity. Customers can predict costs based on expected request volume. Centralized cost governance avoids surprise spikes.
Flexibility & Deployment SaaS only – tied to Cloudflare’s network. Limited to Cloudflare’s available features. Highly flexible – supports on-prem, multi-cloud, and hybrid. Can plug in any model or data source with full control over routing and caching.
Observability & Governance Provides cross-provider analytics and limits via dashboard. Logs and metrics collection are controlled by Cloudflare. Enterprise-grade observability with detailed logs, metrics, and auditing. Policies and guardrails enforced at the gateway control plane.

Pronto para Construir IA Sem Surpresas de Preço?

Selecionar um gateway de IA é uma decisão de infraestrutura de longo prazo, não apenas uma questão de custo inicial. Cloudflare AI Gateway funciona bem para cargas de trabalho de IA leves, focadas na borda e experimentação inicial.

Mas à medida que os sistemas avançam para a escala de produção, as prioridades mudam para controle de custos, observabilidade, conformidade e flexibilidade.

Plataformas como TrueFoundry são construídas para equipes que escalam IA em produção, onde a propriedade da infraestrutura, a privacidade dos dados e o orçamento baseado no uso são de extrema importância.

Uma startup em crescimento migrou do Cloudflare para o TrueFoundry depois que os custos imprevisíveis de registro começaram a exceder os orçamentos de computação. Ao mudar para um gateway auto-hospedado em sua VPC da AWS, eles alcançaram 35% de redução de custos, registro unificado para S3 e roteamento de tráfego para uma combinação de modelos OpenAI e Mistral privados — tudo com controles orçamentários claros por equipe.

Você também pode obter resultados semelhantes para sua organização. Agende uma demonstração para ver como o TrueFoundry pode trazer previsibilidade e controle de custos de IA para sua equipe.

Perguntas Frequentes

O Cloudflare AI Gateway é gratuito?

Sim, o Cloudflare oferece acesso gratuito aos recursos do AI Gateway em seus níveis padrão e Workers Paid. No entanto, limites de uso, políticas de retenção de logs e computação subjacente (por exemplo, tempo de CPU dos Workers) podem introduzir custos ocultos à medida que a escala aumenta.

Quanto custará o Cloudflare AI?

O próprio Cloudflare AI Gateway não tem taxa por solicitação. Os custos surgem com base em:

  1. Volume e retenção de logs (por exemplo, 100.000 logs no nível gratuito, 1M no Workers Paid).
  2. Uso de Workers para processamento e roteamento de solicitações.
  3. Nível do plano Cloudflare (por exemplo, Standard vs Enterprise).
    Os preços podem se tornar imprevisíveis em alto volume sem planos personalizados ou gerenciamento de logs externo.

Como o TrueFoundry é mais econômico que o Cloudflare AI?

O TrueFoundry funciona inteiramente na sua própria nuvem (AWS, GCP, Azure), eliminando custos de transferência de dados e margens de SaaS. Você paga apenas pelo processamento e armazenamento que aloca — com total flexibilidade de roteamento, logs transparentes e sem dependência de fornecedor. As equipes também podem rotear para modelos privados ou usar instâncias spot para reduzir o custo em 60-70% em comparação com APIs gerenciadas.

The fastest way to build, govern and scale your AI

Sign Up
Table of Contents

Govern, Deploy and Trace AI in Your Own Infrastructure

Book a 30-min with our AI expert

Book a Demo

The fastest way to build, govern and scale your AI

Book Demo

Discover More

No items found.
May 21, 2026
|
5 min read

Adicionando OAuth2 a Jupyter Notebooks no Kubernetes

Engenharia e Produto
May 21, 2026
|
5 min read

Uma equipe de 2 pessoas atendendo um modelo para 1,5 milhão de pessoas com TrueFoundry

Engenharia e Produto
May 21, 2026
|
5 min read

Acelere o Processamento de Dados em 30–40x com NVIDIA RAPIDS no TrueFoundry

GPU
Engenharia e Produto
May 21, 2026
|
5 min read

Uma Parceria para IA Responsável: Truefoundry e Enkrypt AI

No items found.
No items found.

Recent Blogs

Black left pointing arrow symbol on white background, directional indicator.
Black left pointing arrow symbol on white background, directional indicator.
Take a quick product tour
Start Product Tour
Product Tour