Compreendendo os Preços do Portkey AI Gateway para 2026: Guia Completo e Comparação

Built for Speed: ~10ms Latency, Even Under Load
Blazingly fast way to build, track and deploy your models!
- Handles 350+ RPS on just 1 vCPU — no tuning needed
- Production-ready with full enterprise support
Escolher o gateway de IA certo para aplicações de IA em produção exige a compreensão não apenas dos recursos, mas também de como os preços escalam com o uso. O Portkey AI surgiu como uma escolha popular para startups e equipes de plataforma, mas seu modelo de precificação único, baseado em "logs registrados", pode ser confuso.
Este guia abrangente detalha os preços do Portkey para 2026, explica pelo que você está realmente pagando e ajuda a determinar se o Portkey é a escolha certa ou se alternativas como TrueFoundry, LiteLLM ou Kong podem atender melhor às suas necessidades.

O que é o Gateway de IA Portkey?
O gateway de IA Portkey é uma plataforma de infraestrutura de IA pronta para produção que oferece uma interface unificada para acessar mais de 250 modelos diferentes de provedores como OpenAI, Anthropic, Google, AWS Bedrock, Azure e outros. Ele serve como um painel de controle para gerenciar, rotear e monitorar solicitações de LLM em ambientes de produção.
O gateway Portkey se posiciona como o "Painel de Controle para IA em Produção" com recursos projetados para equipes que estão passando da fase de prova de conceito para a produção. A plataforma oferece uma interface de API unificada com um único endpoint para acessar mais de 250 modelos em vários provedores com formatos de solicitação e resposta padronizados.
Sua suíte de observabilidade fornece logs detalhados, rastreamento, análises e acompanhamento de custos para cada solicitação de LLM. Os recursos de confiabilidade incluem fallbacks automáticos, balanceamento de carga, roteamento condicional, lógica de retentativas e disjuntores para evitar o tempo de inatividade do modelo. A otimização do desempenho em produção é alcançada por meio de cache semântico e cache simples para reduzir a latência e os custos.
A plataforma possui certificações SOC2 Tipo 2, ISO 27001, GDPR e HIPAA no nível Enterprise e afirma um tempo de integração de 2 minutos com monitoramento imediato de todas as chamadas de LLM. O Portkey AI visa startups que estão escalando para produção e empresas de médio porte que precisam de infraestrutura de IA gerenciada sem a complexidade de hospedar soluções de código aberto por conta própria.
Como o Portkey Aborda a Precificação Geral?
Ao contrário dos gateways de API tradicionais que cobram com base em solicitações ou recursos de computação, a precificação do Portkey usa um modelo de precificação baseado no uso, centrado em "logs registrados", que é uma métrica única para soluções de gateway de IA focadas em observabilidade.
A precificação do Portkey reflete seu posicionamento como uma plataforma com foco em observabilidade. Embora o próprio gateway direcione as solicitações para provedores de LLM que você paga separadamente, o Portkey cobra principalmente por três componentes:
- Logs Registrados: O número de solicitações de LLM rastreadas em seu sistema de observabilidade.
- Duração da Retenção: Por quanto tempo logs e metadados são armazenados.
- Recursos Avançados: Recursos premium como cache semântico, roteamento avançado e governança.
Este modelo funciona bem para equipes que desejam monitoramento abrangente, mas pode se tornar caro em escala, especialmente se você precisar de retenção de logs de longo prazo ou gerar altos volumes de solicitações.
Ao pagar o custo do Portkey, você está pagando por infraestrutura de implantação de borda gerenciada com SLA de 99,99% de tempo de atividade e sobrecarga de latência de 20-40ms, a plataforma de observabilidade para armazenamento, indexação e consulta de logs de solicitação, rastreamentos e análises, acesso a recursos como estratégias de roteamento avançadas, cache semântico, gerenciamento de prompts e mecanismos de segurança, suporte que varia de nível comunitário a produção ou empresarial, dependendo do nível, e infraestrutura de conformidade, incluindo certificações de segurança como SOC2 e HIPAA.
Nota Importante: A precificação do Portkey é separada dos custos do seu provedor de LLM, o que significa que você ainda paga OpenAI, Anthropic e outros provedores diretamente pelo uso do modelo, enquanto o Portkey atua como a camada de middleware por cima.
A Métrica de Precificação Exclusiva: "Logs Registrados"
O aspecto mais distintivo da precificação do Portkey é a cobrança baseada em logs registrados, em vez de requisições de API brutas. Compreender essa métrica é crucial para estimar seus custos. Um log registrado representa uma única requisição de API de LLM que o Portkey captura, armazena e disponibiliza no seu painel de observabilidade.
Cada log inclui metadados da requisição (timestamp, usuário, aplicação), conteúdo do prompt e da resposta (a menos que explicitamente excluído por privacidade), informações do provedor e do modelo, métricas de latência e dados de desempenho, cálculos de custo, metadados e tags personalizados, e violações de guardrail ou erros.
Logs Registrados vs. Requisições Totais
A principal distinção entre logs registrados e requisições totais é que o gateway do Portkey continua roteando requisições mesmo depois de você exceder seu limite de logs. Seu gateway não para de funcionar; você simplesmente para de registrar novos logs para observabilidade. Isso é tanto um benefício quanto uma limitação. O benefício é que o código da sua aplicação em produção nunca para devido aos limites de logs. A limitação é que você perde visibilidade das requisições além do seu limite de logs, o que anula o propósito de uma plataforma de observabilidade.
Como os Limites de Logs Escalam Entre os Níveis
Exemplo de Cálculo de Custo
Por exemplo, se sua startup gera 500.000 requisições de LLM por mês, o plano Dev captura apenas as primeiras 10 mil requisições por $0, mas 98% do tráfego fica invisível. O plano Pro inclui 100 mil logs base no preço base, requer 400 mil logs adicionais e custa o plano base mais (4 × $9) = base mais $36 por mês pela cobertura de logs.
Com 500 mil requisições por mês, você provavelmente está gerando uma receita significativa e precisa de visibilidade total, então o nível Pro se torna essencial, mas a precificação do Portkey escala linearmente com o tráfego.
O Que Acontece Quando Você Atinge os Limites de Logs
Compreender como o comportamento da precificação do Portkey muda nos limites de logs é fundamental para o planejamento da produção.
Comportamento Técnico
- O Gateway Continua Operando: Suas requisições de LLM continuam sendo roteadas e processadas normalmente.
- O Registro Para: Novas requisições além do limite não são registradas no painel de observabilidade.
- Sem Alertas ou Erros: Os usuários não experimentam nenhuma degradação funcional ou saídas inesperadas.
- Pontos Cegos Surgem: Perde-se visibilidade sobre desempenho, custos, erros e padrões de uso para solicitações não registradas.
Impacto nos Negócios por Nível
Para equipes pequenas no nível Dev, 10 mil logs mensais equivalem a aproximadamente 330 solicitações por dia. Se você exceder isso regularmente, fica cego para a maior parte do tráfego de produção, tornando uma atualização para o plano Pro necessária para qualquer carga de trabalho de produção real.
Para startups em crescimento no nível Pro, você deve monitorar o uso de perto para evitar atingir o limite base de 100 mil. Cada 100 mil logs adicionais custam US$ 9, o que é gerenciável, mas acumula rapidamente. Com mais de 1 milhão de solicitações por mês, considere o nível Enterprise para uma melhor economia unitária.
Para empresas, limites de log personalizados são negociados com base no volume, geralmente mais de 10 milhões de logs, com descontos por volume e períodos de retenção configuráveis, cruciais para conformidade.

Visão Geral dos Planos de Preço Portkey
Vamos dar uma olhada nos diferentes planos de preço Portkey:
Plano Dev (Gratuito para Sempre)
- Preço: $0/mês | Logs Registrados: 10.000/mês (retenção de 30 dias)
- Ideal Para: Prototipagem, hackathons, avaliação de POC
O plano Dev inclui acesso unificado à API para mais de 250 modelos, observabilidade básica (logs, rastreamentos, feedback, metadados), fallbacks automáticos, balanceamento de carga, cache simples (TTL de 1 dia), até 3 modelos de prompt e suporte da comunidade. No entanto, com apenas 10 mil solicitações/mês visíveis (aproximadamente 330/dia), sem cache semântico, sem alertas ou painéis avançados e sem controle de acesso de usuário, é insuficiente para aplicações em produção.
Plano Pro (Pronto para Produção)
- Preço: Preço personalizado (entre em contato com vendas) | Base: 100 mil logs + $9 por cada 100 mil adicionais (até 3 milhões no total)
- Ideal para: Startups que implementam aplicações LLM em produção, equipas com < 3 milhões de pedidos mensais
O plano Pro adiciona observabilidade detalhada (alertas, painel FinOps, análises), cache semântica com TTL ilimitado, modelos de prompt ilimitados com controlo de versão, controlo de acesso de utilizadores e suporte de produção com SLA padrão. As principais limitações incluem um limite de 3 milhões de logs mensais, retenção de apenas 30 dias, sem implementação VPC e sem SSO ou RBAC avançado.
Exemplos de Custo: 500 mil pedidos = Base + $36/mês | 1 milhão de pedidos = Base + $81/mês | 2 milhões de pedidos = Base + $171/mês
Plano Empresarial (Preços Personalizados)
- Preço: Personalizado (contactar vendas) | Logs: Mais de 10 milhões com descontos por volume (retenção personalizada de mais de 90 dias)
- Ideal para: Grandes empresas, indústrias regulamentadas, produção de alto volume
O plano Empresarial inclui tudo o que está no Pro, mais governação avançada (RBAC, SSO, orçamentos granulares), infraestrutura empresarial (cloud privada, alojamento VPC, exportação de dados, isolamento de dados), certificações de conformidade (SOC2, ISO 27001, GDPR, HIPAA, BAAs personalizados), suporte prioritário 24/7 com tempos de resposta garantidos e três opções de implementação (SaaS gerido, híbrido ou totalmente isolado).
Preços típicos da Portkey variam de $2.000 a $10.000+/mês, dependendo do volume, retenção, modelo de implementação e nível de suporte.
Preços da Portkey vs. Concorrentes (2026)
Compreender como os preços da Portkey se comparam com as alternativas ajuda a determinar a melhor opção para o seu caso de uso.
Tabela Completa de Comparação de Preços
Matriz de Comparação de Recursos
Se você está avaliando os principais provedores de gateway de IA, veja como eles se comparam:
- TrueFoundry: Melhor para empresas que precisam de governança no nível Pro (US$ 499), suporte completo de gateway MCP para fluxos de trabalho de IA agentiva e registro ilimitado em todos os níveis. Implantação VPC disponível no nível Enterprise. Ideal para equipes de médio a grande porte que desenvolvem agentes de IA em produção.
- Portkey: Melhor para startups com menos de 1 milhão de requisições por mês que precisam de serviços gerenciados para começar rapidamente. Um excelente painel de observabilidade e integração em 2 minutos o tornam ideal para equipes sem experiência em DevOps que priorizam o tempo de lançamento no mercado.
- LiteLLM: Melhor para auto-hospedagem e implantações de LLM de alto volume (mais de 5 milhões de requisições/mês) com equipes de DevOps. É de código aberto com requisições ilimitadas, mas carece de SLAs empresariais robustos e exige experiência em gerenciamento de infraestrutura.
- Kong: Cobra US$ 100 por modelo por mês (máximo de 5 no nível Plus), o que funciona bem para equipes padronizadas em 1-3 modelos, mas pode se tornar caro para estratégias multi-modelo. Evoluiu de gateway de API para gateway de IA. Melhor para usuários existentes do Kong que precisam de integração de gerenciamento de API juntamente com recursos de gateway de IA.
Leia Também: Portkey vs LiteLLM

Quando o Preço do Gateway de IA Portkey Faz Sentido
A precificação do Portkey o torna a escolha certa para perfis organizacionais específicos e casos de uso de GenAI.
Startups em Estágio Inicial (Pré-Seed a Série A)
Startups em estágio inicial com equipes de 3 a 5 pessoas que desenvolvem produtos baseados em IA se beneficiam porque os 10 mil logs gratuitos por mês os ajudam na prototipagem inicial, a integração em 2 minutos significa menos tempo de engenharia em infraestrutura, o nível Pro escala da versão beta para a produção inicial, e o serviço gerenciado elimina as dores de cabeça com a infraestrutura. Perfis de custo de US$ 0 a US$ 500 por mês no primeiro ano são gerenciáveis para startups apoiadas por capital de risco.
Equipes Sem Experiência em DevOps
Equipes sem experiência em DevOps se beneficiam quando as equipes de engenharia são fortes no processo de desenvolvimento, mas carecem de experiência em Kubernetes, Docker ou infraestrutura de nuvem, tornando a auto-hospedagem do LiteLLM um processo que exige contratação ou treinamento.
O gateway de IA Portkey oferece infraestrutura totalmente gerenciada com SLA de 99,99% de tempo de atividade, sem necessidade de gerenciar servidores, escalonamento, monitoramento ou atualizações. A segurança e a conformidade são tratadas pelo Portkey, e uma equipe de suporte está disponível quando surgem problemas.
Hospedar o LiteLLM por conta própria exige experiência em DevOps avaliada em US$ 120 mil a US$ 180 mil por ano, tornando o custo do Portkey, na camada Pro, de US$ 3 mil a US$ 6 mil por ano, dramaticamente mais barato se você não possui essa capacidade.
Volumes Moderados de Requisições (100 mil - 2 milhões/mês)
Equipes com volumes moderados de requisições, entre 100 mil e 2 milhões por mês, que já passaram da fase de protótipo, mas ainda não atingiram uma escala massiva, consideram o preço do Portkey competitivo. A US$ 9 por 100 mil logs, isso é razoável para o valor de observabilidade e mais fácil de orçar do que custos de infraestrutura imprevisíveis.
Com 500 mil requisições por mês, os US$ 36 adicionais em custos de log são gerenciáveis, e com 1 milhão de requisições por mês, os US$ 81 adicionais em custos de log ainda são razoáveis. Acima de 3 milhões de requisições por mês, concorrentes com logging ilimitado como TrueFoundry ou opções auto-hospedadas como LiteLLM tornam-se mais econômicos.
Por que equipes de alta escala buscam além do Portkey
À medida que as aplicações de IA escalam de milhares para milhões de requisições mensais, os modelos de precificação e as escolhas arquitetônicas do Portkey criam atrito para equipes de alto crescimento.
Limites de Log Criam Pontos Cegos Operacionais
Limites de log criam pontos cegos operacionais porque, uma vez que você excede seu limite de log, novas requisições não são registradas e sua plataforma de observabilidade para de observar. Se seu aplicativo gera 5 milhões de requisições por mês e o Portkey AI Pro tem um limite máximo de 3 milhões de logs, 40% do seu tráfego fica invisível nos painéis.
Você não consegue depurar problemas que afetam 2 milhões de requisições por mês, e a análise de custos torna-se não confiável porque 40% dos dados de gastos estão faltando. A solução alternativa Enterprise exige o pagamento de US$ 5 mil a US$ 10 mil por mês pela camada Enterprise com limites de log de mais de 10 milhões, onde os concorrentes oferecem logging ilimitado a preços mais baixos.
Retenção de 30 Dias Insuficiente para Conformidade
A retenção de 30 dias é insuficiente para conformidade em muitas indústrias regulamentadas. A área da saúde, sob a HIPAA, exige mais de 6 anos para registros médicos, serviços financeiros, sob a SOX, exigem mais de 7 anos para logs de transações, e contratos governamentais exigem um mínimo de 3 anos.
Os recursos de gateway do Portkey na camada Pro oferecem apenas 30 dias, enquanto a camada Enterprise oferece retenção personalizada disponível a um preço premium. O TrueFoundry oferece retenção personalizada disponível na camada Pro por US$ 499, e o LiteLLM oferece retenção ilimitada, já que você controla o armazenamento.
Falta de Gateway MCP para IA Agente
A falta de um gateway MCP do Portkey para IA agente é uma lacuna significativa. Até 2026, os fluxos de trabalho de IA agente estão se popularizando, e o Protocolo de Contexto de Modelo (MCP) permite que agentes de IA usem ferramentas, acessem bancos de dados e interajam com sistemas externos com segurança.
O Portkey tem suporte limitado ao MCP e ainda não priorizou os recursos de gateway MCP, o que significa que você não pode construir fluxos de trabalho de IA agente sofisticados, como agentes de IA consultando bancos de dados internos com permissões de nível de usuário, uso de ferramentas com injeção de token OAuth, ou servidores MCP virtuais abstraindo cadeias de ferramentas complexas.
O TrueFoundry oferece um gateway MCP completo com suporte a servidor virtual, injeção de identidade OAuth 2.0 onde os agentes atuam em nome de usuários específicos, economia de 99% de tokens de inferência através do uso ativo de ferramentas versus preenchimento de contexto, e aproximadamente 10ms de latência para chamadas de ferramentas.
Governança Limitada Até a Camada Enterprise
A governança limitada até a camada Enterprise cria desafios porque as operações modernas de IA exigem Controle de Acesso Baseado em Função (RBAC) em modelos, controles de orçamento por equipe, usuário ou aplicação, limitação de taxa por usuário ou departamento, e guardrails personalizados e filtragem de conteúdo.
O gateway de IA empresarial do Portkey restringe esses recursos à camada Enterprise, o que significa que os clientes da camada Pro carecem de governança básica, exigindo um gasto de aproximadamente US$ 2 mil a US$ 5 mil por mês para recursos de governança. O TrueFoundry oferece RBAC disponível na camada Pro por US$ 499 por mês, controles de orçamento e limitação de taxa na camada Pro, e governança acessível a equipes menores mais cedo em sua jornada de crescimento.
Como o TrueFoundry é uma Alternativa Poderosa?
Para equipes que encontram as limitações do Portkey, especialmente limites de log, suporte a MCP e recursos de governança, a TrueFoundry oferece uma alternativa atraente com escolhas arquitetônicas e de precificação do Portkey fundamentalmente diferentes.
Diferenças Filosóficas Essenciais

Recursos de Governança no Nível Pro ($499/mês)
A TrueFoundry oferece recursos de governança no nível Pro por $499 por mês, que incluem Controle de Acesso Baseado em Função (RBAC) em modelos, controles de orçamento por usuário, equipe ou aplicativo, políticas de limitação de taxa flexíveis por usuário, modelo ou aplicativo, modelos virtuais para abstração, registro de metadados personalizado e controle de acesso granular.
Uma startup de 20 pessoas pode implementar governança de nível de produção por $499 por mês, em vez de mais de $5.000 por mês com o gateway de IA empresarial Portkey, democratizando a governança de IA para equipes menores.
Suporte Completo a Gateway MCP
O suporte completo a gateway MCP da TrueFoundry representa sua diferenciação mais significativa para casos de uso de IA agêntica em 2026.
O Que o Gateway MCP da TrueFoundry Permite:
- Abstração de Servidor MCP Virtual: Crie servidores lógicos como "Servidor de Agente Financeiro" expondo múltiplas ferramentas, direcione chamadas de ferramentas através de um único gateway gerenciado e agregue ferramentas como consultas a bancos de dados, chamadas de API e acesso a arquivos em interfaces de agente coerentes.
- Injeção de Identidade OAuth 2.0: Agentes atuam em nome de usuários específicos, aplicando permissões de nível de usuário em cada chamada de ferramenta. Isso elimina credenciais de superusuário compartilhadas e garante que os agentes atuem como usuários específicos (como Alice) e só possam acessar os dados de Alice.
- Implantação Híbrida: Ferramentas de dados sensíveis permanecem on-premise ou em VPC enquanto o raciocínio do LLM ocorre na nuvem, com o gateway orquestrando entre os limites.
- Eficiência de Custo: 99% de economia em tokens de inferência em comparação com o preenchimento de contexto, reduz execuções típicas de agentes de $0.50 para $0.005 e usa o uso ativo de ferramentas em vez da leitura passiva de contexto.
- Desempenho: Aproximadamente 10ms de sobrecarga de latência, processa mais de 350 requisições por segundo em 1 vCPU e suporta escalabilidade horizontal.
Implantação em VPC e On-Premise para Empresas
A TrueFoundry oferece implantação em VPC e on-premise de forma muito integrada. Indústrias regulamentadas precisam de dados em sua VPC desde o primeiro dia e a TrueFoundry inclui opção de VPC e airgapped para empresas com SLAs rigorosos.

Não deixe que a precificação limite sua visibilidade
Portkey é uma excelente escolha para equipes que buscam começar rapidamente, mas a precificação baseada em observabilidade pode rapidamente se tornar um gargalo à medida que o volume de suas requisições aumenta. Quando você é cobrado por log, é frequentemente forçado a fazer uma escolha difícil: pagar um valor premium por visibilidade total ou arriscar-se a operar às cegas durante incidentes críticos de produção para se manter dentro do orçamento.
A TrueFoundry oferece um caminho diferente. Ao desacoplar o gateway da computação subjacente e oferecer observabilidade ilimitada por uma taxa mensal fixa, garantimos que sua arquitetura incentive a visibilidade em vez de penalizá-la. Você obtém RBAC de nível empresarial, controles de orçamento e propriedade total dos dados sem o "imposto sobre o sucesso" da cobrança por log.
Pronto para escalar suas aplicações de IA sem os custos ocultos? Agende uma demonstração com a TrueFoundry hoje para ver como entregamos observabilidade e governança ilimitadas por uma taxa fixa previsível.
Perguntas Frequentes
A Portkey cobra por requisições de API além do registro de logs?
Não, a Portkey cobra apenas pelos logs registrados com base no seu nível e acesso a recursos para os níveis Pro versus Enterprise. Você paga seus provedores de LLM como OpenAI e Anthropic separadamente pelo uso real do modelo, enquanto a Portkey é a camada de middleware para roteamento e observabilidade.
O que acontece com minhas requisições se eu exceder o limite de logs da Portkey?
Suas requisições continuam sendo roteadas normalmente para os provedores de LLM, e o gateway não para de funcionar. O que para é o registro de novos logs no painel de observabilidade, o que significa que você perde a visibilidade do conteúdo de requisições e respostas, o rastreamento de custos para essas requisições, métricas de desempenho e latência, e o monitoramento e depuração de erros.
Posso auto-hospedar o Portkey AI Gateway?
Sim, mas apenas com o plano Enterprise através de uma opção de implantação air-gapped. As alternativas incluem LiteLLM, que é totalmente de código aberto e pode ser auto-hospedado em qualquer infraestrutura gratuitamente, e TrueFoundry, que oferece implantação VPC e on-premises disponível no nível Pro por US$ 499 por mês.
A Portkey suporta MCP (Model Context Protocol) para IA agentiva?
A partir de 2026, a Portkey tem suporte limitado a MCP e ainda não priorizou os recursos de gateway MCP da Portkey. Para suporte completo a MCP, a TrueFoundry oferece um gateway MCP completo com servidores virtuais, injeção OAuth e implantação híbrida, e a Kong oferece um plugin de proxy MCP disponível no nível Enterprise.
Como funciona a retenção de logs de 30 dias da Portkey?
Os logs do nível Pro são retidos por 30 dias e depois excluídos automaticamente, enquanto o nível Enterprise oferece períodos de retenção personalizados de mais de 90 dias, 1 ano ou mais, que podem ser negociados. Muitas indústrias exigem retenção mais longa, incluindo saúde com mais de 6 anos, serviços financeiros sob SOX exigem mais de 7 anos para logs de transações, e contratos governamentais exigem um mínimo de 3 anos.
A TrueFoundry se integra ao meu fluxo de trabalho existente?
Sim, a TrueFoundry se integra com ferramentas populares como GitHub para controle de versão, gerenciamento de PRs (Pull Requests) e manutenção de documentação para seus modelos. Você também pode configurar tempos limite para tarefas de geração de áudio ou chat de longa duração, e usar SDKs Python para integrações personalizadas.
A TrueFoundry oferece recursos avançados como caching e testes?
A TrueFoundry oferece a melhor solução de cache com capacidades semânticas para reduzir custos. Ela também suporta estruturas de teste robustas para garantir a qualidade do modelo antes da implantação, fornecendo recursos detalhados de observabilidade e logs detalhados que oferecem insights claros sobre o desempenho da sua IA. Isso proporciona valor imediato e faz uma enorme diferença para um engenheiro de ML sênior que gerencia sistemas complexos. Qualquer usuário acharia o nível de visibilidade inestimável para prevenir saídas inesperadas em produção.
TrueFoundry AI Gateway delivers ~3–4 ms latency, handles 350+ RPS on 1 vCPU, scales horizontally with ease, and is production-ready, while LiteLLM suffers from high latency, struggles beyond moderate RPS, lacks built-in scaling, and is best for light or prototype workloads.
The fastest way to build, govern and scale your AI













.webp)






.webp)

.webp)
.webp)





.png)



