What Is Portkey AI Gateway?

Portkey AI gateway is a production-ready AI infrastructure platform that provides a unified interface to access over 250 different models from providers like OpenAI, Anthropic, Google, AWS Bedrock, Azure, and more. It serves as a control panel for managing, routing, and monitoring LLM requests in production environments.

How Portkey Approaches Pricing Overall?

Unlike traditional API gateways that charge based on requests or compute resources, Portkey pricing uses a usage-based pricing model centered on "recorded logs," which is a metric unique to observability-focused AI gateway solutions.

When Portkey AI Gateway Pricing Makes Sense?

Portkey pricing makes it the right choice for specific organizational profiles and GenAI use cases.

How TrueFoundry is a Powerful Alternative?

For teams hitting Portkey's limitations, especially log limits, MCP support, and governance features, TrueFoundry offers a compelling alternative with fundamentally different architectural and Portkey pricing choices.

Does Portkey charge for API requests in addition to log recording?

No, Portkey only charges for recorded logs based on your tier and feature access for Pro versus Enterprise tiers. You pay your LLM providers like OpenAI and Anthropic separately for actual model usage, while Portkey is the middleware layer for routing and observability.

What happens to my requests if I exceed Portkey's log limit?

Your requests continue to be routed normally to LLM providers, and the gateway doesn't stop working. What stops is recording new logs in the observability dashboard, meaning you lose visibility into request and response content, cost tracking for those requests, performance metrics and latency, and error monitoring and debugging.

Can I self-host Portkey AI Gateway?

Yes, but only with the Enterprise plan via an air-gapped deployment option. Alternatives include LiteLLM, which is fully open-source and can be self-hosted on any infrastructure for free, and TrueFoundry, which offers VPC and on-premises deployment available at Pro tier for $499 per month.

Does Portkey support MCP (Model Context Protocol) for agentic AI?

As of 2026, Portkey has limited MCP support and hasn't prioritized Portkey MCP gateway features yet. For full MCP support, TrueFoundry offers a full-featured MCP gateway with virtual servers, OAuth injection, and hybrid deployment, and Kong offers an MCP proxy plugin available at the enterprise tier.

How does Portkey's 30-day log retention work?

Pro tier logs are retained for 30 days then automatically deleted, while the Enterprise tier offers custom retention periods of 90+ days, 1 year, or more that can be negotiated. Many industries require longer retention including healthcare at 6+ years, financial services under SOX require 7+ years for transaction logs, and government contracts require 3+ years minimum.

Does TrueFoundry integrate with my existing workflow?

Yes, TrueFoundry integrates with popular tools like GitHub for version control, managing PRs (Pull Requests), and maintaining documentation for your models. You can also configure timeouts for long-running audio or chat generation tasks, and use Python SDKs for custom integrations.

Does TrueFoundry offer advanced features like caching and testing?

TrueFoundry offers the best caching solution with semantic capabilities to reduce costs. It also supports robust testing frameworks to ensure model quality before deployment, providing detailed observability features and detailed logs that give clear insights into your AI performance. This provides immediate value and makes a huge difference for a senior ML engineer managing complex systems. Any user would find the level of visibility invaluable for preventing unexpected outputs in production.

Compreendendo os Preços do Gateway de IA Portkey Para 2026

Built for Speed: ~10ms Latency, Even Under Load

Blazingly fast way to build, track and deploy your models!

Handles 350+ RPS on just 1 vCPU — no tuning needed
Production-ready with full enterprise support

Get Started with Truefoundry Now Talk to the Expert

Escolher o gateway de IA certo para aplicações de IA em produção exige a compreensão não apenas dos recursos, mas também de como os preços escalam com o uso. O Portkey AI surgiu como uma escolha popular para startups e equipes de plataforma, mas seu modelo de precificação único, baseado em "logs registrados", pode ser confuso.

Este guia abrangente detalha os preços do Portkey para 2026, explica pelo que você está realmente pagando e ajuda a determinar se o Portkey é a escolha certa ou se alternativas como TrueFoundry, LiteLLM ou Kong podem atender melhor às suas necessidades.

TrueFoundry offers a predictable pricing model

O que é o Gateway de IA Portkey?

O gateway de IA Portkey é uma plataforma de infraestrutura de IA pronta para produção que oferece uma interface unificada para acessar mais de 250 modelos diferentes de provedores como OpenAI, Anthropic, Google, AWS Bedrock, Azure e outros. Ele serve como um painel de controle para gerenciar, rotear e monitorar solicitações de LLM em ambientes de produção.

O gateway Portkey se posiciona como o "Painel de Controle para IA em Produção" com recursos projetados para equipes que estão passando da fase de prova de conceito para a produção. A plataforma oferece uma interface de API unificada com um único endpoint para acessar mais de 250 modelos em vários provedores com formatos de solicitação e resposta padronizados.

Sua suíte de observabilidade fornece logs detalhados, rastreamento, análises e acompanhamento de custos para cada solicitação de LLM. Os recursos de confiabilidade incluem fallbacks automáticos, balanceamento de carga, roteamento condicional, lógica de retentativas e disjuntores para evitar o tempo de inatividade do modelo. A otimização do desempenho em produção é alcançada por meio de cache semântico e cache simples para reduzir a latência e os custos.

A plataforma possui certificações SOC2 Tipo 2, ISO 27001, GDPR e HIPAA no nível Enterprise e afirma um tempo de integração de 2 minutos com monitoramento imediato de todas as chamadas de LLM. O Portkey AI visa startups que estão escalando para produção e empresas de médio porte que precisam de infraestrutura de IA gerenciada sem a complexidade de hospedar soluções de código aberto por conta própria.

Como o Portkey Aborda a Precificação Geral?

Ao contrário dos gateways de API tradicionais que cobram com base em solicitações ou recursos de computação, a precificação do Portkey usa um modelo de precificação baseado no uso, centrado em "logs registrados", que é uma métrica única para soluções de gateway de IA focadas em observabilidade.

A precificação do Portkey reflete seu posicionamento como uma plataforma com foco em observabilidade. Embora o próprio gateway direcione as solicitações para provedores de LLM que você paga separadamente, o Portkey cobra principalmente por três componentes:

Logs Registrados: O número de solicitações de LLM rastreadas em seu sistema de observabilidade.
Duração da Retenção: Por quanto tempo logs e metadados são armazenados.
Recursos Avançados: Recursos premium como cache semântico, roteamento avançado e governança.

Este modelo funciona bem para equipes que desejam monitoramento abrangente, mas pode se tornar caro em escala, especialmente se você precisar de retenção de logs de longo prazo ou gerar altos volumes de solicitações.

Ao pagar o custo do Portkey, você está pagando por infraestrutura de implantação de borda gerenciada com SLA de 99,99% de tempo de atividade e sobrecarga de latência de 20-40ms, a plataforma de observabilidade para armazenamento, indexação e consulta de logs de solicitação, rastreamentos e análises, acesso a recursos como estratégias de roteamento avançadas, cache semântico, gerenciamento de prompts e mecanismos de segurança, suporte que varia de nível comunitário a produção ou empresarial, dependendo do nível, e infraestrutura de conformidade, incluindo certificações de segurança como SOC2 e HIPAA.

Nota Importante: A precificação do Portkey é separada dos custos do seu provedor de LLM, o que significa que você ainda paga OpenAI, Anthropic e outros provedores diretamente pelo uso do modelo, enquanto o Portkey atua como a camada de middleware por cima.

A Métrica de Precificação Exclusiva: "Logs Registrados"

O aspecto mais distintivo da precificação do Portkey é a cobrança baseada em logs registrados, em vez de requisições de API brutas. Compreender essa métrica é crucial para estimar seus custos. Um log registrado representa uma única requisição de API de LLM que o Portkey captura, armazena e disponibiliza no seu painel de observabilidade.

Cada log inclui metadados da requisição (timestamp, usuário, aplicação), conteúdo do prompt e da resposta (a menos que explicitamente excluído por privacidade), informações do provedor e do modelo, métricas de latência e dados de desempenho, cálculos de custo, metadados e tags personalizados, e violações de guardrail ou erros.

Logs Registrados vs. Requisições Totais

A principal distinção entre logs registrados e requisições totais é que o gateway do Portkey continua roteando requisições mesmo depois de você exceder seu limite de logs. Seu gateway não para de funcionar; você simplesmente para de registrar novos logs para observabilidade. Isso é tanto um benefício quanto uma limitação. O benefício é que o código da sua aplicação em produção nunca para devido aos limites de logs. A limitação é que você perde visibilidade das requisições além do seu limite de logs, o que anula o propósito de uma plataforma de observabilidade.

Como os Limites de Logs Escalam Entre os Níveis

Tier	Recorded Logs/Month	Retention Period	Overage Handling
Dev (Free)	10,000 logs	30 days	Stops recording new logs
Pro	100,000 logs base Up to 3M with scaling	30 days	Pay $9 per 100K additional logs
Enterprise	10M+ logs	Custom (90+ days available)	Custom pricing & volume discounts

Exemplo de Cálculo de Custo

Por exemplo, se sua startup gera 500.000 requisições de LLM por mês, o plano Dev captura apenas as primeiras 10 mil requisições por $0, mas 98% do tráfego fica invisível. O plano Pro inclui 100 mil logs base no preço base, requer 400 mil logs adicionais e custa o plano base mais (4 × $9) = base mais $36 por mês pela cobertura de logs.

Com 500 mil requisições por mês, você provavelmente está gerando uma receita significativa e precisa de visibilidade total, então o nível Pro se torna essencial, mas a precificação do Portkey escala linearmente com o tráfego.

O Que Acontece Quando Você Atinge os Limites de Logs

Compreender como o comportamento da precificação do Portkey muda nos limites de logs é fundamental para o planejamento da produção.

Comportamento Técnico

O Gateway Continua Operando: Suas requisições de LLM continuam sendo roteadas e processadas normalmente.
O Registro Para: Novas requisições além do limite não são registradas no painel de observabilidade.
Sem Alertas ou Erros: Os usuários não experimentam nenhuma degradação funcional ou saídas inesperadas.
Pontos Cegos Surgem: Perde-se visibilidade sobre desempenho, custos, erros e padrões de uso para solicitações não registradas.

Impacto nos Negócios por Nível

Para equipes pequenas no nível Dev, 10 mil logs mensais equivalem a aproximadamente 330 solicitações por dia. Se você exceder isso regularmente, fica cego para a maior parte do tráfego de produção, tornando uma atualização para o plano Pro necessária para qualquer carga de trabalho de produção real.

Para startups em crescimento no nível Pro, você deve monitorar o uso de perto para evitar atingir o limite base de 100 mil. Cada 100 mil logs adicionais custam US$ 9, o que é gerenciável, mas acumula rapidamente. Com mais de 1 milhão de solicitações por mês, considere o nível Enterprise para uma melhor economia unitária.

Para empresas, limites de log personalizados são negociados com base no volume, geralmente mais de 10 milhões de logs, com descontos por volume e períodos de retenção configuráveis, cruciais para conformidade.

Limitations of Portkey pricing log limits compared to TrueFoundry

Visão Geral dos Planos de Preço Portkey

Vamos dar uma olhada nos diferentes planos de preço Portkey:

Plano Dev (Gratuito para Sempre)

Preço: $0/mês | Logs Registrados: 10.000/mês (retenção de 30 dias)
Ideal Para: Prototipagem, hackathons, avaliação de POC

O plano Dev inclui acesso unificado à API para mais de 250 modelos, observabilidade básica (logs, rastreamentos, feedback, metadados), fallbacks automáticos, balanceamento de carga, cache simples (TTL de 1 dia), até 3 modelos de prompt e suporte da comunidade. No entanto, com apenas 10 mil solicitações/mês visíveis (aproximadamente 330/dia), sem cache semântico, sem alertas ou painéis avançados e sem controle de acesso de usuário, é insuficiente para aplicações em produção.

Plano Pro (Pronto para Produção)

Preço: Preço personalizado (entre em contato com vendas) | Base: 100 mil logs + $9 por cada 100 mil adicionais (até 3 milhões no total)
Ideal para: Startups que implementam aplicações LLM em produção, equipas com < 3 milhões de pedidos mensais

O plano Pro adiciona observabilidade detalhada (alertas, painel FinOps, análises), cache semântica com TTL ilimitado, modelos de prompt ilimitados com controlo de versão, controlo de acesso de utilizadores e suporte de produção com SLA padrão. As principais limitações incluem um limite de 3 milhões de logs mensais, retenção de apenas 30 dias, sem implementação VPC e sem SSO ou RBAC avançado.

Exemplos de Custo: 500 mil pedidos = Base + $36/mês | 1 milhão de pedidos = Base + $81/mês | 2 milhões de pedidos = Base + $171/mês

Plano Empresarial (Preços Personalizados)

Preço: Personalizado (contactar vendas) | Logs: Mais de 10 milhões com descontos por volume (retenção personalizada de mais de 90 dias)
Ideal para: Grandes empresas, indústrias regulamentadas, produção de alto volume

O plano Empresarial inclui tudo o que está no Pro, mais governação avançada (RBAC, SSO, orçamentos granulares), infraestrutura empresarial (cloud privada, alojamento VPC, exportação de dados, isolamento de dados), certificações de conformidade (SOC2, ISO 27001, GDPR, HIPAA, BAAs personalizados), suporte prioritário 24/7 com tempos de resposta garantidos e três opções de implementação (SaaS gerido, híbrido ou totalmente isolado).

Preços típicos da Portkey variam de $2.000 a $10.000+/mês, dependendo do volume, retenção, modelo de implementação e nível de suporte.

Preços da Portkey vs. Concorrentes (2026)

Compreender como os preços da Portkey se comparam com as alternativas ajuda a determinar a melhor opção para o seu caso de uso.

Tabela Completa de Comparação de Preços

Provider	Free Tier	Entry-Level Paid	Enterprise	Pricing Model	Best For
Portkey	10K logs/mo	~$100+/mo for 100K–3M logs	Custom ($2K–$10K+/mo)	Recorded logs	Startups needing managed observability
TrueFoundry	50K req/mo	$499/mo (1M req/mo)	Custom (10M+ req/mo)	Requests + features	Enterprises needing governance + MCP
LiteLLM	Unlimited Self Managed (OSS)	Unlimited Self Managed (OSS)	Custom	Open source / Self-hosted	Cost-conscious teams with DevOps expertise
Kong	30-day trial	$100/model/mo (max 5)	Custom	Per-model	Existing Kong users, 1–3 models

Matriz de Comparação de Recursos

Se você está avaliando os principais provedores de gateway de IA, veja como eles se comparam:

TrueFoundry: Melhor para empresas que precisam de governança no nível Pro (US$ 499), suporte completo de gateway MCP para fluxos de trabalho de IA agentiva e registro ilimitado em todos os níveis. Implantação VPC disponível no nível Enterprise. Ideal para equipes de médio a grande porte que desenvolvem agentes de IA em produção.
Portkey: Melhor para startups com menos de 1 milhão de requisições por mês que precisam de serviços gerenciados para começar rapidamente. Um excelente painel de observabilidade e integração em 2 minutos o tornam ideal para equipes sem experiência em DevOps que priorizam o tempo de lançamento no mercado.
LiteLLM: Melhor para auto-hospedagem e implantações de LLM de alto volume (mais de 5 milhões de requisições/mês) com equipes de DevOps. É de código aberto com requisições ilimitadas, mas carece de SLAs empresariais robustos e exige experiência em gerenciamento de infraestrutura.
Kong: Cobra US$ 100 por modelo por mês (máximo de 5 no nível Plus), o que funciona bem para equipes padronizadas em 1-3 modelos, mas pode se tornar caro para estratégias multi-modelo. Evoluiu de gateway de API para gateway de IA. Melhor para usuários existentes do Kong que precisam de integração de gerenciamento de API juntamente com recursos de gateway de IA.

Feature	Portkey	TrueFoundry	LiteLLM	Kong
Free Tier Requests	10K logs	50K requests	Unlimited	30-day trial
Semantic Caching	Pro+	Pro ($499)	OSS	Enterprise
RBAC / Governance	Enterprise	Pro ($499)	OSS	Enterprise
MCP Gateway Support	Limited	Full support	No	Plugin-based
Self-Hosted Option	Enterprise	All tiers	Open source	Enterprise
Log Retention	30d (Pro), Custom (Ent)	Custom all tiers	Self-managed	Self-managed
Recorded Logs Limits	Tier-based	No log limits	No log limits	No log limits
VPC / On-Prem	Enterprise only	Pro+	OSS	Enterprise
Support SLA	Enterprise	Enterprise	Enterprise	Enterprise

Leia Também: Portkey vs LiteLLM

TrueFoundry offers advanced MCP gateway features, unlike Portkey

Quando o Preço do Gateway de IA Portkey Faz Sentido

A precificação do Portkey o torna a escolha certa para perfis organizacionais específicos e casos de uso de GenAI.

Startups em Estágio Inicial (Pré-Seed a Série A)

Startups em estágio inicial com equipes de 3 a 5 pessoas que desenvolvem produtos baseados em IA se beneficiam porque os 10 mil logs gratuitos por mês os ajudam na prototipagem inicial, a integração em 2 minutos significa menos tempo de engenharia em infraestrutura, o nível Pro escala da versão beta para a produção inicial, e o serviço gerenciado elimina as dores de cabeça com a infraestrutura. Perfis de custo de US$ 0 a US$ 500 por mês no primeiro ano são gerenciáveis para startups apoiadas por capital de risco.

Equipes Sem Experiência em DevOps

Equipes sem experiência em DevOps se beneficiam quando as equipes de engenharia são fortes no processo de desenvolvimento, mas carecem de experiência em Kubernetes, Docker ou infraestrutura de nuvem, tornando a auto-hospedagem do LiteLLM um processo que exige contratação ou treinamento.

O gateway de IA Portkey oferece infraestrutura totalmente gerenciada com SLA de 99,99% de tempo de atividade, sem necessidade de gerenciar servidores, escalonamento, monitoramento ou atualizações. A segurança e a conformidade são tratadas pelo Portkey, e uma equipe de suporte está disponível quando surgem problemas.

Hospedar o LiteLLM por conta própria exige experiência em DevOps avaliada em US$ 120 mil a US$ 180 mil por ano, tornando o custo do Portkey, na camada Pro, de US$ 3 mil a US$ 6 mil por ano, dramaticamente mais barato se você não possui essa capacidade.

Volumes Moderados de Requisições (100 mil - 2 milhões/mês)

Equipes com volumes moderados de requisições, entre 100 mil e 2 milhões por mês, que já passaram da fase de protótipo, mas ainda não atingiram uma escala massiva, consideram o preço do Portkey competitivo. A US$ 9 por 100 mil logs, isso é razoável para o valor de observabilidade e mais fácil de orçar do que custos de infraestrutura imprevisíveis.

Com 500 mil requisições por mês, os US$ 36 adicionais em custos de log são gerenciáveis, e com 1 milhão de requisições por mês, os US$ 81 adicionais em custos de log ainda são razoáveis. Acima de 3 milhões de requisições por mês, concorrentes com logging ilimitado como TrueFoundry ou opções auto-hospedadas como LiteLLM tornam-se mais econômicos.

Por que equipes de alta escala buscam além do Portkey

À medida que as aplicações de IA escalam de milhares para milhões de requisições mensais, os modelos de precificação e as escolhas arquitetônicas do Portkey criam atrito para equipes de alto crescimento.

Limites de Log Criam Pontos Cegos Operacionais

Limites de log criam pontos cegos operacionais porque, uma vez que você excede seu limite de log, novas requisições não são registradas e sua plataforma de observabilidade para de observar. Se seu aplicativo gera 5 milhões de requisições por mês e o Portkey AI Pro tem um limite máximo de 3 milhões de logs, 40% do seu tráfego fica invisível nos painéis.

Você não consegue depurar problemas que afetam 2 milhões de requisições por mês, e a análise de custos torna-se não confiável porque 40% dos dados de gastos estão faltando. A solução alternativa Enterprise exige o pagamento de US$ 5 mil a US$ 10 mil por mês pela camada Enterprise com limites de log de mais de 10 milhões, onde os concorrentes oferecem logging ilimitado a preços mais baixos.

Retenção de 30 Dias Insuficiente para Conformidade

A retenção de 30 dias é insuficiente para conformidade em muitas indústrias regulamentadas. A área da saúde, sob a HIPAA, exige mais de 6 anos para registros médicos, serviços financeiros, sob a SOX, exigem mais de 7 anos para logs de transações, e contratos governamentais exigem um mínimo de 3 anos.

Os recursos de gateway do Portkey na camada Pro oferecem apenas 30 dias, enquanto a camada Enterprise oferece retenção personalizada disponível a um preço premium. O TrueFoundry oferece retenção personalizada disponível na camada Pro por US$ 499, e o LiteLLM oferece retenção ilimitada, já que você controla o armazenamento.

Falta de Gateway MCP para IA Agente

A falta de um gateway MCP do Portkey para IA agente é uma lacuna significativa. Até 2026, os fluxos de trabalho de IA agente estão se popularizando, e o Protocolo de Contexto de Modelo (MCP) permite que agentes de IA usem ferramentas, acessem bancos de dados e interajam com sistemas externos com segurança.

O Portkey tem suporte limitado ao MCP e ainda não priorizou os recursos de gateway MCP, o que significa que você não pode construir fluxos de trabalho de IA agente sofisticados, como agentes de IA consultando bancos de dados internos com permissões de nível de usuário, uso de ferramentas com injeção de token OAuth, ou servidores MCP virtuais abstraindo cadeias de ferramentas complexas.

O TrueFoundry oferece um gateway MCP completo com suporte a servidor virtual, injeção de identidade OAuth 2.0 onde os agentes atuam em nome de usuários específicos, economia de 99% de tokens de inferência através do uso ativo de ferramentas versus preenchimento de contexto, e aproximadamente 10ms de latência para chamadas de ferramentas.

Governança Limitada Até a Camada Enterprise

A governança limitada até a camada Enterprise cria desafios porque as operações modernas de IA exigem Controle de Acesso Baseado em Função (RBAC) em modelos, controles de orçamento por equipe, usuário ou aplicação, limitação de taxa por usuário ou departamento, e guardrails personalizados e filtragem de conteúdo.

O gateway de IA empresarial do Portkey restringe esses recursos à camada Enterprise, o que significa que os clientes da camada Pro carecem de governança básica, exigindo um gasto de aproximadamente US$ 2 mil a US$ 5 mil por mês para recursos de governança. O TrueFoundry oferece RBAC disponível na camada Pro por US$ 499 por mês, controles de orçamento e limitação de taxa na camada Pro, e governança acessível a equipes menores mais cedo em sua jornada de crescimento.

Como o TrueFoundry é uma Alternativa Poderosa?

Para equipes que encontram as limitações do Portkey, especialmente limites de log, suporte a MCP e recursos de governança, a TrueFoundry oferece uma alternativa atraente com escolhas arquitetônicas e de precificação do Portkey fundamentalmente diferentes.

Diferenças Filosóficas Essenciais

Dimension	Portkey	TrueFoundry
Pricing Model	Log-based (consumption)	Request-based (predictable)
Governance	Enterprise-only	Available at Pro tier ($499)
MCP Gateway	Limited/None	Full-featured MCP gateway
Deployment	Cloud-first	Cloud as well as Hybrid/VPC
Target Market	Startups → Mid-market	Mid-market → Enterprise

TrueFoundry allows you to deploy long-running agents easily

Recursos de Governança no Nível Pro ($499/mês)

A TrueFoundry oferece recursos de governança no nível Pro por $499 por mês, que incluem Controle de Acesso Baseado em Função (RBAC) em modelos, controles de orçamento por usuário, equipe ou aplicativo, políticas de limitação de taxa flexíveis por usuário, modelo ou aplicativo, modelos virtuais para abstração, registro de metadados personalizado e controle de acesso granular.

Uma startup de 20 pessoas pode implementar governança de nível de produção por $499 por mês, em vez de mais de $5.000 por mês com o gateway de IA empresarial Portkey, democratizando a governança de IA para equipes menores.

Suporte Completo a Gateway MCP

O suporte completo a gateway MCP da TrueFoundry representa sua diferenciação mais significativa para casos de uso de IA agêntica em 2026.

O Que o Gateway MCP da TrueFoundry Permite:

Abstração de Servidor MCP Virtual: Crie servidores lógicos como "Servidor de Agente Financeiro" expondo múltiplas ferramentas, direcione chamadas de ferramentas através de um único gateway gerenciado e agregue ferramentas como consultas a bancos de dados, chamadas de API e acesso a arquivos em interfaces de agente coerentes.
Injeção de Identidade OAuth 2.0: Agentes atuam em nome de usuários específicos, aplicando permissões de nível de usuário em cada chamada de ferramenta. Isso elimina credenciais de superusuário compartilhadas e garante que os agentes atuem como usuários específicos (como Alice) e só possam acessar os dados de Alice.
Implantação Híbrida: Ferramentas de dados sensíveis permanecem on-premise ou em VPC enquanto o raciocínio do LLM ocorre na nuvem, com o gateway orquestrando entre os limites.
Eficiência de Custo: 99% de economia em tokens de inferência em comparação com o preenchimento de contexto, reduz execuções típicas de agentes de $0.50 para $0.005 e usa o uso ativo de ferramentas em vez da leitura passiva de contexto.
Desempenho: Aproximadamente 10ms de sobrecarga de latência, processa mais de 350 requisições por segundo em 1 vCPU e suporta escalabilidade horizontal.

Implantação em VPC e On-Premise para Empresas

A TrueFoundry oferece implantação em VPC e on-premise de forma muito integrada. Indústrias regulamentadas precisam de dados em sua VPC desde o primeiro dia e a TrueFoundry inclui opção de VPC e airgapped para empresas com SLAs rigorosos.

Comparison of TrueFoundry features versus Portkey pricing limitations

Não deixe que a precificação limite sua visibilidade

Portkey é uma excelente escolha para equipes que buscam começar rapidamente, mas a precificação baseada em observabilidade pode rapidamente se tornar um gargalo à medida que o volume de suas requisições aumenta. Quando você é cobrado por log, é frequentemente forçado a fazer uma escolha difícil: pagar um valor premium por visibilidade total ou arriscar-se a operar às cegas durante incidentes críticos de produção para se manter dentro do orçamento.

A TrueFoundry oferece um caminho diferente. Ao desacoplar o gateway da computação subjacente e oferecer observabilidade ilimitada por uma taxa mensal fixa, garantimos que sua arquitetura incentive a visibilidade em vez de penalizá-la. Você obtém RBAC de nível empresarial, controles de orçamento e propriedade total dos dados sem o "imposto sobre o sucesso" da cobrança por log.

Pronto para escalar suas aplicações de IA sem os custos ocultos? Agende uma demonstração com a TrueFoundry hoje para ver como entregamos observabilidade e governança ilimitadas por uma taxa fixa previsível.

Perguntas Frequentes

A Portkey cobra por requisições de API além do registro de logs?

Não, a Portkey cobra apenas pelos logs registrados com base no seu nível e acesso a recursos para os níveis Pro versus Enterprise. Você paga seus provedores de LLM como OpenAI e Anthropic separadamente pelo uso real do modelo, enquanto a Portkey é a camada de middleware para roteamento e observabilidade.

O que acontece com minhas requisições se eu exceder o limite de logs da Portkey?

Suas requisições continuam sendo roteadas normalmente para os provedores de LLM, e o gateway não para de funcionar. O que para é o registro de novos logs no painel de observabilidade, o que significa que você perde a visibilidade do conteúdo de requisições e respostas, o rastreamento de custos para essas requisições, métricas de desempenho e latência, e o monitoramento e depuração de erros.

Posso auto-hospedar o Portkey AI Gateway?

Sim, mas apenas com o plano Enterprise através de uma opção de implantação air-gapped. As alternativas incluem LiteLLM, que é totalmente de código aberto e pode ser auto-hospedado em qualquer infraestrutura gratuitamente, e TrueFoundry, que oferece implantação VPC e on-premises disponível no nível Pro por US$ 499 por mês.

A Portkey suporta MCP (Model Context Protocol) para IA agentiva?

A partir de 2026, a Portkey tem suporte limitado a MCP e ainda não priorizou os recursos de gateway MCP da Portkey. Para suporte completo a MCP, a TrueFoundry oferece um gateway MCP completo com servidores virtuais, injeção OAuth e implantação híbrida, e a Kong oferece um plugin de proxy MCP disponível no nível Enterprise.

Como funciona a retenção de logs de 30 dias da Portkey?

Os logs do nível Pro são retidos por 30 dias e depois excluídos automaticamente, enquanto o nível Enterprise oferece períodos de retenção personalizados de mais de 90 dias, 1 ano ou mais, que podem ser negociados. Muitas indústrias exigem retenção mais longa, incluindo saúde com mais de 6 anos, serviços financeiros sob SOX exigem mais de 7 anos para logs de transações, e contratos governamentais exigem um mínimo de 3 anos.

A TrueFoundry se integra ao meu fluxo de trabalho existente?

Sim, a TrueFoundry se integra com ferramentas populares como GitHub para controle de versão, gerenciamento de PRs (Pull Requests) e manutenção de documentação para seus modelos. Você também pode configurar tempos limite para tarefas de geração de áudio ou chat de longa duração, e usar SDKs Python para integrações personalizadas.

A TrueFoundry oferece recursos avançados como caching e testes?

A TrueFoundry oferece a melhor solução de cache com capacidades semânticas para reduzir custos. Ela também suporta estruturas de teste robustas para garantir a qualidade do modelo antes da implantação, fornecendo recursos detalhados de observabilidade e logs detalhados que oferecem insights claros sobre o desempenho da sua IA. Isso proporciona valor imediato e faz uma enorme diferença para um engenheiro de ML sênior que gerencia sistemas complexos. Qualquer usuário acharia o nível de visibilidade inestimável para prevenir saídas inesperadas em produção.

TrueFoundry AI Gateway delivers ~3–4 ms latency, handles 350+ RPS on 1 vCPU, scales horizontally with ease, and is production-ready, while LiteLLM suffers from high latency, struggles beyond moderate RPS, lacks built-in scaling, and is best for light or prototype workloads.

Built for Speed: ~10ms Latency, Even Under Load

Schedule your Demo Now