Comprendre la tarification de Portkey AI Gateway pour 2026 : guide complet et comparaison

Conçu pour la vitesse : latence d'environ 10 ms, même en cas de charge
Une méthode incroyablement rapide pour créer, suivre et déployer vos modèles !
- Gère plus de 350 RPS sur un seul processeur virtuel, aucun réglage n'est nécessaire
- Prêt pour la production avec un support complet pour les entreprises
Pour choisir la bonne passerelle d'IA pour les applications d'IA de production, il faut comprendre non seulement les fonctionnalités, mais aussi l'évolution des prix en fonction de l'utilisation. Portkey AI est devenu un choix populaire pour les startups et les équipes de plateformes, mais son modèle de tarification unique basé sur des « journaux enregistrés » peut prêter à confusion.
Ce guide complet détaille les tarifs de Portkey pour 2026, explique ce pour quoi vous payez réellement et vous aide à déterminer si Portkey est la solution idéale ou si des alternatives telles que TrueFoundry, LiteLM ou Kong pourraient mieux répondre à vos besoins.

Qu'est-ce que Portkey AI Gateway ?
Portkey AI Gateway est une plateforme d'infrastructure d'IA prête à la production qui fournit une interface unifiée permettant d'accéder à plus de 250 modèles différents de fournisseurs tels qu'OpenAI, Anthropic, Google, AWS Bedrock, Azure, etc. Il sert de panneau de contrôle pour gérer, acheminer et surveiller les demandes LLM dans les environnements de production.
La passerelle Portkey se positionne comme le « panneau de contrôle pour l'IA de production » avec des fonctionnalités conçues pour les équipes passant de la phase de validation de concept à la phase de production. La plateforme propose une interface API unifiée avec un point de terminaison unique pour accéder à plus de 250 modèles provenant de plusieurs fournisseurs avec des formats de demande et de réponse standardisés.
Sa suite d'observabilité fournit des journaux détaillés, un suivi, des analyses et un suivi des coûts pour chaque demande LLM. Les fonctionnalités de fiabilité incluent les replis automatiques, l'équilibrage de charge, le routage conditionnel, la logique des nouvelles tentatives et les disjoncteurs pour éviter les temps d'arrêt du modèle. L'optimisation des performances de production passe par la mise en cache sémantique et la mise en cache simple afin de réduire la latence et les coûts.
La plateforme détient les certifications SOC2 Type 2, ISO 27001, GDPR et HIPAA au niveau Enterprise et revendique un temps d'intégration de 2 minutes avec une surveillance immédiate de tous les appels LLM. Portkey AI cible les startups évoluant vers les entreprises de production et les entreprises de taille moyenne qui ont besoin d'une infrastructure d'IA gérée sans la complexité liée à l'auto-hébergement de solutions open source.
Comment Portkey aborde la tarification dans son ensemble ?
Contrairement aux passerelles API traditionnelles qui facturent en fonction des requêtes ou des ressources de calcul, la tarification de Portkey utilise un modèle de tarification basé sur l'utilisation centré sur les « journaux enregistrés », une métrique unique aux solutions de passerelle d'IA axées sur l'observabilité.
La tarification de Portkey reflète son positionnement en tant que plateforme axée sur l'observabilité. Alors que la passerelle elle-même achemine les demandes vers les fournisseurs LLM que vous payez séparément, Portkey facture principalement trois composants :
- Journaux enregistrés : Le nombre de demandes LLM suivies dans leur système d'observabilité.
- Durée de conservation : Durée pendant laquelle les journaux et les métadonnées sont conservés.
- Fonctionnalités avancées : Fonctionnalités haut de gamme telles que la mise en cache sémantique, le routage avancé et la gouvernance.
Ce modèle convient parfaitement aux équipes qui souhaitent une surveillance complète, mais qui peut devenir coûteux à grande échelle, en particulier si vous avez besoin de conserver des journaux à long terme ou si vous générez des volumes de demandes élevés.
Lorsque vous payez le coût de Portkey, vous payez pour une infrastructure de déploiement Edge gérée avec un SLA de disponibilité de 99,99 % et une latence de 20 à 40 ms, la plate-forme d'observabilité pour le stockage, l'indexation et l'interrogation des journaux de demandes, les traces et les analyses, l'accès aux fonctionnalités de stratégies de routage avancées, la mise en cache sémantique, la gestion rapide et les garde-fous, une assistance allant de la communauté à la production ou au niveau de l'entreprise selon le niveau, et une infrastructure de conformité comprenant des certifications de sécurité comme SOC2 et HIPAA.
Remarque importante : La tarification de Portkey est distincte des coûts de votre fournisseur LLM, ce qui signifie que vous payez toujours OpenAI, Anthropic et d'autres fournisseurs directement pour l'utilisation du modèle, tandis que Portkey sert de couche intermédiaire au-dessus.
L'indicateur de tarification unique : les « journaux enregistrés »
L'aspect le plus distinctif de la tarification de Portkey est la facturation basée sur les journaux enregistrés plutôt que sur les demandes d'API brutes. Il est essentiel de comprendre cette métrique pour estimer vos coûts. Un journal enregistré représente une seule demande d'API LLM que Portkey capture, stocke et met à disposition dans votre tableau de bord d'observabilité.
Chaque journal inclut les métadonnées des demandes (horodatage, utilisateur, application), le contenu des invites et des réponses (sauf si cela est explicitement exclu pour des raisons de confidentialité), des informations sur le fournisseur et le modèle, des mesures de latence et des données de performance, des calculs de coûts, des métadonnées et des balises personnalisées, ainsi que des violations ou des erreurs de sécurité.
Journaux enregistrés par rapport au nombre total de demandes
La principale différence entre les journaux enregistrés et le nombre total de demandes est que la passerelle Portkey continue d'acheminer les demandes même lorsque vous dépassez votre limite de journalisation. Votre passerelle ne cesse pas de fonctionner ; vous arrêtez simplement d'enregistrer de nouveaux journaux pour des raisons d'observabilité. Il s'agit à la fois d'un avantage et d'une limitation. L'avantage est que le code de votre application de production ne tombe jamais en panne en raison des limites de journalisation. La limite est que vous perdez de la visibilité sur les requêtes au-delà de votre limite de journalisation, ce qui va à l'encontre de l'objectif d'une plateforme d'observabilité.
Comment les limites de journalisation s'adaptent à tous les niveaux
Exemple de calcul des coûts
Par exemple, si votre start-up génère 500 000 requêtes LLM par mois, le plan Dev ne capture que les 10 000 premières demandes pour 0$, mais 98 % du trafic est invisible. Le plan Pro inclut 100 000 journaux de base dans le prix de base, nécessite 400 000 journaux supplémentaires et coûte le forfait de base plus (4 × 9$) = base plus 36$ par mois pour la couverture des journaux.
Avec 500 000 demandes par mois, vous générez probablement des revenus importants et avez besoin d'une visibilité totale. Le niveau Pro devient donc essentiel, mais la tarification de Portkey évolue de manière linéaire en fonction du trafic.
Que se passe-t-il lorsque vous atteignez les limites de journalisation
Pour planifier la production, il est essentiel de comprendre comment le comportement tarifaire de Portkey évolue en fonction des limites de log.
Comportement technique
- Gateway continue de fonctionner : Vos demandes LLM continuent d'être acheminées et traitées normalement.
- Arrêts de journalisation : Les nouvelles demandes dépassant la limite ne sont pas enregistrées dans le tableau de bord d'observabilité.
- Aucune alerte ni erreur : Les utilisateurs ne subissent aucune dégradation fonctionnelle ni aucun résultat inattendu.
- Des angles morts apparaissent : Vous perdez de la visibilité sur les performances, les coûts, les erreurs et les modèles d'utilisation des demandes non enregistrées.
Impact commercial par niveau
Pour les petites équipes de niveau Dev, 10 000 journaux mensuels équivalent à environ 330 demandes par jour. Si vous dépassez régulièrement cette limite, vous ne pouvez pas voir la majeure partie du trafic de production. Une mise à niveau vers la version Pro est donc nécessaire pour toute charge de travail de production réelle.
Pour les startups en pleine croissance du niveau Pro, vous devez surveiller de près l'utilisation pour éviter d'atteindre la limite de base de 100 000. Chaque 100 000 journaux supplémentaires coûte 9$, ce qui est gérable mais s'additionne rapidement. Pour plus d'un million de demandes par mois, envisagez le niveau Enterprise pour améliorer la rentabilité de l'unité.
Pour les entreprises, les limites de journalisation personnalisées sont négociées en fonction du volume, généralement plus de 10 millions de journaux avec des remises sur volume et des périodes de conservation configurables cruciales pour la conformité.

Répartition du plan tarifaire Portkey
Jetons un coup d'œil aux différents plans tarifaires de Portkey :
Plan de développement (gratuit pour toujours)
- Prix : 0$ par mois | Journaux enregistrés : 10 000/mois (rétention de 30 jours)
- Idéal pour : Prototypage, hackathons, évaluation des POC
Le plan Dev comprend un accès API unifié à plus de 250 modèles, une observabilité de base (journaux, traces, commentaires, métadonnées), des solutions de secours automatiques, un équilibrage de charge, une mise en cache simple (TTL d'un jour), jusqu'à 3 modèles d'invite et une assistance communautaire. Cependant, avec seulement 10 000 demandes visibles par mois (environ 330 par jour), aucune mise en cache sémantique, aucune alerte ou tableau de bord avancé, et aucun contrôle d'accès utilisateur, c'est insuffisant pour les applications de production.
Pro Plan (prêt pour la production)
- Prix : Tarification personnalisée (contactez le service commercial) | Base : 100 000 journaux + 9$ par 100 000 livres supplémentaires (jusqu'à 3 millions au total)
- Idéal pour : Startups déployant des applications LLM de production, équipes avec moins de 3 millions de demandes mensuelles
Le plan Pro ajoute une observabilité détaillée (alertes, tableau de bord FinOps, analyses), une mise en cache sémantique avec TTL illimité, des modèles d'invite illimités avec contrôle de version, un contrôle d'accès utilisateur et un support de production avec un SLA standard. Les principales limites incluent un plafond de journalisation mensuel de 3 millions, une rétention de 30 jours uniquement, l'absence de déploiement de VPC et l'absence de SSO ou de RBAC avancé.
Exemples de coûts : 500 000 demandes = Base + 36 $/mois | 1 million de demandes = Base + 81 $/mois | 2 millions de demandes = Base + 171 $/mois
Plan d'entreprise (tarification personnalisée)
- Prix : Personnalisé (contactez le service commercial) | Journaux : Plus de 10 millions de dollars avec remises sur volume (rétention personnalisée pendant plus de 90 jours)
- Idéal pour : Grandes entreprises, industries réglementées, production à haut volume
Le plan Enterprise inclut tout ce qui concerne Pro, plus la gouvernance avancée (RBAC, SSO, budgets granulaires), l'infrastructure d'entreprise (cloud privé, hébergement VPC, exportation des données, isolation des données), les certifications de conformité (SOC2, ISO 27001, RGPD, HIPAA, BaaS personnalisé), une assistance prioritaire 24h/24 et 7j/7 avec des temps de réponse garantis et trois options de déploiement (SaaS géré, hybride ou entièrement isolé).
Typique Tarification Portkey varie entre 2 000 et 10 000 dollars et plus par mois selon le volume, la rétention, le modèle de déploiement et le niveau de support.
Tarification de Portkey par rapport à la concurrence (2026)
Comprendre comment la tarification de Portkey se compare aux autres solutions permet de déterminer la solution la mieux adaptée à votre cas d'utilisation.
Tableau de comparaison complet des prix
Matrice de comparaison des fonctionnalités
Si vous évaluez les principaux fournisseurs de passerelles d'IA, voici comment ils se classent :
- TrueFoundry : Idéal pour les entreprises qui ont besoin d'une gouvernance au niveau Pro (499$), d'une prise en charge complète de la passerelle MCP pour les flux de travail d'IA agentiques et d'une journalisation illimitée à tous les niveaux. Déploiement de VPC disponible au niveau Enterprise. Idéal pour les équipes de taille moyenne et d'entreprise qui créent des agents d'IA de production.
- Clé de port : Idéal pour les startups qui reçoivent moins d'un million de demandes par mois et qui ont besoin de services gérés pour démarrer rapidement. Son excellent tableau de bord d'observabilité et son intégration en 2 minutes en font la solution idéale pour les équipes qui n'ont pas d'expertise DevOps et qui accordent la priorité au délai de mise sur le marché.
- Type LM : Idéal pour l'auto-hébergement et les déploiements LLM à volume élevé (plus de 5 millions de demandes par mois) avec les équipes DevOps. Open source avec des demandes illimitées, mais ne dispose pas de contrats de niveau de service solides pour l'entreprise et nécessite une expertise en gestion d'infrastructure.
- Kong : Facture 100$ par modèle et par mois (maximum 5 sur le niveau Plus), ce qui fonctionne bien pour les équipes standardisées sur 1 à 3 modèles, mais peut devenir coûteux pour les stratégies multimodèles. A évolué d'une passerelle API à une passerelle IA. Idéal pour les utilisateurs existants de Kong qui ont besoin d'intégrer la gestion des API aux fonctionnalités de passerelle AI.
Lisez également : Portkey contre LiteLM

Quand la tarification de Portkey AI Gateway prend tout son sens
La tarification de Portkey en fait le choix idéal pour des profils organisationnels spécifiques et des cas d'utilisation de GenAI.
Startups en phase de démarrage (du pré-démarrage à la série A)
Les start-up en phase de démarrage dont les équipes de 3 à 5 personnes développent des produits alimentés par l'IA en bénéficient car les 10 000 journaux gratuits par mois leur permettent de passer au prototypage initial, l'intégration de 2 minutes signifie moins de temps d'ingénierie sur l'infrastructure, le niveau Pro passe de la version bêta à la production initiale et le service géré élimine les problèmes d'infrastructure. Les profils de coûts de 0 à 500 dollars par mois la première année sont gérables pour les startups soutenues par le capital-risque.
Équipes sans expertise DevOps
Les équipes qui n'ont pas d'expertise DevOps en tirent avantage lorsque les équipes d'ingénierie maîtrisent bien le processus de développement mais n'ont pas d'expertise en matière de Kubernetes, de Docker ou d'infrastructure cloud. L'auto-hébergement de LitelLM nécessite donc du recrutement ou une formation.
La passerelle Portkey AI offre une infrastructure entièrement gérée avec un SLA de disponibilité de 99,99 %, sans qu'il soit nécessaire de gérer les serveurs, la mise à l'échelle, la surveillance ou les mises à jour. La sécurité et la conformité sont gérées par Portkey, et une équipe d'assistance est disponible en cas de problème.
L'auto-hébergement de LitellM nécessite une expertise DevOps d'une valeur de 120 000 à 180 000 dollars par an, ce qui réduit considérablement le coût de Portkey de 3 000 à 6 000 dollars par an pour le niveau Pro si vous n'avez pas cette fonctionnalité.
Volumes de demandes modérés (100 000 à 2 millions par mois)
Les équipes dont les volumes de demandes sont modérés, compris entre 100 000 et 2 millions par mois, qui ont dépassé le stade du prototype mais pas encore à grande échelle, trouvent que les prix de Portkey sont compétitifs. À 9 dollars pour 100 000 journaux, cela est raisonnable en termes de valeur d'observabilité et plus facile à budgétiser que des coûts d'infrastructure imprévisibles.
À 500 000 demandes par mois, les 36 dollars supplémentaires de coûts de journalisation sont gérables, et à 1 million de demandes par mois, les 81 dollars supplémentaires de coûts de journalisation restent raisonnables. Au-delà de 3 millions de demandes par mois, les concurrents proposant une journalisation illimitée, comme TrueFoundry, ou des options d'auto-hébergement comme LiteLM, deviennent plus économiques.
Pourquoi les équipes de haut niveau vont au-delà de Portkey
Alors que les applications d'IA passent de milliers à des millions de demandes mensuelles, les modèles de tarification et les choix architecturaux de Portkey créent des frictions pour les équipes à forte croissance.
Les limites de journalisation créent des angles morts opérationnels
Les limites de journalisation créent des angles morts opérationnels, car une fois que vous dépassez votre limite de journalisation, les nouvelles demandes ne sont pas enregistrées et votre plateforme d'observabilité cesse d'observer. Si votre application génère 5 millions de requêtes par mois et que Portkey AI Pro atteint un maximum de 3 millions de journaux, 40 % de votre trafic est invisible dans les tableaux de bord.
Vous ne pouvez pas résoudre les problèmes affectant 2 millions de demandes par mois, et les analyses des coûts deviennent peu fiables car 40 % des données sur les dépenses sont manquantes. La solution de contournement Enterprise nécessite de payer entre 5 000 et 10 000 dollars par mois pour le niveau Enterprise avec des limites de plus de 10 millions de connexions, alors que les concurrents proposent une journalisation illimitée à des prix inférieurs.
La durée de conservation de 30 jours est insuffisante pour garantir la conformité
Une conservation de 30 jours est insuffisante pour assurer la conformité dans de nombreux secteurs réglementés. Les soins de santé selon la HIPAA nécessitent plus de 6 ans pour les dossiers médicaux, les services financiers selon la SOX nécessitent plus de 7 ans pour les journaux de transactions et les contrats gouvernementaux nécessitent un minimum de 3 ans.
Les fonctionnalités de la passerelle Portkey du niveau Pro ne sont disponibles que pendant 30 jours, tandis que le niveau Enterprise propose une rétention personnalisée disponible à un prix premium. TrueFoundry propose une rétention personnalisée disponible au niveau Pro pour 499$, et LiteLKM offre une rétention illimitée puisque vous contrôlez le stockage.
Passerelle MCP manquante pour Agentic AI
L'absence de passerelle Portkey MCP pour l'IA agentique constitue une lacune importante. D'ici 2026, les flux de travail d'IA agentiques deviendront courants et le Model Context Protocol (MCP) permet aux agents d'IA d'utiliser des outils, d'accéder à des bases de données et d'interagir avec des systèmes externes en toute sécurité.
Portkey dispose d'un support MCP limité et n'a pas encore donné la priorité aux fonctionnalités de passerelle MCP, ce qui signifie que vous ne pouvez pas créer de flux de travail agentiques sophistiqués tels que des agents d'IA interrogeant des bases de données internes avec des autorisations au niveau de l'utilisateur, l'utilisation d'outils avec injection de jetons OAuth ou des serveurs MCP virtuels extrayant des chaînes d'outils complexes.
TrueFoundry propose une passerelle MCP complète avec prise en charge des serveurs virtuels, une injection d'identité OAuth 2.0 où les agents agissent pour le compte d'utilisateurs spécifiques, des économies de 99 % sur les jetons d'inférence grâce à l'utilisation active des outils par rapport au remplissage contextuel, et une latence d'environ 10 ms pour les appels d'outils.
Gouvernance limitée jusqu'au niveau Enterprise
Une gouvernance limitée jusqu'au niveau Enterprise pose des défis, car les opérations d'IA modernes nécessitent un contrôle d'accès basé sur les rôles (RBAC) sur les modèles, des contrôles budgétaires par équipe, utilisateur ou application, une limitation du débit par utilisateur ou par service, ainsi que des garde-fous et un filtrage de contenu personnalisés.
La passerelle d'IA d'entreprise Portkey gère ces fonctionnalités au niveau Enterprise, ce qui signifie que les clients du niveau Pro ne disposent pas d'une gouvernance de base, nécessitant des dépenses d'environ 2 000 à 5 000 dollars par mois pour les fonctionnalités de gouvernance. TrueFoundry propose le RBAC disponible au niveau Pro pour 499$ par mois, des contrôles budgétaires et une limitation des taux au niveau Pro, ainsi qu'une gouvernance accessible aux petites équipes plus tôt dans leur parcours de croissance.
En quoi TrueFoundry est une alternative puissante ?
Pour les équipes qui rencontrent les limites de Portkey, en particulier les limites de journalisation, la prise en charge du MCP et les fonctionnalités de gouvernance, TrueFoundry propose une alternative convaincante avec des choix d'architecture et de tarification de Portkey fondamentalement différents.
Différences philosophiques fondamentales

Fonctionnalités de gouvernance chez Pro Tier (499 $/mois)
TrueFoundry propose des fonctionnalités de gouvernance de niveau Pro pour 499$ par mois, notamment un contrôle d'accès basé sur les rôles (RBAC) sur les modèles, des contrôles budgétaires par utilisateur, équipe ou application, des politiques de limitation de débit flexibles par utilisateur, modèle ou application, des modèles virtuels pour l'abstraction, l'enregistrement personnalisé des métadonnées et un contrôle d'accès affiné.
Une start-up de 20 personnes peut mettre en œuvre une gouvernance de niveau production pour 499 dollars par mois au lieu de plus de 5 000 dollars par mois grâce à la passerelle d'IA d'entreprise Portkey, qui démocratise la gouvernance de l'IA pour les petites équipes.
Support complet de la passerelle MCP
La prise en charge complète de la passerelle MCP de TrueFoundry représente sa différenciation la plus significative pour 2026 cas d'utilisation de l'IA agentique.
Ce que permet la passerelle MCP de TrueFoundry :
- Abstraction du serveur MCP virtuel : Créez des serveurs logiques tels que « Finance Agent Server » exposant plusieurs outils, acheminez les appels d'outils via une passerelle gérée unique et regroupez des outils tels que des requêtes de base de données, des appels d'API et l'accès aux fichiers dans des interfaces d'agent cohérentes.
- Injection d'identité OAuth 2.0 : Les agents agissent pour le compte d'utilisateurs spécifiques, en appliquant les autorisations au niveau de l'utilisateur à chaque appel à l'outil. Cela élimine les informations d'identification de superutilisateur partagées et garantit que les agents agissent en tant qu'utilisateurs spécifiques (comme Alice) et ne peuvent accéder qu'aux données d'Alice.
- Déploiement hybride : Les outils de données sensibles restent sur site ou dans un VPC tandis que le raisonnement LLM se déroule dans le cloud, la passerelle orchestrant au-delà des frontières.
- Rentabilité : 99 % d'économies sur les jetons d'inférence par rapport au remplissage de contexte, fait passer les coûts d'un agent typique de 0,50$ à 0,005$ et utilise l'utilisation active des outils au lieu de la lecture passive du contexte.
- Performances : Surcharge de latence d'environ 10 ms, gère plus de 350 demandes par seconde sur 1 processeur virtuel et prend en charge la mise à l'échelle horizontale.
Déploiement VPC et sur site pour les entreprises
TrueFoundry permet un déploiement VPC et sur site de manière très fluide. Les secteurs réglementés ont besoin de données dans leur VPC dès le premier jour et TrueFoundry inclut le VPC, une option airgapped pour les entreprises ayant des SLA stricts.

Ne laissez pas les prix limiter votre visibilité
Portkey est un excellent choix pour les équipes qui souhaitent démarrer rapidement, mais la tarification basée sur l'observabilité peut rapidement devenir un obstacle à mesure que le volume de vos demandes augmente. Lorsque vous êtes facturé à la carte, vous êtes souvent obligé de faire un choix difficile : payer un supplément pour bénéficier d'une visibilité totale ou risquer de voler à l'aveugle lors d'incidents de production critiques pour ne pas dépasser le budget.
TrueFoundry propose une autre voie. En découplant la passerelle du calcul sous-jacent et en offrant une observabilité illimitée pour un montant mensuel fixe, nous veillons à ce que votre architecture favorise la visibilité au lieu de la pénaliser. Vous bénéficiez d'un RBAC de niveau professionnel, de contrôles budgétaires et de la propriété complète des données sans la « taxe de réussite » liée à la facturation par journal.
Êtes-vous prêt à faire évoluer vos applications d'IA sans les coûts cachés ? Réservez une démo avec TrueFoundry dès aujourd'hui pour découvrir comment nous offrons une observabilité et une gouvernance illimitées pour un montant forfaitaire prévisible.
Questions fréquemment posées
Est-ce que Portkey facture les demandes d'API en plus de l'enregistrement des journaux ?
Non, Portkey facture uniquement les journaux enregistrés en fonction de votre niveau et de l'accès aux fonctionnalités pour les niveaux Pro par rapport aux niveaux Enterprise. Vous payez vos fournisseurs LLM tels qu'OpenAI et Anthropic séparément pour l'utilisation réelle du modèle, tandis que Portkey est la couche intermédiaire pour le routage et l'observabilité.
Qu'arrive-t-il à mes demandes si je dépasse la limite de log de Portkey ?
Vos demandes continuent d'être acheminées normalement vers les fournisseurs LLM et la passerelle ne cesse de fonctionner. Ce qui s'arrête, c'est l'enregistrement de nouveaux journaux dans le tableau de bord d'observabilité, ce qui signifie que vous perdez la visibilité sur le contenu des demandes et des réponses, le suivi des coûts de ces demandes, les mesures de performance et la latence, ainsi que la surveillance des erreurs et le débogage.
Puis-je héberger moi-même Portkey AI Gateway ?
Oui, mais uniquement avec le plan Enterprise via une option de déploiement ventilée. Les alternatives incluent LiteLM, qui est entièrement open source et peut être auto-hébergée gratuitement sur n'importe quelle infrastructure, et TrueFoundry, qui propose un déploiement VPC et sur site disponible au niveau Pro pour 499$ par mois.
Portkey prend-il en charge le protocole MCP (Model Context Protocol) pour l'IA agentique ?
En 2026, Portkey a un support MCP limité et n'a pas encore priorisé les fonctionnalités de la passerelle Portkey MCP. Pour une prise en charge complète du MCP, TrueFoundry propose une passerelle MCP complète avec serveurs virtuels, injection OAuth et déploiement hybride, et Kong propose un plug-in proxy MCP disponible au niveau Enterprise.
Comment fonctionne la conservation des journaux pendant 30 jours par Portkey ?
Les journaux du niveau Pro sont conservés pendant 30 jours puis supprimés automatiquement, tandis que le niveau Enterprise propose des périodes de conservation personnalisées de plus de 90 jours, 1 an ou plus qui peuvent être négociées. De nombreux secteurs nécessitent une rétention plus longue, notamment les soins de santé à plus de 6 ans, les services financiers dans le cadre de la SOX nécessitent plus de 7 ans pour les journaux de transactions et les contrats gouvernementaux nécessitent un minimum de 3 ans.
Est-ce que TrueFoundry s'intègre à mon flux de travail existant ?
Oui, TrueFoundry s'intègre à des outils populaires tels que GitHub pour le contrôle des versions, la gestion des PR (Pull Requests) et la maintenance de la documentation de vos modèles. Vous pouvez également configurer des délais d'expiration pour les tâches de génération audio ou de chat de longue durée, et utiliser les SDK Python pour des intégrations personnalisées.
TrueFoundry propose-t-il des fonctionnalités avancées telles que la mise en cache et les tests ?
TrueFoundry offre la meilleure solution de mise en cache avec des fonctionnalités sémantiques permettant de réduire les coûts. Il prend également en charge des cadres de test robustes pour garantir la qualité des modèles avant le déploiement, en fournissant des fonctionnalités d'observabilité détaillées et des journaux détaillés qui fournissent des informations claires sur les performances de votre IA. Cela apporte une valeur immédiate et fait une énorme différence pour un ingénieur ML senior qui gère des systèmes complexes. Tout utilisateur trouverait le niveau de visibilité inestimable pour éviter des sorties inattendues en production.
TrueFoundry AI Gateway offre une latence d'environ 3 à 4 ms, gère plus de 350 RPS sur 1 processeur virtuel, évolue horizontalement facilement et est prête pour la production, tandis que LiteLM souffre d'une latence élevée, peine à dépasser un RPS modéré, ne dispose pas d'une mise à l'échelle intégrée et convient parfaitement aux charges de travail légères ou aux prototypes.
Le moyen le plus rapide de créer, de gérer et de faire évoluer votre IA











.webp)



.png)


.webp)




.webp)







