TrueFoundry : bilan de fin d'année 2025

Conçu pour la vitesse : latence d'environ 10 ms, même en cas de charge
Une méthode incroyablement rapide pour créer, suivre et déployer vos modèles !
- Gère plus de 350 RPS sur un seul processeur virtuel, aucun réglage n'est nécessaire
- Prêt pour la production avec un support complet pour les entreprises
Si 2024 était l'allumage en orbite, 2025 est l'année où nous avons attrapé une fronde gravitationnelle. Dans chaque grande mission spatiale, un lance-pierre dépend de deux choses :
une puissante source de gravité externe, et une poussée interne suffisante pour l'atteindre réellement.
Pour nous, l'accélération rapide de la demande de passerelles IA est devenue cette force gravitationnelle. Notre Série A était la poussée interne, ce qui nous a donné la profondeur technique et la préparation GTM nécessaires pour atteindre la vitesse d'échappement et entrer sur la bonne orbite pour l'exploiter.
Voici à quoi ressemblait le lance-pierre :
Activation de la vitesse (série A) → Atteindre l'orbite d'inflexion (AI Gateway) → Assistance gravitationnelle (explosion de la demande) → Le vaisseau spatial (TrueFoundry) accélère vers l'avant.
Bien que cela puisse sembler être une manœuvre héroïque unique alimentée par une étincelle audacieuse, la réalité de la construction d'une mission spatiale est bien plus complexe. Les lance-pierres ne sont pas le fruit du hasard : ils sont le résultat de milliers de calculs précis, d'une préparation inlassable et d'innombrables corrections de cap. 2025 n'a pas été magique ; c'était la rencontre d'une discipline d'ingénierie, d'un partenariat avec les clients, d'une conviction en matière de GTM et d'une persévérance et d'un apprentissage extraordinaires. C'est ce à quoi nous réfléchissons ci-dessous, en commençant par là où 2024 nous a laissé.
TrueFoundry et année 2024
En 2024, nous avons établi un partenariat avec plusieurs entreprises du Fortune 500 et avons vu les applications des agences commencer à être déployées une valeur commerciale réelle et mesurable, qui a souvent un impact à neuf chiffres. Le potentiel d'impact n'était plus théorique ; il était indéniable. Comme nous l'avons indiqué dans notre dernier bilan de fin d'année, cela a également marqué le début de notre voyage vers un monde de « Une IA gérée par l'IA », TrueFoundry devenant de plus en plus agentique de par sa conception.
Mais au fur et à mesure que nous approfondissions, deux réalités claires sont apparues :
- Le l'écosystème agentic explosait, et la construction de systèmes fiables, faciles à entretenir et adaptés à la production dans un environnement en évolution rapide devenait de plus en plus complexe.
- Les entreprises étaient en dessous de une pression immense pour obtenir des résultats, et nombre d'entre eux avaient besoin d'une expertise plus approfondie, de bases d'infrastructure plus solides et de conseils pratiques pour y parvenir avec succès.
Ces informations ont directement influencé nos investissements les plus importants en 2025 :
- Passerelle IA — pour centraliser un écosystème de plus en plus fragmenté et aider les entreprises à connecter, observer et gérer les charges de travail d'IA des agences entre les fournisseurs.
- Déploiement d'IA — permet le déploiement de charges de travail d'IA telles que l'inférence de modèles, le réglage de LLM, les serveurs MCP et les agents en tant qu'applications Kubernetes standard sur des piles d'entreprise existantes via des interfaces de développement intuitives.
- Résultats de l'entreprise — notre initiative d'ingénierie déployée à l'avenir, en partenariat étroit avec les clients pour traduire les capacités de l'IA en un impact commercial réel et mesurable.
TrueFoundry et année 2025
2025 a été une année déterminante pour TrueFoundry. Les nouveaux revenus nets ont doublé, voire plus, d'un trimestre à l'autre, et Les entreprises du Fortune 500 à travers Les paiements, les semi-conducteurs, les télécommunications, la sécurité, la fabrication de puces, l'industrie pharmaceutique, les soins de santé et les infrastructures de données ont fait confiance à TrueFoundry pour alimenter leurs les applications agentiques de production les plus critiques. Passons en revue les principaux thèmes de l'année.
Thème 1 : AI Gateway
Pourquoi c'était important en 2025
L'un des thèmes les plus marquants de 2025 a été l'essor rapide de Passerelle IA en tant qu'élément essentiel de l'infrastructure d'IA des entreprises. Rien qu'au cours des derniers mois, nous avons vu la demande intrinsèque pour les passerelles IA monter en flèche. Aujourd'hui, à peu près 10 % des entreprises utilisent activement une passerelle, et au cours des trois prochaines années, ce chiffre devrait atteindre près de 70 %. Ce qui était autrefois considéré comme une infrastructure optionnelle est rapidement devenu fondamental.
L'hypothèse qui a échoué
Ce changement s'est produit parce que l'industrie, y compris nous, a sous-estimé le problème. Les passerelles étaient initialement supposées être des couches proxy fines et indifférenciées qui se situaient sur le chemin critique des requêtes LLM et il était préférable de les créer en interne. La réalité a prouvé le contraire.
Alors que les entreprises passaient de l'expérimentation à la production, la passerelle est apparue comme un plan de contrôle extrêmement complexe, qui devait gérer des API de modèles en constante évolution, des contrôles organisationnels centralisés, des politiques de sécurité, une gouvernance, une observabilité et une fiabilité à grande échelle.
Nous avons pu constater cette évolution lorsque les clients sont passés de « nous n'utiliserons jamais de passerelle externe » à l'exécution de leurs applications de production les plus critiques via la nôtre en quelques mois.
Pourquoi la complexité ne cessait de croître
Dans le même temps, la portée de ce qui devait être gouverné s'est considérablement élargie. L'accès au LLM à lui seul ne suffisait plus. Au fur et à mesure que le MCP gagnait du terrain, les entreprises ont eu du mal à s'authentifier et à autoriser un nombre croissant de serveurs, ce qui a naturellement confié cette responsabilité à la passerelle. Au fur et à mesure que les interactions agent-agent (A2A) commençaient à émerger, il est devenu évident que les agents eux-mêmes devaient être connectés, observés et gérés via le même plan de contrôle. L'évolution logique a suivi : Passerelle LLM → Passerelle MCP → Passerelle agent, aboutissant à ce que nous appelons aujourd'hui le Passerelle IA.
Comment nous y pensons aujourd'hui
Aujourd'hui, nous y réfléchissons clairement et simplement. TrueFoundry fournit une passerelle IA de niveau entreprise qui comprend une passerelle LLM, une passerelle MCP et une passerelle d'agent, permettant aux entreprises de connecter, d'observer et de gérer les charges de travail d'IA agentique entre les fournisseurs à partir d'un plan de contrôle unique. Notre passerelle IA aide les entreprises à rester sécurisées, efficaces et pérennes tout en développant des systèmes de plus en plus autonomes, qu'ils soient déployés en tant que SaaS, sur site ou dans des environnements isolés.
Lorsque l'AI Gateway est devenue le plan de contrôle de la gouvernance des systèmes agentiques, une autre réalité est devenue claire. Connecter, observer et gérer l'IA ne constituaient qu'une partie de l'équation. Les entreprises avaient également besoin d'un méthode fiable et adaptée à l'entreprise pour faire fonctionner ces systèmes en production — sur une infrastructure à laquelle ils faisaient déjà confiance. Cela a naturellement conduit à notre deuxième thème de 2025.
Thème 2 : Déploiement de l'IA
Intégrer les systèmes agentic à la pile de l'entreprise
Alors que l'écosystème agentic explosait, les entreprises avaient besoin d'une couche d'exécution fiable pour gérer cet écosystème en évolution rapide et souvent chaotique sur une infrastructure familière et fiable. AI Deploy est cette couche d'exécution qui permet aux équipes de déployer l'inférence de modèles, le réglage de LLM, les serveurs MCP et les agents en tant qu'applications Kubernetes standard, directement sur les piles d'entreprise existantes.
- Fonctionne sur Kubernetes, où les charges de travail de l'entreprise sont déjà installées
- S'intègre parfaitement aux systèmes d'observabilité, RBAC et SSO existants
- Traite les charges de travail liées à l'IA comme des services de production de premier ordre, et non comme des expériences
Conçu pour un monde souverain, hybride et multicloud
L'année 2025 a également marqué une forte évolution vers IA souveraine. La résidence des données, la géopatriation et les charges de travail d'IA rentables exécutées dans des centres de données internes sont devenues de plus en plus importantes.
- Déploiements sur site et axés sur le VPC
- Charges de travail hybrides et multicloud par défaut, et non comme exception
- Mise à l'échelle optimale en termes de coûts sur l'infrastructure appartenant à l'entreprise
AI Deploy a permis d'adopter des systèmes agentiques de pointe sans abandonner les contraintes de l'entreprise.
Interface utilisateur native, conception axée sur le code
Une autre tendance s'est manifestée : les entreprises avaient besoin simplicité sans perte de contrôle.
- Flux de travail natifs de l'interface utilisateur pour une itération plus rapide et une adoption plus large
- Flexibilité basée sur le code pour une personnalisation avancée et des cas d'utilisation complexes
- Des interfaces simples pour les utilisateurs professionnels, avec une puissance de programmation complète pour les ingénieurs
AI Deploy est devenue la couche d'exécution qui a permis aux systèmes agentiques de passer de la conception à la production, de manière propre, sécurisée et à grande échelle.
Thème 3 : Les résultats de l'entreprise
Lorsque l'AI Gateway est devenue le plan de contrôle de l'IA d'entreprise et qu'AI Deploy a permis aux charges de travail des agents de s'exécuter sur les piles d'entreprise existantes, une chose est devenue claire : l'infrastructure à elle seule ne suffit pas. Les entreprises ne se contentaient pas de demander comment pour construire des systèmes agentiques — ils étaient soumis à des pressions pour livrer des résultats commerciaux réels, souvent dans le cadre de délais serrés et d'un contrôle réglementaire rigoureux. En conséquence, nous avons redoublé notre Stratégie Enterprise Outcomes.
De l'expérience à la stratégie
Ce qui a commencé comme une expérience en 2024 est devenu une stratégie à part entière en 2025. Nous avons constitué une équipe de direction dédiée pour gérer Résultats de l'entreprise en tant qu'entreprise et a élargi notre équipe de chercheurs GenAI pour travailler en étroite collaboration avec les clients sur leurs initiatives d'IA les plus critiques.
Co-construction d'applications réelles
Grâce à Enterprise Outcomes, nous avons co-développé des applications agentiques de niveau production qui définissent le secteur dans soins de santé, semi-conducteurs, services financiers et télécommunications — ne se concentrait pas sur des démonstrations ou des projets pilotes, mais sur un impact commercial mesurable.
Une boucle de composition avec la plateforme
Nous avons également observé la formation d'un puissant volant d'inertie. Au fur et à mesure que de nouveaux cas d'utilisation sont passés en production via Enterprise Outcomes, l'adoption de notre plateforme de déploiement s'est intensifiée. Et au fur et à mesure que la plateforme était déployée, la création et la mise à l'échelle de nouveaux cas d'utilisation sont devenues beaucoup plus faciles. Chacun s'est renforcé mutuellement, créant une boucle d'expansion composée qui a défini la façon dont nous avons travaillé avec les entreprises en 2025.
Fin 2025, AI Gateway, AI Deploy et Enterprise Outcomes avaient convergé en une seule pile d'exploitation, qui connecte et régit les systèmes Agentic, les gère à l'échelle de l'entreprise et transforme les capacités intelligentes en résultats concrets.
Attraction du marché : quand la plateforme a commencé à se vendre
L'un des signaux les plus clairs indiquant que cette pile résonnait est venu du marché lui-même. Tout au long de 2025, nous avons commencé à constater une forte attraction entrante de la part des entreprises, à la fois en volume et en urgence.
- La vélocité des transactions s'est considérablement améliorée, plusieurs transactions d'entreprise ayant été conclues de bout en bout deux mois
- Plusieurs POC sont passés du lancement à la production en jours, pas des semaines
- Dans certains cas, les clients ont avancé sans aucun POC, motivé par la clarté de la valeur et la confiance dans la plateforme
Cette dynamique se reflète directement dans nos chiffres : forte croissance du chiffre d'affaires d'un trimestre à l'autre, cycles de vente plus rapides et liste croissante de nouveaux logos d'entreprise. Ce qui exigeait autrefois une formation approfondie est devenu de plus en plus une conversation sur à quelle vitesse les clients pourraient accéder à la production.
À l'origine de cette dynamique se trouvait une équipe qui a évolué avec détermination, sens de l'engagement et conviction.
L'équipe à l'origine de The Momentum
L'une des choses dont je suis le plus fier chez TrueFoundry, c'est la façon dont l'équipe a continué à croire profondément en la mission et à grandir aux côtés de l'entreprise dès le début. Alors que la taille de l'équipe a triplé en 2025, dans les domaines des ventes, du marketing, des résultats d'entreprise et de l'ingénierie, ce premier groupe a joué un rôle important dans le façonnement de la culture et l'accueil de nouveaux coéquipiers au sein de celle-ci. Au milieu de l'année, nous avons eu la chance de former une équipe vraiment spéciale hors site aux Maldives. J'en partage quelques instants ici.


2025 a marqué le moment où notre vision, notre exécution et l'attraction du marché se sont harmonisées, transformant des années de préparation en une dynamique soutenue.
Perspectives d'avenir et accueil à l'année 2026
Alors que nous nous tournons vers 2026, une conviction continue de guider notre direction : Les systèmes d'IA seront de plus en plus gérés par l'IA. Les humains graviront la couche d'abstraction, de l'exploitation de chaque étape d'un système à la définition de l'intention, des contraintes et des résultats, tandis que les systèmes intelligents se chargeront de l'exécution.
Nous observons deux changements structurels qui façonneront la prochaine génération de logiciels.
Qu'il s'agisse d'aider les développeurs ou de permettre à tous les travailleurs du savoir.
La dernière décennie des logiciels visait à donner aux développeurs, l'une des personnalités les plus influentes de la technologie, les moyens d'agir grâce à une explosion d'outils de développement et de SaaS. Les prochaines années seront consacrées à l'autonomisation chaque travailleur du savoir. GenAI a fondamentalement étendu ce que les logiciels peuvent faire, donnant naissance à une nouvelle catégorie de systèmes qui permettent aux utilisateurs de créer, de raisonner et de gérer des flux de travail complexes sans avoir besoin d'être des programmeurs traditionnels.
De l'humain dans la boucle à l'humain hors de la boucle.
Nous commençons à passer des systèmes d'IA qui aident les humains à des systèmes qui fonctionnent de manière autonome. Dans ce monde, les agents ne se contentent pas de réagir : ils planifient, élaborent, déploient et exécutent des flux de travail de bout en bout. Les logiciels seront de plus en plus développés pour les agents, les humains définissant la direction et les garde-fous au lieu d'intervenir en continu.
À l'approche de 2026, notre objectif est de permettre tout le monde, qu'il s'agisse d'humains ou de systèmes d'IA, pour créer, déployer et faire évoluer des systèmes intelligents sans effort et de manière optimale grâce à des interfaces de calcul intuitives conçues à la fois pour les personnes et les machines.
À la création de systèmes intelligents qui peuvent réellement fonctionner d'eux-mêmes, et aux équipes qui ont l'audace de les concrétiser. Nous sommes profondément reconnaissants à notre équipe, à nos clients et à nos investisseurs pour leur confiance et leur soutien, et nous abordons 2026 avec clarté, conviction et optimisme.
L'assistance gravitationnelle de 2025 nous a donné de la vitesse. 2026, c'est environ direction — et distance. Bonne année !
TrueFoundry AI Gateway offre une latence d'environ 3 à 4 ms, gère plus de 350 RPS sur 1 processeur virtuel, évolue horizontalement facilement et est prête pour la production, tandis que LiteLM souffre d'une latence élevée, peine à dépasser un RPS modéré, ne dispose pas d'une mise à l'échelle intégrée et convient parfaitement aux charges de travail légères ou aux prototypes.
Le moyen le plus rapide de créer, de gérer et de faire évoluer votre IA











.webp)



.png)


.webp)




.webp)







