TrueFoundry: Jahresrückblick 2025

Auf Geschwindigkeit ausgelegt: ~ 10 ms Latenz, auch unter Last
Unglaublich schnelle Methode zum Erstellen, Verfolgen und Bereitstellen Ihrer Modelle!
- Verarbeitet mehr als 350 RPS auf nur 1 vCPU — kein Tuning erforderlich
- Produktionsbereit mit vollem Unternehmenssupport
Wenn 2024 war Zündung im Orbit, 2025 war das Jahr, in dem wir eine Gravitationsschleuder gefangen haben. Bei jeder großen Weltraummission hängt eine Steinschleuder von zwei Dingen ab:
eine starke externe Gravitationsquelle, und genug innerer Schub, um ihn tatsächlich zu erreichen.
Für uns wurde die schnell steigende Nachfrage nach KI-Gateways zu dieser Gravitationskraft. Unsere Serie A war der interne Schub — er gab uns die technische Tiefe und die GTM-Bereitschaft, Fluchtgeschwindigkeit zu erreichen und in die richtige Umlaufbahn zu gelangen, um sie zu nutzen.
So sah die Schleuder aus:
Geschwindigkeitsaktivierung (Serie A) → Erreichen der Wendebahn (AI Gateway) → Gravity Assist (explodierende Nachfrage) → Raumschiff (TrueFoundry) beschleunigt vorwärts.
Das mag sich wie ein einziges heldenhaftes Manöver lesen, das von einem kühnen Funken angetrieben wird, aber die Realität beim Aufbau einer Weltraummission ist weitaus komplizierter. Steinschleudern sind kein Zufall — sie sind das Ergebnis tausender präziser Berechnungen, unermüdlicher Vorbereitung und unzähliger Kurskorrekturen. 2025 war keine Zauberei, es war das Zusammentreffen von technischer Disziplin, Kundenpartnerschaft, GTM-Überzeugung und einem außergewöhnlichen Maß an Beharrlichkeit und Lernen. Und darüber reflektieren wir im Folgenden — angefangen mit dem Punkt, an dem uns 2024 verlassen hat.
TrueFoundry und das Jahr 2024
Im Jahr 2024 gingen wir Partnerschaften mit mehreren Fortune-500-Unternehmen ein und sahen, wie Agentenanwendungen allmählich zur Verfügung standen. echter, messbarer Geschäftswert — oft mit neunstelliger Wirkung. Das Wirkungspotenzial war nicht mehr theoretisch; es war unbestreitbar. Wie wir in unserem letzten Jahresrückblick festgestellt haben, war dies auch der Beginn unserer Reise in eine Welt von „KI wird von KI verwaltet“, wobei TrueFoundry von Grund auf immer agentischer wird.
Aber als wir tiefer gingen, kristallisierten sich zwei klare Realitäten heraus:
- Das Das agentische Ökosystem explodierte, und der Aufbau zuverlässiger, wartbarer und produktionsfähiger Systeme in einer so schnelllebigen Umgebung wurde erheblich komplexer.
- Die Unternehmen waren unter immenser Ergebnisdruck, und viele brauchten vertieftes Fachwissen, stärkere Infrastrukturgrundlagen und praktische Beratung, um dies erfolgreich zu tun.
Diese Erkenntnisse haben unsere wichtigsten Investitionen im Jahr 2025 direkt beeinflusst:
- KI-Gateway — um ein zunehmend fragmentiertes Ökosystem zu zentralisieren und Unternehmen dabei zu unterstützen, agentische KI-Workloads anbieterübergreifend zu verbinden, zu beobachten und zu steuern.
- Einsatz von KI — ermöglicht die Bereitstellung von KI-Workloads wie Modellinferenz, LLM-Feinabstimmung, MCP-Servern und -Agenten als Standard-Kubernetes-Anwendungen auf bestehenden Unternehmens-Stacks über intuitive Entwicklerschnittstellen.
- Ergebnisse für Unternehmen — unsere zukunftsorientierte technische Initiative, bei der wir eng mit Kunden zusammenarbeiten, um KI-Fähigkeiten in echte, messbare Geschäftsergebnisse umzusetzen.
TrueFoundry und das Jahr 2025
2025 war ein entscheidendes Jahr für TrueFoundry. Der Nettoneuumsatz verdoppelte sich gegenüber dem Vorquartal — oder mehr — und Fortune-500-Unternehmen auf der ganzen Welt Zahlungen, Halbleiter, Telekommunikation, Sicherheit, Chipherstellung, Pharma, Gesundheitswesen und Dateninfrastruktur vertrauten TrueFoundry bei der Stromversorgung ihrer Produkte kritischste Agentenanwendungen in Produktionsqualität. Schauen wir uns die wichtigsten Themen des Jahres genauer an.
Thema 1: AI Gateway
Warum das 2025 wichtig war
Eines der prägendsten Themen des Jahres 2025 war der rasante Anstieg der KI-Gateway als Kernstück der KI-Infrastruktur von Unternehmen. Allein in den letzten Monaten ist die inhärente Nachfrage nach KI-Gateways sprunghaft angestiegen. Heute, ungefähr 10% der Unternehmen nutzen aktiv ein Gateway, und in den nächsten drei Jahren wird dies voraussichtlich auf fast 70%. Was einst als optionale Infrastruktur angesehen wurde, wurde schnell zu einer grundlegenden Infrastruktur.
Die Annahme, die kaputt ging
Diese Veränderung ist darauf zurückzuführen, dass die Branche — einschließlich uns — das Problem unterschätzt hat. Anfänglich ging man davon aus, dass Gateways dünne, undifferenzierte Proxyschichten sind, die sich im kritischen Pfad von LLM-Anfragen befinden und am besten intern gebaut werden sollten. Die Realität hat das Gegenteil bewiesen.
Als Unternehmen von Experimenten zur Produktion übergingen, wurde das Gateway zu einer äußerst komplexen Kontrollebene — eine, die sich ständig ändernde Modell-APIs, zentralisierte organisatorische Kontrollen, Sicherheitsrichtlinien, Governance, Beobachtbarkeit und Zuverlässigkeit in großem Maßstab bewältigen muss.
Wir haben diesen Wandel aus erster Hand miterlebt, als Kunden innerhalb weniger Monate von „wir werden niemals ein externes Gateway verwenden“ dazu übergingen, ihre wichtigsten Produktionsanwendungen über unsere zu betreiben.
Warum die Komplexität immer größer wurde
Gleichzeitig erweiterte sich der Umfang dessen, was regiert werden musste, dramatisch. Der LLM-Zugang allein reichte nicht mehr aus. Als MCP an Bedeutung gewann, hatten Unternehmen Probleme mit der Authentifizierung und Autorisierung auf einer wachsenden Anzahl von Servern — was diese Verantwortung natürlich auf das Gateway verlagerte. Als sich die Agent-zu-Agent-Interaktionen (A2A) abzuzeichnen begannen, wurde klar, dass die Agenten selbst über dieselbe Steuerungsebene miteinander verbunden, beobachtet und gesteuert werden mussten. Die logische Entwicklung folgte: LLM-Gateway → MCP-Gateway → Agenten-Gateway, was in dem gipfelt, was wir heute nennen KI-Gateway.
Wie wir heute darüber denken
Heute denken wir klar und einfach darüber nach. TrueFoundry bietet ein KI-Gateway für Unternehmen, das ein LLM Gateway, MCP Gateway und Agent Gateway umfasst und es Unternehmen ermöglicht, agentische KI-Workloads anbieterübergreifend von einer einzigen Steuerungsebene aus zu verbinden, zu beobachten und zu steuern. Unser KI-Gateway hilft Unternehmen dabei, sicher, effizient und zukunftssicher zu bleiben und gleichzeitig zunehmend autonome Systeme aufzubauen — unabhängig davon, ob sie als SaaS, vor Ort oder in Air-Gap-Umgebungen eingesetzt werden.
Als das KI-Gateway zur Steuerungsebene für die Steuerung agentischer Systeme wurde, wurde eine weitere Realität deutlich. KI zu verbinden, zu beobachten und zu steuern war nur ein Teil der Gleichung. Unternehmen brauchten außerdem eine zuverlässige, unternehmensnative Methode zum Betrieb dieser Systeme in der Produktion — auf der Infrastruktur, der sie bereits vertraut haben. Dies führte natürlich zu unserem zweiten Thema für 2025.
Thema 2: KI-Einsatz
Integration agentischer Systeme in den Unternehmens-Stack
Als das Agenten-Ökosystem explodierte, benötigten Unternehmen eine zuverlässige Ausführungsebene, um dieses schnelllebige, oft chaotische Ökosystem auf einer vertrauten und vertrauenswürdigen Infrastruktur ausführen zu können. AI Deploy ist diese Ausführungsebene, die es Teams ermöglicht, Modellinferenz, LLM-Feinabstimmung, MCP-Server und -Agenten als Standard-Kubernetes-Anwendungen bereitzustellen — direkt auf vorhandenen Unternehmens-Stacks.
- Läuft auf Kubernetes, wo Unternehmens-Workloads bereits aktiv sind
- Lässt sich nahtlos in bestehende Observability-, RBAC- und SSO-Systeme integrieren
- Behandelt KI-Workloads wie erstklassige Produktionsdienstleistungen, nicht wie Experimente
Konzipiert für eine souveräne, hybride Multi-Cloud-Welt
2025 markierte auch einen starken Wandel hin Souveräne KI. Datenspeicherung, Geopatriierung und kosteneffiziente KI-Workloads, die in internen Rechenzentren ausgeführt werden, gewannen zunehmend an Bedeutung.
- On-Prem- und VPC-First-Bereitstellungen
- Hybrid- und Multi-Cloud-Workloads als Standard, nicht als Ausnahme
- Kostenoptimale Skalierung auf unternehmenseigener Infrastruktur
AI Deploy ermöglichte die Einführung modernster Agentensysteme, ohne die Einschränkungen des Unternehmens aufzugeben.
UI-nativ, von Grund auf Code an erster Stelle
Ein anderes Muster wurde deutlich: Unternehmen brauchten Einfachheit ohne Kontrollverlust.
- UI-Native Workflows für schnellere Iteration und breitere Akzeptanz
- Code-First-Flexibilität für erweiterte Anpassungen und komplexe Anwendungsfälle
- Einfache Benutzeroberflächen für Geschäftsanwender mit voller Pro-Code-Leistung für Ingenieure
AI Deploy wurde zur Ausführungsebene, die es den Agentensystemen ermöglichte, vom Konzept zur Produktion überzugehen — sauber, sicher und skalierbar.
Thema 3: Unternehmensergebnisse
Als das AI Gateway zur Steuerungsebene für Unternehmens-KI wurde und AI Deploy es ermöglichte, agentische Workloads auf bestehenden Unternehmens-Stacks auszuführen, wurde eines klar: Infrastruktur allein reicht nicht aus. Unternehmen fragten nicht nur wie um Agentensysteme zu bauen — sie standen unter Leistungsdruck echte Geschäftsergebnisse, oft unter engen Zeitvorgaben und strenger behördlicher Kontrolle. Infolgedessen verdoppelten wir unsere Strategie für Unternehmensergebnisse.
Vom Experiment zur Strategie
Was 2024 als Experiment begann, wurde 2025 zu einer umfassenden Strategie. Wir haben ein engagiertes Führungsteam für die Leitung zusammengestellt Ergebnisse für Unternehmen als Unternehmen und erweiterte unser Team von GenAI-Forschern, um bei ihren wichtigsten KI-Initiativen eng mit Kunden zusammenzuarbeiten.
Gemeinsames Entwickeln realer Anwendungen
Im Rahmen von Enterprise Outcomes haben wir gemeinsam branchenprägende, produktionstaugliche Agentenanwendungen in allen Bereichen entwickelt Gesundheitswesen, Halbleiter, Finanzdienstleistungen und Telekommunikation — konzentrierte sich nicht auf Demos oder Pilotprojekte, sondern auf messbare Auswirkungen auf das Geschäft.
Eine Verbindungsschleife mit der Plattform
Wir beobachteten auch, wie ein starkes Schwungrad Gestalt annahm. Da immer mehr Anwendungsfälle über Enterprise Outcomes in die Produktion übergingen, wurde die Akzeptanz unserer Bereitstellungsplattform immer weiter vorangetrieben. Und je mehr Teile der Plattform bereitgestellt wurden, desto einfacher wurde es, neue Anwendungsfälle zu erstellen und zu skalieren. Beide verstärkten sich gegenseitig und führten zu einer sich verschärfenden Expansionsschleife, die unsere Zusammenarbeit mit Unternehmen im Jahr 2025 definierte.
Ende 2025 waren AI Gateway, AI Deploy und Enterprise Outcomes zu einem einzigen Operating Stack zusammengeführt — einem, der Agentic Systeme verbindet und steuert, sie auf Unternehmensebene ausführt und intelligente Funktionen in reale Ergebnisse umwandelt.
Marktanziehung: Als die Plattform anfing, sich selbst zu verkaufen
Eines der deutlichsten Signale dafür, dass dieser Stack Anklang fand, kam vom Markt selbst. Im Laufe des Jahres 2025 verzeichneten wir einen starken Sog von Unternehmen — sowohl in Bezug auf das Volumen als auch in Bezug auf die Dringlichkeit.
- Die Geschwindigkeit der Geschäftsabschlüsse wurde erheblich verbessert, da mehrere Unternehmensgeschäfte innerhalb von Ende zu Ende abgeschlossen wurden zwei Monate
- Mehrere POCs wechselten vom Kickoff zur Produktion in Tage, nicht Wochen
- In einigen Fällen sind die Kunden vorangekommen ganz ohne POC, angetrieben durch klare Werte und Vertrauen in die Plattform
Diese Dynamik spiegelte sich direkt in unseren Zahlen wider: starkes Umsatzwachstum gegenüber dem Vorquartal, schnellere Verkaufszyklen und eine wachsende Liste neuer Unternehmenslogos. Was einst eine intensive Ausbildung erforderte, wurde zunehmend zu einem Gespräch über wie schnell Kunden könnten mit der Produktion beginnen.
Hinter dieser Dynamik stand ein Team, das mit Zielstrebigkeit, Eigenverantwortung und Überzeugung skalierte.
Das Team hinter dem Momentum
Eines der Dinge, auf die ich bei TrueFoundry am meisten stolz bin, ist, dass das Team von Anfang an fest an die Mission geglaubt hat und zusammen mit dem Unternehmen gewachsen ist. Als sich die Größe des Teams im Jahr 2025 verdreifachte — in den Bereichen Vertrieb, Marketing, Unternehmensergebnisse und Technik — spielte diese frühe Gruppe eine große Rolle bei der Gestaltung der Unternehmenskultur und der Aufnahme neuer Teammitglieder. Mitte des Jahres hatten wir die Gelegenheit, außerhalb des Unternehmens auf den Malediven zu einem wirklich besonderen Team zusammenzukommen. Ein paar Augenblicke davon teilen wir hier.


2025 war der Moment, in dem unsere Vision, Umsetzung und Marktanziehung aufeinander abgestimmt waren und jahrelange Vorbereitungen in eine anhaltende Vorwärtsdynamik verwandelt wurden.
Ausblick und Begrüßung des Jahres 2026
Mit Blick auf das Jahr 2026 gibt uns eine Überzeugung weiterhin die Richtung vor: KI-Systeme werden zunehmend von KI verwaltet. Der Mensch wird in der Abstraktionsebene aufsteigen — von der Bedienung jedes einzelnen Schritts eines Systems bis hin zur Definition von Absicht, Einschränkungen und Ergebnissen —, während intelligente Systeme die Ausführung übernehmen.
Wir sehen zwei strukturelle Veränderungen, die die nächste Generation von Software prägen.
Von der Unterstützung von Entwicklern bis hin zur Unterstützung aller Wissensarbeiter.
Im letzten Jahrzehnt der Softwareentwicklung ging es darum, Entwicklern — einer der mächtigsten Persönlichkeiten im Technologiebereich — durch eine explosionsartige Zunahme von Devtools und SaaS die Möglichkeit zu geben. In den nächsten Jahren wird es um die Stärkung von Kompetenzen gehen jeden Wissensarbeiter. GenAI hat die Möglichkeiten von Software grundlegend erweitert und eine neue Klasse von Systemen hervorgebracht, die es Menschen ermöglichen, komplexe Arbeitsabläufe zu erstellen, zu begründen und zu bedienen, ohne dass sie traditionelle Programmierer sein müssen.
Von Mensch-In-the-Loop bis Mensch-Out-the-Loop.
Wir beginnen, von KI-Systemen, die Menschen unterstützen, zu Systemen überzugehen, die autonom arbeiten. In dieser Welt reagieren Agenten nicht nur — sie planen, erstellen, implementieren und führen durchgängige Workflows aus. Software wird zunehmend gebaut für Agenten, bei dem Menschen die Richtung und die Leitplanken vorgeben, anstatt kontinuierlich einzugreifen.
Zu Beginn des Jahres 2026 ist es unser Ziel, Folgendes zu ermöglichen alle — Menschen und KI-Systeme gleichermaßen — können intelligente Systeme mühelos und optimal über intuitive Rechenschnittstellen erstellen, bereitstellen und skalieren, die sowohl für Menschen als auch für Maschinen konzipiert sind.
Es geht darum, intelligente Systeme zu entwickeln, die wirklich von selbst laufen können — und auf die Teams, die mutig genug sind, sie in die Realität umzusetzen. Wir sind unserem Team, unseren Kunden und Investoren zutiefst dankbar für ihr Vertrauen und ihre Unterstützung, und wir gehen mit Klarheit, Überzeugung und Optimismus ins Jahr 2026.
Die Schwerkraftunterstützung von 2025 gab uns Geschwindigkeit. 2026 ist ungefähr Richtung — und Entfernung. Frohes neues Jahr!
TrueFoundry AI Gateway bietet eine Latenz von ~3—4 ms, verarbeitet mehr als 350 RPS auf einer vCPU, skaliert problemlos horizontal und ist produktionsbereit, während LiteLM unter einer hohen Latenz leidet, mit moderaten RPS zu kämpfen hat, keine integrierte Skalierung hat und sich am besten für leichte Workloads oder Prototyp-Workloads eignet.
Der schnellste Weg, deine KI zu entwickeln, zu steuern und zu skalieren











.png)




.png)






.webp)

.webp)



