.webp)
Maßstabsgetreu für künstliche Intelligenz in der realen Welt gemacht
99,99%
Zentralisierte Failovers, Routing und Leitplanken stellen sicher, dass Ihre KI-Apps online bleiben, auch wenn Modellanbieter dies nicht tun.
10 B+
Skalierbare Inferenz mit hohem Durchsatz für Produktions-KI.
30%
Intelligentes Routing, Batching und Budgetkontrollen reduzieren die Verschwendung von Tokens.
1600+
Connected through one AI gateway.
AI Gateway: Einheitlicher LLM-API-Zugriff
Vereinfachen Sie Ihren GenAI-Stack mit einem einzigen AI-Gateway, das alle wichtigen Modelle integriert.
.webp)
- Stellen Sie über eine AI Gateway-API eine Verbindung zu OpenAI, Claude, Gemini, Groq, Mistral und über 250 LLMs her
- Verwenden Sie das AI Gateway, um Modelltypen wie Chat, Vervollständigung, Einbettung und Neubewertung zu unterstützen
- Zentralisieren Sie die API-Schlüsselverwaltung und die Teamauthentifizierung an einem Ort.
- Orchestrieren Sie Workloads mit mehreren Modellen nahtlos über Ihre Infrastruktur.

.webp)
KI-Gateway-Beobachtbarkeit
- Überwachen Sie die Token-Nutzung, Latenz, Fehlerraten und Anforderungsvolumen in Ihrem gesamten System.
- Speichern und überprüfen Sie die vollständigen Anforderungs-/Antwortprotokolle zentral, um die Einhaltung der Vorschriften sicherzustellen und das Debuggen zu vereinfachen.
- Taggen Sie den Traffic mit Metadaten wie Benutzer-ID, Team oder Umgebung, um detaillierte Einblicke zu erhalten.
- Filtern Sie Protokolle und Metriken nach Modell, Team oder Region, um schnell die Ursachen zu ermitteln und die Problembehebung zu beschleunigen.
.webp)
Kontingent- und Zugriffskontrolle über AI Gateway
Setzen Sie die Unternehmensführung durch, kontrollieren Sie die Kosten und reduzieren Sie Risiken durch ein konsistentes Policy-Management.
- Wenden Sie Ratenlimits pro Benutzer, Dienst oder Endpunkt an.
- Legen Sie mithilfe von Metadatenfiltern kosten- oder tokenbasierte Kontingente fest.
- Verwenden Sie die rollenbasierte Zugriffskontrolle (RBAC), um die Nutzung zu isolieren und zu verwalten.
- Steuern Sie Servicekonten und Agenten-Workloads nach Bedarf mithilfe zentralisierter Regeln.

.webp)
Inferenz mit niedriger Latenz
Führen Sie Ihre leistungsstärksten Workloads über eine Hochgeschwindigkeitsinfrastruktur aus.
- Erzielen Sie eine interne Latenz von unter 3 ms, selbst bei Workloads auf Unternehmensebene.
- Skalieren Sie nahtlos, um Burst-Traffic und Workloads mit hohem Durchsatz zu verwalten.
- Sorgen Sie für vorhersehbare Reaktionszeiten für Chat-, RAG- und KI-Assistenten in Echtzeit.
- Platzieren Sie Bereitstellungen in der Nähe von Inferenzschichten, um die Latenz zu minimieren und Netzwerkverzögerungen zu vermeiden.

.webp)
AI-Gateway-Routing und Fallbacks
Sorgen Sie mit intelligenten AI Gateway-Verkehrskontrollen für Zuverlässigkeit auch bei Modellausfällen.
- Unterstützt latenzbasiertes Routing zum schnellsten verfügbaren LLM.
- Verteilen Sie den Verkehr intelligent mithilfe des gewichteten Lastenausgleichs, um Zuverlässigkeit und Skalierbarkeit zu gewährleisten.
- Automatisches Fallback auf sekundäre Modelle, wenn eine Anfrage fehlschlägt.
- Verwenden Sie geobewusstes Routing, um die regionalen Compliance- und Verfügbarkeitsanforderungen zu erfüllen.
.webp)
.webp)
Stellen Sie selbst gehostete Modelle bereit
Stellen Sie Open-Source-Modelle mit voller Kontrolle zur Verfügung.
- Stellen Sie LLama, Mistral, Falcon und mehr ohne SDK-Änderungen bereit.
- Volle Kompatibilität mit vLLM, sGLang, KServe und Triton.
- Optimieren Sie den Betrieb mit Helm-basierter Verwaltung von Autoscaling, GPU-Planung und Bereitstellungen
- Führen Sie Ihre eigenen Modelle in VPC-, Hybrid- oder Air-Gap-Umgebungen aus.

.webp)
KI-Gateway+MCP-Integration
Unterstützen Sie sichere Agenten-Workflows durch die native MCP-Unterstützung des AI Gateways.
- Verbinde Unternehmenstools wie Slack, GitHub, Confluence und Datadog.
- Einfache Registrierung interner MCP-Server mit minimalem Einrichtungsaufwand.
- Wenden Sie OAuth2-, RBAC- und Metadaten-Richtlinien auf jeden Toolaufruf an.

.webp)
KI-Gateway-Leitplanken
- Setzen Sie Ihre eigenen Sicherheitsvorkehrungen nahtlos durch, einschließlich PII-Filterung und Toxizitätserkennung
- Passen Sie das AI Gateway mit Leitplanken an, die auf Ihre Compliance- und Sicherheitsanforderungen zugeschnitten sind

Bereit für Unternehmen
Ihre Daten und Modelle sind sicher untergebracht innerhalb Ihrer Cloud-/On-Prem-Infrastruktur

Einhaltung von Vorschriften und Sicherheit
SOC 2-, HIPAA- und DSGVO-Standards um einen robusten Datenschutz zu gewährleistenVerwaltung und Zugriffskontrolle
SSO + Rollenbasierte Zugriffskontrolle (RBAC) und AuditprotokollierungSupport und Zuverlässigkeit für Unternehmen
Support rund um die Uhr mit SLA-Unterstützung Antwort-SLAs
VPC, vor Ort, Airgapped oder über mehrere Clouds hinweg.
Keine Daten verlassen Ihre Domain. Genießen Sie vollständige Souveränität, Isolierung und Compliance auf Unternehmensebene, wo auch immer TrueFoundry ausgeführt wird

Echte Ergebnisse bei TrueFoundry
Warum sich Unternehmen für TrueFoundry entscheiden
Häufig gestellte Fragen
Was ist ein KI-Gateway?
Wie funktioniert ein KI-Gateway?
Was sind die Vorteile eines KI-Gateways?
Was sind die Funktionen von KI-Gateways?
Welches KI-Gateway ist das beste?
Was ist der Unterschied zwischen einem API-Gateway und einem AI-Gateway?
Wo befindet sich ein KI-Gateway in der GenAI-Architektur?
Kann ein KI-Gateway mit selbst gehosteten und Open-Source-Modellen verwendet werden?
Wie hilft ein KI-Gateway dabei, die Inferenzkosten zu kontrollieren und zu optimieren?
Wie hilft ein KI-Gateway beim Datenschutz und bei der Einhaltung von Vorschriften?
Wie unterstützt ein KI-Gateway mehrere Teams und Umgebungen?
Wie hilft der TrueFoundry AI Gateway Playground Entwicklern beim Entwickeln und Testen?
Sobald Sie mit einem Setup zufrieden sind, kann die gesamte Konfiguration — Eingabeaufforderung, Modell, Tools, Leitplanken und strukturiertes Ausgabeschema — als wiederverwendbare Vorlage in einem gemeinsamen Repository gespeichert werden. Der Playground generiert mithilfe der vereinheitlichten AI Gateway-API auch gebrauchsfertige Codefragmente für den OpenAI-Client, LangChain und andere Bibliotheken, sodass Teams ein funktionierendes Experiment durchführen und es mit minimalem Aufwand direkt in ihre Dienste einfügen können.
Was bedeutet „einheitlicher Zugriff“ für APIs, Schlüssel, Tools und Agenten?
Für Entwickler bedeutet dies eine einfachere Integration und ein saubereres Sicherheitsmodell: Provider-Schlüssel werden einmal im Gateway gespeichert, der Zugriff wird zentral mithilfe von RBAC und Richtlinien gesteuert, und Teams können ein einheitliches Client-Muster für alle Sprachen und Frameworks standardisieren. Sobald neue Modelle oder Anbieter auf den Markt kommen, können sie dem Gateway hinzugefügt werden und sind sofort hinter derselben einheitlichen Oberfläche verfügbar.
Wie arbeiten Promptmanagement, Versionierung und Agent-Apps zusammen?
Wenn eine bestimmte Konfiguration bereit ist, in größerem Umfang geteilt zu werden, kann sie als Agenten-App veröffentlicht werden. Agenten-Apps werden über das Gateway bereitgestellt, sind jedoch über eine einfache, geschützte Oberfläche zugänglich: Geschäftsbenutzer oder interne Teams können mit dem Agenten genau so interagieren, wie er in der Produktion ausgeführt wird, während die zugrundeliegenden Eingabeaufforderungen, Tools und Leitplanken unverändert bleiben. Dadurch eignen sich Agent-Apps ideal für Benutzerakzeptanztests, Stakeholder-Demos und interne Copiloten, da Produkt- und Plattformteams die Kontrolle über die Konfiguration behalten und gleichzeitig anderen eine sichere Möglichkeit bieten, agentische Workflows auszuprobieren.
Wie funktionieren Leitplanken, Sicherheitskontrollen und PII-Kontrollen durchgängig?
Das Gateway kann in bestehende Sicherheits- und Compliance-Dienste wie OpenAI Moderation, AWS Guardrails, Azure Content Safety und Azure PII Detection integriert werden und unterstützt auch benutzerdefinierte Regeln, die als Konfiguration oder Python-Code geschrieben werden. Da die Leitplanken zentral konfiguriert und auf alle Modelle und Anwendungen, die das AI Gateway durchlaufen, einheitlich angewendet werden, erhalten Sicherheits- und Compliance-Teams eine vorhersehbare Möglichkeit, Unternehmensrichtlinien für die Nutzung von GenAI durchzusetzen, auch in regulierten Umgebungen wie Gesundheitswesen, Finanzdienstleistungen und Versicherungen.
Welche Beobachtungs-, Tracing- und Debugging-Funktionen bietet das AI Gateway?
Für ein tieferes Debugging gibt es eine Ansicht auf Anforderungsebene, in der Sie einzelne Anrufe überprüfen, die vollständige Aufforderung und Antwort sehen und nachvollziehen können, wie Routing, Fallbacks und Guardrails angewendet wurden. Bei agentischen Workflows, die Tools und MCP verwenden, kann das Gateway Traces erfassen, aus denen hervorgeht, welche Schritte ein Agent unternommen hat, welche Tools er aufgerufen hat und wie die Zwischenergebnisse das System durchliefen. All diese Logs und Metriken werden auch über APIs bereitgestellt, sodass Plattform- und Observability-Teams benutzerdefinierte Dashboards und Warnmeldungen in ihren vorhandenen Monitoring-Stacks erstellen können.
Wie werden Richtlinien, Ratenlimits, Fallbacks und Budgets konfiguriert und automatisiert?
Alle diese Steuerelemente können über die Benutzeroberfläche verwaltet oder in YAML deklariert und über die TrueFoundry-CLI angewendet werden. Dadurch wird ein GitOps-Workflow ermöglicht, bei dem die Gateway-Konfiguration neben Anwendungscode und Infrastrukturdefinitionen enthalten ist. In Kombination mit Caching, Batching und zentralisierter API-Schlüsselverwaltung ermöglichen diese Funktionen den Plattformteams, das AI Gateway als den einzigen Ort zu betrachten, an dem sie definieren, wie GenAI verwendet werden soll, wie viel ausgegeben werden kann und wie sich Anwendungen bei einem Ausfall verhalten sollen — ohne dass einzelne Anwendungsteams gezwungen werden, diese Bedenken immer wieder neu umzusetzen.

GenAI infra- einfach, schneller, günstiger
Mehr als 10 Fortune-500-Unternehmen vertrauen uns















.webp)
.webp)
.webp)



