Blank white background with no objects or features visible.

Werden Sie Teil unseres VAR- und VAD-Ökosystems – und ermöglichen Sie die Governance von Unternehmens-KI über LLMs, MCPs und Agents hinweg. Read →

Sichere Bereitstellung: VPC, On-Prem, Air-Gapped

KI-Gateway für Unternehmen mit integrierter Steuerung und Überwachung

A unified AI gateway to securely manage and govern AI across 1600+ models with policy control, real-time monitoring, and up to 30% cost reduction.

Maßstabsgetreu für künstliche Intelligenz in der realen Welt gemacht

99,99%

Betriebszeit

Zentralisierte Failovers, Routing und Leitplanken stellen sicher, dass Ihre KI-Apps online bleiben, auch wenn Modellanbieter dies nicht tun.

10 B+

Bearbeitete Anfragen/Monat

Skalierbare Inferenz mit hohem Durchsatz für Produktions-KI.

30%

Optimierung der Durchschnittskosten

Intelligentes Routing, Batching und Budgetkontrollen reduzieren die Verschwendung von Tokens.

1600+

Models

Connected through one AI gateway.

AI Gateway: Einheitlicher LLM-API-Zugriff

Vereinfachen Sie Ihren GenAI-Stack mit einem einzigen AI-Gateway, das alle wichtigen Modelle integriert.

  • Stellen Sie über eine AI Gateway-API eine Verbindung zu OpenAI, Claude, Gemini, Groq, Mistral und über 250 LLMs her
  • Verwenden Sie das AI Gateway, um Modelltypen wie Chat, Vervollständigung, Einbettung und Neubewertung zu unterstützen
  • Zentralisieren Sie die API-Schlüsselverwaltung und die Teamauthentifizierung an einem Ort.
  • Orchestrieren Sie Workloads mit mehreren Modellen nahtlos über Ihre Infrastruktur.
Mehr lesen
pfeil1
KI-Gateway für Unternehmen mit einheitlichem LLM-API-Zugriff

KI-Gateway-Beobachtbarkeit

  • Überwachen Sie die Token-Nutzung, Latenz, Fehlerraten und Anforderungsvolumen in Ihrem gesamten System.
  • Speichern und überprüfen Sie die vollständigen Anforderungs-/Antwortprotokolle zentral, um die Einhaltung der Vorschriften sicherzustellen und das Debuggen zu vereinfachen.
  • Taggen Sie den Traffic mit Metadaten wie Benutzer-ID, Team oder Umgebung, um detaillierte Einblicke zu erhalten.
  • Filtern Sie Protokolle und Metriken nach Modell, Team oder Region, um schnell die Ursachen zu ermitteln und die Problembehebung zu beschleunigen.
Mehr lesen
pfeil1
Truefoundry AI Gateway Observability-Dashboard

Kontingent- und Zugriffskontrolle über AI Gateway

Setzen Sie die Unternehmensführung durch, kontrollieren Sie die Kosten und reduzieren Sie Risiken durch ein konsistentes Policy-Management.

  • Wenden Sie Ratenlimits pro Benutzer, Dienst oder Endpunkt an.
  • Legen Sie mithilfe von Metadatenfiltern kosten- oder tokenbasierte Kontingente fest.
  • Verwenden Sie die rollenbasierte Zugriffskontrolle (RBAC), um die Nutzung zu isolieren und zu verwalten.
  • Steuern Sie Servicekonten und Agenten-Workloads nach Bedarf mithilfe zentralisierter Regeln.
Mehr lesen
pfeil1
AI-Gateway-Kontingent und Zugriffskontrolle
Sicherstellung vorhersehbare Nutzung, starke Zugriffsgrenzen und skalierbare Governance auf Teamebene für Ihre GenAI-Infrastruktur.

Inferenz mit niedriger Latenz

Führen Sie Ihre leistungsstärksten Workloads über eine Hochgeschwindigkeitsinfrastruktur aus.

  • Erzielen Sie eine interne Latenz von unter 3 ms, selbst bei Workloads auf Unternehmensebene.
  • Skalieren Sie nahtlos, um Burst-Traffic und Workloads mit hohem Durchsatz zu verwalten.
  • Sorgen Sie für vorhersehbare Reaktionszeiten für Chat-, RAG- und KI-Assistenten in Echtzeit.
  • Platzieren Sie Bereitstellungen in der Nähe von Inferenzschichten, um die Latenz zu minimieren und Netzwerkverzögerungen zu vermeiden.
Mehr lesen
pfeil1
KI-Gateway-Infrastruktur
Platzieren Sie das AI Gateway direkt in Ihrem Produktions-Inferenzpfad — Seine Architektur mit niedriger Latenz gewährleistet keine Leistungseinbußen.

AI-Gateway-Routing und Fallbacks

Sorgen Sie mit intelligenten AI Gateway-Verkehrskontrollen für Zuverlässigkeit auch bei Modellausfällen.

  • Unterstützt latenzbasiertes Routing zum schnellsten verfügbaren LLM.
  • Verteilen Sie den Verkehr intelligent mithilfe des gewichteten Lastenausgleichs, um Zuverlässigkeit und Skalierbarkeit zu gewährleisten.
  • Automatisches Fallback auf sekundäre Modelle, wenn eine Anfrage fehlschlägt.
  • Verwenden Sie geobewusstes Routing, um die regionalen Compliance- und Verfügbarkeitsanforderungen zu erfüllen.
Mehr lesen
pfeil1
AI-Gateway-Ratenbegrenzung
Dieses System garantiert Ihnen geh niemals offline, auch wenn einzelne Models gegenüberstehen Ausfallzeiten oder Latenzspitzen.

Stellen Sie selbst gehostete Modelle bereit

Stellen Sie Open-Source-Modelle mit voller Kontrolle zur Verfügung.

  • Stellen Sie LLama, Mistral, Falcon und mehr ohne SDK-Änderungen bereit.
  • Volle Kompatibilität mit vLLM, sGLang, KServe und Triton.
  • Optimieren Sie den Betrieb mit Helm-basierter Verwaltung von Autoscaling, GPU-Planung und Bereitstellungen
  • Führen Sie Ihre eigenen Modelle in VPC-, Hybrid- oder Air-Gap-Umgebungen aus.
Mehr lesen
pfeil1
Bereitstellung des AI Gateway-Modells

KI-Gateway+MCP-Integration

Unterstützen Sie sichere Agenten-Workflows durch die native MCP-Unterstützung des AI Gateways.

  • Verbinde Unternehmenstools wie Slack, GitHub, Confluence und Datadog.
  • Einfache Registrierung interner MCP-Server mit minimalem Einrichtungsaufwand.
  • Wenden Sie OAuth2-, RBAC- und Metadaten-Richtlinien auf jeden Toolaufruf an.
Mehr lesen
pfeil1
MCP-Integration des KI-Gateways

KI-Gateway-Leitplanken

  • Setzen Sie Ihre eigenen Sicherheitsvorkehrungen nahtlos durch, einschließlich PII-Filterung und Toxizitätserkennung
  • Passen Sie das AI Gateway mit Leitplanken an, die auf Ihre Compliance- und Sicherheitsanforderungen zugeschnitten sind
Mehr lesen
pfeil1
KI-Gateway-Leitplanken

Bereit für Unternehmen

Ihre Daten und Modelle sind sicher untergebracht innerhalb Ihrer Cloud-/On-Prem-Infrastruktur

HIPAA, GDPR, and AICPA SOC compliance badges for data security and privacy regulations standards.
  • Einhaltung von Vorschriften und Sicherheit

    SOC 2-, HIPAA- und DSGVO-Standards um einen robusten Datenschutz zu gewährleisten
  • Verwaltung und Zugriffskontrolle

    SSO + Rollenbasierte Zugriffskontrolle (RBAC) und Auditprotokollierung
  • Support und Zuverlässigkeit für Unternehmen

    Support rund um die Uhr mit SLA-Unterstützung Antwort-SLAs
Stellen Sie TrueFoundry in jeder Umgebung bereit

VPC, vor Ort, Airgapped oder über mehrere Clouds hinweg.

Keine Daten verlassen Ihre Domain. Genießen Sie vollständige Souveränität, Isolierung und Compliance auf Unternehmensebene, wo auch immer TrueFoundry ausgeführt wird

Cloud computing multi-cloud infrastructure with AWS, Google Cloud, Azure, and secure isolated network connections.

Echte Ergebnisse bei TrueFoundry

Warum sich Unternehmen für TrueFoundry entscheiden

Multicolored wavy lines in blue, purple, pink hues on white background, stacked horizontally.
Automation Anywhere logo featuring stylized letter A in orange and yellow hues on white background.
Siemens Healthineers logo with orange dots on a white background, featuring teal and orange text.
Geometric pink and magenta shapes forming a logo with multiple triangular sections and gradient colors.
Smiling man in black blazer and white shirt with short dark hair and blurred greenery background.
Pratik Agarwal
Leitender Direktor, Datenwissenschaft und KI-Innovation

Das AI Gateway von TrueFoundry bot uns eine einheitliche Ebene für die teamübergreifende Verwaltung von Modellzugriff, Routing, Leitplanken und Kostenkontrollen. Was früher mehrere benutzerdefinierte Integrationen und Sicherheitsüberprüfungen erforderte, erfolgt jetzt über eine einzige gesteuerte Oberfläche. Das hat die Produktion beschleunigt, den Überblick über Ausgaben und Leistung verbessert und es uns ermöglicht, KI-Experimente im gesamten Unternehmen sicher zu skalieren.

Smiling man with short dark hair and glasses wearing a collared shirt and sweater indoors.
Vibhas Geji
Mitarbeiter ML Engineer

Mit dem AI Gateway von TrueFoundry haben wir endlich eine einheitliche Schnittstelle für alle Modellanbieter, Richtlinien und Telemetrie. Damit entfällt der Aufwand für die Verwaltung von Schlüsseln, Routing-Logik und verstreuter Beobachtbarkeit. Die Einführung neuer Modelle ist jetzt nur noch Konfiguration. Das Gateway hat die Geschwindigkeit der Entwickler verbessert, die Belastung durch DevOps reduziert und uns geholfen, Systeme mit mehreren Modellen zu betreiben, die Einblicke und Governance in Echtzeit bieten.

Smiling man with beard and mustache wearing blue shirt and gray blazer against white background.
Indronel G.
Intelligenter Prozessführer

Das AI Gateway von TrueFoundry standardisierte, wie jedes Team mit LLMs, Embeddings und RAG-Komponenten interagiert. Anstatt verstreuter Integrationen kontrollieren wir jetzt den Zugriff, die Routing-Richtlinien und die Sicherheitsvorkehrungen zentral. Die Möglichkeit, Kosten oder Latenz zu optimieren, ohne die Anwendungen zu ändern, hat die Spielregeln verändert. Dadurch ist unsere KI-Architektur sauberer, sicherer und viel einfacher skalierbar geworden.

Young man with short dark hair and neutral expression in circular frame.
Nilav Ghosh
Leitender Direktor, KI

Das AI Gateway von TrueFoundry ist zu unserer Kontrollebene für eine sichere, kontrollierte KI-Einführung geworden. Es konsolidiert Sicherheits-, Beobachtbarkeits- und Modellnutzungsrichtlinien an einem Ort und bietet uns so einen vollständigen Überblick über Leistung und Ausgaben. Entwickler erhalten eine einheitliche Oberfläche für alle Clouds und Modelle, während die Unternehmensleitung für Governance und Berechenbarkeit sorgt. Es hat die Reibungsverluste bei der Skalierung von KI in Unternehmen deutlich reduziert.

Häufig gestellte Fragen

Was ist ein KI-Gateway?

Ein AI Gateway ist eine spezialisierte Middleware-Plattform, die entwickelt wurde, um die Integration, Verwaltung und Bereitstellung von Modellen und Diensten für künstliche Intelligenz (KI) innerhalb der IT-Infrastruktur eines Unternehmens zu erleichtern. Es fungiert als Brücke zwischen KI-Systemen wie großen Sprachmodellen (LLMs) wie GPT von OpenAI oder Claude von Anthropic und Endbenutzeranwendungen und gewährleistet eine effiziente und sichere Kommunikation.

Wie funktioniert ein KI-Gateway?

Eine KI-Gateway-Lösung befindet sich zwischen Ihren Anwendungen und Modellanbietern. Das TrueFoundry-Gateway leitet Anfragen intelligent weiter, verarbeitet die Authentifizierung und verwaltet Failovers, um sicherzustellen, dass Ihr System eine zuverlässige, schnelle Konnektivität mit jedem zugrunde liegenden Modell oder Tool Ihrer Wahl beibehält.

Was sind die Vorteile eines KI-Gateways?

Ein KI-Gateway bietet eine zentrale Plattform für die Verwaltung und Optimierung von KI-Diensten. Es bietet eine einheitliche Schnittstelle zur Verbindung mehrerer KI-Modelle, sorgt für Sicherheit durch Authentifizierung und Zugriffskontrollen und gewährleistet die Einhaltung gesetzlicher Vorschriften. Das Gateway bietet Nutzungsüberwachung, Budgetmanagement und intelligenten Lastausgleich, um eine optimale Leistung und Zuverlässigkeit zu gewährleisten. Es unterstützt die Durchsetzung von Richtlinien in Bezug auf Datennutzung und ethische Überlegungen und ermöglicht gleichzeitig eine horizontale Skalierung, um der wachsenden Nachfrage gerecht zu werden und neue KI-Dienste nahtlos zu integrieren.

Was sind die Funktionen von KI-Gateways?

KI-Gateways bieten einheitlichen Zugriff und intelligentes Routing über mehrere Modelle hinweg mit integrierten Fallbacks. Das TrueFoundry KI-Gateway hilft beispielsweise bei der Verwaltung und Sicherheit durch Authentifizierung, Zugriffskontrolle und Durchsetzung von Richtlinien, bei der Kostenoptimierung durch Ratenbegrenzung und Token-Budgetierung, bei voller Beobachtbarkeit durch Nutzungsverfolgung und Leistungsüberwachung sowie bei der Unterstützung agentischer Workflows mit mehrstufiger Orchestrierung. Sie dienen als zentrale Steuerungsebene und ermöglichen es Unternehmen, KI sicher und kostengünstig in großem Maßstab zu operationalisieren.

Welches KI-Gateway ist das beste?

Das TrueFoundry AI-Gateway ist das beste. Es bietet eine umfassende Bereitstellung und Verwaltung von KI-Diensten mit Sicherheit auf Unternehmensebene durch RBAC, OAuth 2.0 und API-Schlüsselauthentifizierung. Es bietet Ratenbegrenzung, intelligenten Lastausgleich und automatisches Failover für optimale Leistung und Zuverlässigkeit. Integrierte Schutzmaßnahmen setzen ethische Richtlinien durch und verhindern unangemessene Ergebnisse, während Observability-Tools Analysen, Protokolle und zeitnahe Optimierungen ermöglichen. Mit Multi-Cloud-Unterstützung und Echtzeit-Inferenzfunktionen bietet TrueFoundry eine flexible und skalierbare Lösung für den Einsatz von KI in Unternehmen.

Was ist der Unterschied zwischen einem API-Gateway und einem AI-Gateway?

Während Standard-Gateways den allgemeinen Webverkehr weiterleiten, wurde ein TrueFoundry Enterprise KI-Gateway speziell für LLMs entwickelt. Es erledigt bestimmte Aufgaben wie Token-Zählen, Prompt-Caching und Modell-Fallbacks — spezielle Logik, die generische API-Gateways einfach nicht effizient ausführen können.

Wo befindet sich ein KI-Gateway in der GenAI-Architektur?

Ein KI-Gateway befindet sich direkt im Produktionsinferenzpfad zwischen Anwendungen und Modellanbietern. Es fungiert als zentrale Steuerungsebene, die Routing, Governance, Beobachtbarkeit, Sicherheit und Kostenkontrollen für LLMs, Tools und Agenten verwaltet, ohne dass Änderungen an der Anwendungslogik erforderlich sind.

Kann ein KI-Gateway mit selbst gehosteten und Open-Source-Modellen verwendet werden?

Ja. Ein KI-Gateway für Unternehmen unterstützt sowohl gehostete Modelle als auch selbst gehostete oder Open-Source-Modelle wie LLama oder Mistral. Diese Modelle können in VPC-, lokalen, Hybrid- oder Air-Gap-Umgebungen ausgeführt werden und verwenden dabei dieselben Richtlinien, Steuerungen und Beobachtbarkeit wie gehostete Modelle.

Wie hilft ein KI-Gateway dabei, die Inferenzkosten zu kontrollieren und zu optimieren?

Ein KI-Gateway bietet Nutzungstransparenz in Echtzeit, Tracking auf Token-Ebene, Kontingente und Budgetdurchsetzung. Es ermöglicht auch intelligente Routing-, Caching- und Fallback-Strategien, um unnötige Aufrufe teurer Modelle zu reduzieren und unkontrollierbare Ausgaben für Inferenzen zu vermeiden.

Wie hilft ein KI-Gateway beim Datenschutz und bei der Einhaltung von Vorschriften?

KI-Gateways setzen Datenverarbeitungsrichtlinien wie PII-Maskierung, Anforderungsfilterung und kontrollierte Protokollierung durch. Wenn sie in VPC-, lokalen oder Air-Gap-Umgebungen eingesetzt werden, stellen sie sicher, dass sensible Daten niemals die Unternehmensgrenzen verlassen und gleichzeitig die Compliance-Anforderungen erfüllen.

Wie unterstützt ein KI-Gateway mehrere Teams und Umgebungen?

KI-Gateways ermöglichen die Isolierung auf Teamebene mithilfe von rollenbasierter Zugriffskontrolle (RBAC), API-Schlüsseln pro Team, Kontingenten und Nutzungsverfolgung. Auf diese Weise können mehrere Teams Modelle und Infrastruktur sicher gemeinsam nutzen und gleichzeitig die Unternehmensführung, die Rechenschaftspflicht und die Kostentransparenz aufrechterhalten.

Wie hilft der TrueFoundry AI Gateway Playground Entwicklern beim Entwickeln und Testen?

Der Playground ist die interaktive Benutzeroberfläche auf dem AI Gateway, auf der Entwickler verschiedene LLMs, Prompts, MCP-Tools und Konfigurationen ausprobieren können, bevor sie sie in Anwendungen integrieren. Sie können auf der Registerkarte „Modelle“ jedes Modell auswählen, das integriert wurde, Parameter wie Temperatur, maximale Tokens, Streaming- und Stoppsequenzen anpassen und sofort sehen, wie sich dies auf Antworten, Token-Nutzung und Latenz auswirkt. Das macht es einfach, mit Modelloptionen und Generierungseinstellungen zu experimentieren, ohne Code schreiben zu müssen.

Sobald Sie mit einem Setup zufrieden sind, kann die gesamte Konfiguration — Eingabeaufforderung, Modell, Tools, Leitplanken und strukturiertes Ausgabeschema — als wiederverwendbare Vorlage in einem gemeinsamen Repository gespeichert werden. Der Playground generiert mithilfe der vereinheitlichten AI Gateway-API auch gebrauchsfertige Codefragmente für den OpenAI-Client, LangChain und andere Bibliotheken, sodass Teams ein funktionierendes Experiment durchführen und es mit minimalem Aufwand direkt in ihre Dienste einfügen können.

Was bedeutet „einheitlicher Zugriff“ für APIs, Schlüssel, Tools und Agenten?

Mit TrueFoundry AI Gateway befinden sich alle Modellanbieter und Tools hinter einer einzigen, einheitlichen API. Anstatt separate SDKs, Endpunkte und Schlüssel für OpenAI, Anthropic, Bedrock, selbst gehostete Modelle und andere zu verwalten, kommunizieren Anwendungen mit einem Gateway-Endpunkt und verwenden einen Gateway-Schlüssel. Das Gateway leitet dann Anfragen je nach Konfiguration an das richtige zugrunde liegende Modell weiter, sodass Sie Modelle oder Anbieter austauschen können, ohne Ihren Anwendungscode zu ändern. Diese einheitliche Zugriffsebene erstreckt sich auch auf Tools über das MCP-Protokoll und auf Agenten über das neue A2A-Protokoll, sodass Modelle, Tools und Agenten alle über dieselbe Steuerungsebene orchestriert werden können.

Für Entwickler bedeutet dies eine einfachere Integration und ein saubereres Sicherheitsmodell: Provider-Schlüssel werden einmal im Gateway gespeichert, der Zugriff wird zentral mithilfe von RBAC und Richtlinien gesteuert, und Teams können ein einheitliches Client-Muster für alle Sprachen und Frameworks standardisieren. Sobald neue Modelle oder Anbieter auf den Markt kommen, können sie dem Gateway hinzugefügt werden und sind sofort hinter derselben einheitlichen Oberfläche verfügbar.

Wie arbeiten Promptmanagement, Versionierung und Agent-Apps zusammen?

Eingabeaufforderungen, Tools und Agentenkonfigurationen werden im AI Gateway als erstklassige Ressourcen behandelt. Im Playground können Sie Systemaufforderungen, Benutzeraufforderungen, Eingabevariablen, MCP-Tools, Leitplanken und Modelleinstellungen definieren und diese dann als benannte Vorlagen speichern. Jede Vorlage kann mehrere Versionen haben, sodass Teams sicher iterieren können, ohne die Logik der anderen zu überschreiben, und bei Bedarf zu früheren Versionen zurückkehren können. Dies wird effektiv zu einem Repositorium für schnelle und Agentenkonfigurationen für Ihr Unternehmen.

Wenn eine bestimmte Konfiguration bereit ist, in größerem Umfang geteilt zu werden, kann sie als Agenten-App veröffentlicht werden. Agenten-Apps werden über das Gateway bereitgestellt, sind jedoch über eine einfache, geschützte Oberfläche zugänglich: Geschäftsbenutzer oder interne Teams können mit dem Agenten genau so interagieren, wie er in der Produktion ausgeführt wird, während die zugrundeliegenden Eingabeaufforderungen, Tools und Leitplanken unverändert bleiben. Dadurch eignen sich Agent-Apps ideal für Benutzerakzeptanztests, Stakeholder-Demos und interne Copiloten, da Produkt- und Plattformteams die Kontrolle über die Konfiguration behalten und gleichzeitig anderen eine sichere Möglichkeit bieten, agentische Workflows auszuprobieren.

Wie funktionieren Leitplanken, Sicherheitskontrollen und PII-Kontrollen durchgängig?

Die Leitplanken im TrueFoundry AI Gateway funktionieren sowohl auf den Eingabe- als auch auf den Ausgabepfaden, um eine tiefgreifende Verteidigung zu gewährleisten. Bevor eine Anfrage ein Modell erreicht, können Eingabe-Guerdrails es nach sensiblen Daten wie PII, Aufforderungsmustern oder unzulässigen Themen durchsuchen und die Aufforderung entweder blockieren, redigieren oder transformieren, je nach Ihren Richtlinien. Nachdem das Modell eine Antwort generiert hat, bewerten die Output-Gudrails den Inhalt erneut auf Toxizität, Vorurteile, Halluzinationen, Richtlinienverstöße oder versehentliche Datenlecks und entscheiden, ob die Antwort zurückgegeben, geändert oder abgelehnt wird.

Das Gateway kann in bestehende Sicherheits- und Compliance-Dienste wie OpenAI Moderation, AWS Guardrails, Azure Content Safety und Azure PII Detection integriert werden und unterstützt auch benutzerdefinierte Regeln, die als Konfiguration oder Python-Code geschrieben werden. Da die Leitplanken zentral konfiguriert und auf alle Modelle und Anwendungen, die das AI Gateway durchlaufen, einheitlich angewendet werden, erhalten Sicherheits- und Compliance-Teams eine vorhersehbare Möglichkeit, Unternehmensrichtlinien für die Nutzung von GenAI durchzusetzen, auch in regulierten Umgebungen wie Gesundheitswesen, Finanzdienstleistungen und Versicherungen.

Welche Beobachtungs-, Tracing- und Debugging-Funktionen bietet das AI Gateway?

Jede Anfrage, die das TrueFoundry AI Gateway durchläuft, ist instrumentiert, sodass Sie genau sehen können, wie sich Ihre GenAI-Workloads verhalten. Die Überwachungsansichten zeigen aggregierte Kennzahlen wie Gesamtzahl der Anfragen, Eingabe- und Ausgabe-Tokens sowie Kosten, aufgeschlüsselt nach Modell, Team, Benutzer, Kunde, Umgebung oder anderen Metadaten, die Sie anhängen möchten. Die Leistung wird anhand der P99-, P90- und P50-Latenz, der Zeit bis zum ersten Token und der Latenz zwischen den einzelnen Token verfolgt, sodass Sie Modelle oder Routen, die zu Verlangsamungen oder Fehlern führen, schnell identifizieren können.

Für ein tieferes Debugging gibt es eine Ansicht auf Anforderungsebene, in der Sie einzelne Anrufe überprüfen, die vollständige Aufforderung und Antwort sehen und nachvollziehen können, wie Routing, Fallbacks und Guardrails angewendet wurden. Bei agentischen Workflows, die Tools und MCP verwenden, kann das Gateway Traces erfassen, aus denen hervorgeht, welche Schritte ein Agent unternommen hat, welche Tools er aufgerufen hat und wie die Zwischenergebnisse das System durchliefen. All diese Logs und Metriken werden auch über APIs bereitgestellt, sodass Plattform- und Observability-Teams benutzerdefinierte Dashboards und Warnmeldungen in ihren vorhandenen Monitoring-Stacks erstellen können.

Wie werden Richtlinien, Ratenlimits, Fallbacks und Budgets konfiguriert und automatisiert?

Mit dem AI Gateway können Sie Zuverlässigkeits- und Governance-Regeln als Konfiguration ausdrücken, sodass sie konsistent und automatisiert angewendet werden können. Ratenlimits können pro Team, Benutzer, Modell, Anwendung oder Umgebung definiert werden, um sicherzustellen, dass kein einzelner Verbraucher die Kapazität ausschöpfen oder zu viel ausgeben kann. Budgets und Kontingente können so festgelegt werden, dass Anfragen je nach Ihren Geschäftsregeln gedrosselt, auf günstigere Modelle herabgestuft oder blockiert werden, wenn die Nutzung bestimmte Schwellenwerte überschreitet. Richtlinien für den Lastenausgleich können den Datenverkehr auf der Grundlage fester Gewichtungen, gemessener Latenz oder Priorität weiterleiten, während Fallback-Ketten die Reihenfolge der Modelle beschreiben, die bei Fehlern oder Timeouts ausprobiert werden.

Alle diese Steuerelemente können über die Benutzeroberfläche verwaltet oder in YAML deklariert und über die TrueFoundry-CLI angewendet werden. Dadurch wird ein GitOps-Workflow ermöglicht, bei dem die Gateway-Konfiguration neben Anwendungscode und Infrastrukturdefinitionen enthalten ist. In Kombination mit Caching, Batching und zentralisierter API-Schlüsselverwaltung ermöglichen diese Funktionen den Plattformteams, das AI Gateway als den einzigen Ort zu betrachten, an dem sie definieren, wie GenAI verwendet werden soll, wie viel ausgegeben werden kann und wie sich Anwendungen bei einem Ausfall verhalten sollen — ohne dass einzelne Anwendungsteams gezwungen werden, diese Bedenken immer wieder neu umzusetzen.
Grey wavy lines on white background, abstract wave pattern with multiple curved lines intersecting smoothly.

GenAI infra- einfach, schneller, günstiger

Mehr als 10 Fortune-500-Unternehmen vertrauen uns

Machen Sie eine kurze Produkttour
Produkttour starten
Produkttour