How does an AI gateway work?

An AI gateway solution sits between your applications and model providers. The TrueFoundry gateway intelligently routes requests, handles authentication, and manages failovers, ensuring your system maintains reliable, high-speed connectivity with any underlying model or tool you choose.

What are the benefits of an AI gateway?

An AI gateway provides a centralized platform for managing and optimizing AI services. It offers a unified interface to connect multiple AI models, enforces security through authentication and access controls, and ensures regulatory compliance. The gateway features usage monitoring, budget management, and intelligent load balancing to ensure optimal performance and reliability. It supports policy enforcement for data usage and ethical considerations while enabling horizontal scaling to meet growing demand and seamlessly integrate new AI services.

What are the capabilities of AI gateways?

AI gateways provide unified access and intelligent routing across multiple models with built-in fallbacks. For instance, TrueFoundry AI gateway helps with governance and security through authentication, access control, and policy enforcement; cost optimization via rate limiting and token budgeting; full observability with usage tracking and performance monitoring; and support for agentic workflows with multi-step orchestration. They act as a centralized control plane, enabling enterprises to operationalize AI safely and cost-effectively at scale.

Which AI gateway is best?

The TrueFoundry AI gateway is the best. It delivers comprehensive deployment and management of AI services with enterprise-grade security through RBAC, OAuth 2.0, and API key authentication. It features rate limiting, intelligent load balancing, and automatic failover for optimal performance and reliability. Built-in guardrails enforce ethical guidelines and prevent inappropriate outputs, while observability tools provide analytics, logs, and prompt optimization. With multi-cloud support and real-time inference capabilities, TrueFoundry provides a flexible and scalable solution for enterprise AI deployment.

What is the difference between an API gateway and an AI gateway?

While standard gateways route general web traffic, a TrueFoundry enterprise AI gateway is purpose-built for LLMs. It handles specific tasks like token counting, prompt caching, and model fallbacks—specialized logic that generic API gateways simply cannot execute efficiently.

Where does an AI Gateway sit in the GenAI architecture?

An AI Gateway sits directly in the production inference path between applications and model providers. It acts as a centralized control plane that manages routing, governance, observability, security, and cost controls across LLMs, tools, and agents, without requiring changes to application logic.

Can an AI Gateway be used with self-hosted and open-source models?

Yes. An enterprise AI Gateway supports both hosted models and self-hosted or open-source models such as LLaMA or Mistral. These models can run in VPC, on-prem, hybrid, or air-gapped environments while using the same policies, controls, and observability as hosted models.

How does an AI Gateway help control and optimize inference costs?

CAn AI Gateway provides real-time usage visibility, token-level tracking, quotas, and budget enforcement. It also enables intelligent routing, caching, and fallback strategies to reduce unnecessary calls to expensive models and prevent runaway inference spend.

How does an AI Gateway help with data privacy and compliance?

AI Gateways enforce data handling policies such as PII masking, request filtering, and controlled logging. When deployed in VPC, on-prem, or air-gapped environments, they ensure sensitive data never leaves enterprise boundaries while meeting compliance requirements.

How does an AI Gateway support multiple teams and environments?

AI Gateways enable team-level isolation using role-based access control (RBAC), per-team API keys, quotas, and usage tracking. This allows multiple teams to share models and infrastructure securely while maintaining governance, accountability, and cost visibility.

How does the TrueFoundry AI Gateway Playground help developers build and test?

The Playground is the interactive UI on top of the AI Gateway where developers can try out different LLMs, prompts, MCP tools and configurations before wiring them into applications. You can select any model that has been onboarded in the “Models” tab, adjust parameters such as temperature, max tokens, streaming and stop sequences, and immediately see the impact on responses, token usage and latency. This makes it easy to experiment with model choices and generation settings without writing code. Once you are happy with a setup, the entire configuration—prompt, model, tools, guardrails and structured output schema—can be saved as a reusable template in a shared repository. The Playground also generates ready-to-use code snippets for the OpenAI client, LangChain and other libraries, using the unified AI Gateway API, so teams can take a working experiment and drop it straight into their services with minimal effort.

What does “unified access” mean for APIs, keys, tools and agents?

With TrueFoundry AI Gateway, all model providers and tools sit behind a single, unified API. Instead of managing separate SDKs, endpoints and keys for OpenAI, Anthropic, Bedrock, self-hosted models and others, applications talk to one gateway endpoint and use one gateway key. The gateway then routes requests to the right underlying model based on configuration, so you can swap models or providers without changing your application code. This unified access layer also extends to tools via the MCP protocol and to agents via the emerging A2A protocol, so models, tools and agents can all be orchestrated through the same control plane. For developers, this means simpler integration and a cleaner security model: provider keys are stored once in the gateway, access is governed centrally using RBAC and policies, and teams can standardize on a single client pattern across languages and frameworks. As new models or providers appear, they can be added to the gateway and become immediately available behind the same unified interface.

How do prompt management, versioning and Agent Apps work together?

Prompts, tools and agent configurations are treated as first-class assets in the AI Gateway. In the Playground you can define system prompts, user prompts, input variables, MCP tools, guardrails and model settings, and then save them as named templates. Each template can have multiple versions so teams can iterate safely without overwriting each other’s logic, and roll back to previous versions when needed. This effectively becomes a prompt and agent configuration repository for your organization. When a particular configuration is ready to be shared more broadly, it can be published as an Agent App. Agent Apps are powered by the gateway but exposed through a simple, locked-down interface: business users or internal teams can interact with the agent exactly as it will run in production, while the underlying prompts, tools and guardrails remain immutable. This makes Agent Apps ideal for user acceptance testing, stakeholder demos and internal copilots, because product and platform teams retain control over the configuration while still giving others a safe way to try agentic workflows.

How do guardrails, safety checks and PII controls work end-to-end?

Guardrails in TrueFoundry AI Gateway operate on both the input and output paths to provide defense-in-depth. Before a request reaches a model, input guardrails can scan it for sensitive data such as PII, prompt injection patterns or disallowed topics, and either block, redact or transform the prompt based on your policies. After the model generates a response, output guardrails evaluate the content again for toxicity, bias, hallucinations, policy violations or accidental data leakage, and decide whether to return, modify or reject the response. The gateway can plug into existing safety and compliance services such as OpenAI Moderation, AWS Guardrails, Azure Content Safety and Azure PII detection, and it also supports custom rules written as configuration or Python code. Because guardrails are configured centrally and applied consistently across all models and applications going through the AI Gateway, security and compliance teams get a predictable way to enforce organizational policies for GenAI usage, including in regulated environments like healthcare, financial services and insurance.

What observability, tracing and debugging capabilities does the AI Gateway provide?

Every request flowing through TrueFoundry AI Gateway is instrumented so you can see exactly how your GenAI workloads behave. The monitoring views show aggregate metrics such as total requests, input and output tokens, and cost, broken down by model, team, user, customer, environment or any other metadata you choose to attach. Performance is tracked using P99, P90 and P50 latency, time-to-first-token and inter-token latency, so you can quickly identify models or routes that are causing slowdowns or errors. For deeper debugging, there is a request-level view that lets you inspect individual calls, see the full prompt and response, and understand how routing, fallbacks and guardrails were applied. For agentic workflows using tools and MCP, the gateway can capture traces that show each step an agent took, which tools it called, and how intermediate results flowed through the system. All of these logs and metrics are also exposed via APIs, so platform and observability teams can build custom dashboards and alerts in their existing monitoring stacks.

How are policies, rate limits, fallbacks and budgets configured and automated?

The AI Gateway lets you express reliability and governance rules as configuration so they can be applied consistently and automated. Rate limits can be defined per team, user, model, application or environment, ensuring that no single consumer can exhaust capacity or overspend. Budgets and quotas can be set so that when usage crosses certain thresholds, requests are throttled, downgraded to cheaper models or blocked, depending on your business rules. Load-balancing policies can route traffic based on fixed weights, measured latency or priority, while fallback chains describe the sequence of models to try when errors or timeouts occur. All of these controls can be managed through the UI or declared in YAML and applied via the TrueFoundry CLI, enabling a GitOps workflow where gateway configuration lives alongside application code and infrastructure definitions. Combined with caching, batching and centralized API key management, these features allow platform teams to treat the AI Gateway as the single place where they define how GenAI should be used, how much can be spent, and how applications should behave under failure—without forcing individual application teams to re-implement these concerns over and over again.

KI-Gateway für Unternehmen: Integrierte Steuerung und Überwachung

Purple gradient square with white background, shiny surface, and rounded corners in rhombus shape.

Maßstabsgetreu für künstliche Intelligenz in der realen Welt gemacht

99,99%

Betriebszeit

Zentralisierte Failovers, Routing und Leitplanken stellen sicher, dass Ihre KI-Apps online bleiben, auch wenn Modellanbieter dies nicht tun.

10 B+

Bearbeitete Anfragen/Monat

Skalierbare Inferenz mit hohem Durchsatz für Produktions-KI.

30%

Optimierung der Durchschnittskosten

Intelligentes Routing, Batching und Budgetkontrollen reduzieren die Verschwendung von Tokens.

1600+

Models

Connected through one AI gateway.

AI Gateway: Einheitlicher LLM-API-Zugriff

Vereinfachen Sie Ihren GenAI-Stack mit einem einzigen AI-Gateway, das alle wichtigen Modelle integriert.

Stellen Sie über eine AI Gateway-API eine Verbindung zu OpenAI, Claude, Gemini, Groq, Mistral und über 250 LLMs her
Verwenden Sie das AI Gateway, um Modelltypen wie Chat, Vervollständigung, Einbettung und Neubewertung zu unterstützen
Zentralisieren Sie die API-Schlüsselverwaltung und die Teamauthentifizierung an einem Ort.
Orchestrieren Sie Workloads mit mehreren Modellen nahtlos über Ihre Infrastruktur.

KI-Gateway für Unternehmen mit einheitlichem LLM-API-Zugriff

KI-Gateway-Beobachtbarkeit

Track your AI gateway performance, costs, and ensure compliance across models in real-time.

Überwachen Sie die Token-Nutzung, Latenz, Fehlerraten und Anforderungsvolumen in Ihrem gesamten System.
Speichern und überprüfen Sie die vollständigen Anforderungs-/Antwortprotokolle zentral, um die Einhaltung der Vorschriften sicherzustellen und das Debuggen zu vereinfachen.
Taggen Sie den Traffic mit Metadaten wie Benutzer-ID, Team oder Umgebung, um detaillierte Einblicke zu erhalten.
Filtern Sie Protokolle und Metriken nach Modell, Team oder Region, um schnell die Ursachen zu ermitteln und die Problembehebung zu beschleunigen.

Truefoundry AI Gateway Observability-Dashboard

Kontingent- und Zugriffskontrolle über AI Gateway

Setzen Sie die Unternehmensführung durch, kontrollieren Sie die Kosten und reduzieren Sie Risiken durch ein konsistentes Policy-Management.

Wenden Sie Ratenlimits pro Benutzer, Dienst oder Endpunkt an.
Legen Sie mithilfe von Metadatenfiltern kosten- oder tokenbasierte Kontingente fest.
Verwenden Sie die rollenbasierte Zugriffskontrolle (RBAC), um die Nutzung zu isolieren und zu verwalten.
Steuern Sie Servicekonten und Agenten-Workloads nach Bedarf mithilfe zentralisierter Regeln.

AI-Gateway-Kontingent und Zugriffskontrolle

Sicherstellung vorhersehbare Nutzung, starke Zugriffsgrenzen und skalierbare Governance auf Teamebene für Ihre GenAI-Infrastruktur.

Inferenz mit niedriger Latenz

Run your most performance-sensitive workloads through a high-speed AI gateway infrastructure.

Erzielen Sie eine interne Latenz von unter 3 ms, selbst bei Workloads auf Unternehmensebene.
Skalieren Sie nahtlos, um Burst-Traffic und Workloads mit hohem Durchsatz zu verwalten.
Sorgen Sie für vorhersehbare Reaktionszeiten für Chat-, RAG- und KI-Assistenten in Echtzeit.
Platzieren Sie Bereitstellungen in der Nähe von Inferenzschichten, um die Latenz zu minimieren und Netzwerkverzögerungen zu vermeiden.

Platzieren Sie das AI Gateway direkt in Ihrem Produktions-Inferenzpfad — Seine Architektur mit niedriger Latenz gewährleistet keine Leistungseinbußen.

AI-Gateway-Routing und Fallbacks

Sorgen Sie mit intelligenten AI Gateway-Verkehrskontrollen für Zuverlässigkeit auch bei Modellausfällen.

Unterstützt latenzbasiertes Routing zum schnellsten verfügbaren LLM.
Verteilen Sie den Verkehr intelligent mithilfe des gewichteten Lastenausgleichs, um Zuverlässigkeit und Skalierbarkeit zu gewährleisten.
Automatisches Fallback auf sekundäre Modelle, wenn eine Anfrage fehlschlägt.
Verwenden Sie geobewusstes Routing, um die regionalen Compliance- und Verfügbarkeitsanforderungen zu erfüllen.

Dieses System garantiert Ihnen never go offline, even when individual models face downtime or spike in latency.

Stellen Sie selbst gehostete Modelle bereit

Stellen Sie Open-Source-Modelle mit voller Kontrolle zur Verfügung.

Stellen Sie LLama, Mistral, Falcon und mehr ohne SDK-Änderungen bereit.
Volle Kompatibilität mit vLLM, sGLang, KServe und Triton.
Optimieren Sie den Betrieb mit Helm-basierter Verwaltung von Autoscaling, GPU-Planung und Bereitstellungen
Führen Sie Ihre eigenen Modelle in VPC-, Hybrid- oder Air-Gap-Umgebungen aus.

KI-Gateway+MCP-Integration

Unterstützen Sie sichere Agenten-Workflows durch die native MCP-Unterstützung des AI Gateways.

Verbinde Unternehmenstools wie Slack, GitHub, Confluence und Datadog.
Einfache Registrierung interner MCP-Server mit minimalem Einrichtungsaufwand.
Wenden Sie OAuth2-, RBAC- und Metadaten-Richtlinien auf jeden Toolaufruf an.

KI-Gateway-Leitplanken

Build secure AI applications with configurable AI gateway guardrails and policy controls.

Setzen Sie Ihre eigenen Sicherheitsvorkehrungen nahtlos durch, einschließlich PII-Filterung und Toxizitätserkennung
Passen Sie das AI Gateway mit Leitplanken an, die auf Ihre Compliance- und Sicherheitsanforderungen zugeschnitten sind

Bereit für Unternehmen

Stellen Sie ein sicheres KI-Gateway bereit, das Ihre Daten und Modelle innerhalb Ihrer Cloud-/On-Premise-Infrastruktur hält.

HIPAA, GDPR, and AICPA SOC compliance badges for data security and privacy regulations standards.

Einhaltung von Vorschriften und Sicherheit
SOC 2-, HIPAA- und DSGVO-Standards um einen robusten Datenschutz zu gewährleisten
Verwaltung und Zugriffskontrolle
SSO + Rollenbasierte Zugriffskontrolle (RBAC) und Auditprotokollierung
Support und Zuverlässigkeit für Unternehmen
Support rund um die Uhr mit SLA-Unterstützung Antwort-SLAs

Stellen Sie TrueFoundry in jeder Umgebung bereit

VPC, vor Ort, Airgapped oder über mehrere Clouds hinweg.

Keine Daten verlassen Ihre Domain. Genießen Sie vollständige Souveränität, Isolierung und Compliance auf Unternehmensebene, wo auch immer TrueFoundry ausgeführt wird

Fangen Sie an

Cloud computing multi-cloud infrastructure with AWS, Google Cloud, Azure, and secure isolated network connections.

Echte Ergebnisse bei TrueFoundry

Warum sich Unternehmen für TrueFoundry entscheiden

Smiling man in black blazer and white shirt with short dark hair and blurred greenery background.

Pratik Agarwal

Leitender Direktor, Datenwissenschaft und KI-Innovation

Das AI Gateway von TrueFoundry bot uns eine einheitliche Ebene für die teamübergreifende Verwaltung von Modellzugriff, Routing, Leitplanken und Kostenkontrollen. Was früher mehrere benutzerdefinierte Integrationen und Sicherheitsüberprüfungen erforderte, erfolgt jetzt über eine einzige gesteuerte Oberfläche. Das hat die Produktion beschleunigt, den Überblick über Ausgaben und Leistung verbessert und es uns ermöglicht, KI-Experimente im gesamten Unternehmen sicher zu skalieren.

Smiling man with short dark hair and glasses wearing a collared shirt and sweater indoors.

Vibhas Geji

Mitarbeiter ML Engineer

Mit dem AI Gateway von TrueFoundry haben wir endlich eine einheitliche Schnittstelle für alle Modellanbieter, Richtlinien und Telemetrie. Damit entfällt der Aufwand für die Verwaltung von Schlüsseln, Routing-Logik und verstreuter Beobachtbarkeit. Die Einführung neuer Modelle ist jetzt nur noch Konfiguration. Das Gateway hat die Geschwindigkeit der Entwickler verbessert, die Belastung durch DevOps reduziert und uns geholfen, Systeme mit mehreren Modellen zu betreiben, die Einblicke und Governance in Echtzeit bieten.

Smiling man with beard and mustache wearing blue shirt and gray blazer against white background.

Indronel G.

Intelligenter Prozessführer

Das AI Gateway von TrueFoundry standardisierte, wie jedes Team mit LLMs, Embeddings und RAG-Komponenten interagiert. Anstatt verstreuter Integrationen kontrollieren wir jetzt den Zugriff, die Routing-Richtlinien und die Sicherheitsvorkehrungen zentral. Die Möglichkeit, Kosten oder Latenz zu optimieren, ohne die Anwendungen zu ändern, hat die Spielregeln verändert. Dadurch ist unsere KI-Architektur sauberer, sicherer und viel einfacher skalierbar geworden.

Young man with short dark hair and neutral expression in circular frame.

Nilav Ghosh

Leitender Direktor, KI

Das AI Gateway von TrueFoundry ist zu unserer Kontrollebene für eine sichere, kontrollierte KI-Einführung geworden. Es konsolidiert Sicherheits-, Beobachtbarkeits- und Modellnutzungsrichtlinien an einem Ort und bietet uns so einen vollständigen Überblick über Leistung und Ausgaben. Entwickler erhalten eine einheitliche Oberfläche für alle Clouds und Modelle, während die Unternehmensleitung für Governance und Berechenbarkeit sorgt. Es hat die Reibungsverluste bei der Skalierung von KI in Unternehmen deutlich reduziert.

Frequently asked questions

Was ist ein KI-Gateway?

Ein AI Gateway ist eine spezialisierte Middleware-Plattform, die entwickelt wurde, um die Integration, Verwaltung und Bereitstellung von Modellen und Diensten für künstliche Intelligenz (KI) innerhalb der IT-Infrastruktur eines Unternehmens zu erleichtern. Es fungiert als Brücke zwischen KI-Systemen wie großen Sprachmodellen (LLMs) wie GPT von OpenAI oder Claude von Anthropic und Endbenutzeranwendungen und gewährleistet eine effiziente und sichere Kommunikation.

To know more, read our indepth guide on what is an AI gateway.

Wie funktioniert ein KI-Gateway?

Eine KI-Gateway-Lösung befindet sich zwischen Ihren Anwendungen und Modellanbietern. Das TrueFoundry-Gateway leitet Anfragen intelligent weiter, verarbeitet die Authentifizierung und verwaltet Failovers, um sicherzustellen, dass Ihr System eine zuverlässige, schnelle Konnektivität mit jedem zugrunde liegenden Modell oder Tool Ihrer Wahl beibehält.

Was sind die Vorteile eines KI-Gateways?

Ein KI-Gateway bietet eine zentrale Plattform für die Verwaltung und Optimierung von KI-Diensten. Es bietet eine einheitliche Schnittstelle zur Verbindung mehrerer KI-Modelle, sorgt für Sicherheit durch Authentifizierung und Zugriffskontrollen und gewährleistet die Einhaltung gesetzlicher Vorschriften. Das Gateway bietet Nutzungsüberwachung, Budgetmanagement und intelligenten Lastausgleich, um eine optimale Leistung und Zuverlässigkeit zu gewährleisten. Es unterstützt die Durchsetzung von Richtlinien in Bezug auf Datennutzung und ethische Überlegungen und ermöglicht gleichzeitig eine horizontale Skalierung, um der wachsenden Nachfrage gerecht zu werden und neue KI-Dienste nahtlos zu integrieren.

Was sind die Funktionen von KI-Gateways?

KI-Gateways bieten einheitlichen Zugriff und intelligentes Routing über mehrere Modelle hinweg mit integrierten Fallbacks. Das TrueFoundry KI-Gateway hilft beispielsweise bei der Verwaltung und Sicherheit durch Authentifizierung, Zugriffskontrolle und Durchsetzung von Richtlinien, bei der Kostenoptimierung durch Ratenbegrenzung und Token-Budgetierung, bei voller Beobachtbarkeit durch Nutzungsverfolgung und Leistungsüberwachung sowie bei der Unterstützung agentischer Workflows mit mehrstufiger Orchestrierung. Sie dienen als zentrale Steuerungsebene und ermöglichen es Unternehmen, KI sicher und kostengünstig in großem Maßstab zu operationalisieren.

Welches KI-Gateway ist das beste?

Das TrueFoundry AI-Gateway ist das beste. Es bietet eine umfassende Bereitstellung und Verwaltung von KI-Diensten mit Sicherheit auf Unternehmensebene durch RBAC, OAuth 2.0 und API-Schlüsselauthentifizierung. Es bietet Ratenbegrenzung, intelligenten Lastausgleich und automatisches Failover für optimale Leistung und Zuverlässigkeit. Integrierte Schutzmaßnahmen setzen ethische Richtlinien durch und verhindern unangemessene Ergebnisse, während Observability-Tools Analysen, Protokolle und zeitnahe Optimierungen ermöglichen. Mit Multi-Cloud-Unterstützung und Echtzeit-Inferenzfunktionen bietet TrueFoundry eine flexible und skalierbare Lösung für den Einsatz von KI in Unternehmen.

Was ist der Unterschied zwischen einem API-Gateway und einem AI-Gateway?

Während Standard-Gateways den allgemeinen Webverkehr weiterleiten, wurde ein TrueFoundry Enterprise KI-Gateway speziell für LLMs entwickelt. Es erledigt bestimmte Aufgaben wie Token-Zählen, Prompt-Caching und Modell-Fallbacks — spezielle Logik, die generische API-Gateways einfach nicht effizient ausführen können.

Wo befindet sich ein KI-Gateway in der GenAI-Architektur?

Ein KI-Gateway befindet sich direkt im Produktionsinferenzpfad zwischen Anwendungen und Modellanbietern. Es fungiert als zentrale Steuerungsebene, die Routing, Governance, Beobachtbarkeit, Sicherheit und Kostenkontrollen für LLMs, Tools und Agenten verwaltet, ohne dass Änderungen an der Anwendungslogik erforderlich sind.

Kann ein KI-Gateway mit selbst gehosteten und Open-Source-Modellen verwendet werden?

Ja. Ein KI-Gateway für Unternehmen unterstützt sowohl gehostete Modelle als auch selbst gehostete oder Open-Source-Modelle wie LLama oder Mistral. Diese Modelle können in VPC-, lokalen, Hybrid- oder Air-Gap-Umgebungen ausgeführt werden und verwenden dabei dieselben Richtlinien, Steuerungen und Beobachtbarkeit wie gehostete Modelle.

Wie hilft ein KI-Gateway dabei, die Inferenzkosten zu kontrollieren und zu optimieren?

Ein KI-Gateway bietet Nutzungstransparenz in Echtzeit, Tracking auf Token-Ebene, Kontingente und Budgetdurchsetzung. Es ermöglicht auch intelligente Routing-, Caching- und Fallback-Strategien, um unnötige Aufrufe teurer Modelle zu reduzieren und unkontrollierbare Ausgaben für Inferenzen zu vermeiden.

Wie hilft ein KI-Gateway beim Datenschutz und bei der Einhaltung von Vorschriften?

KI-Gateways setzen Datenverarbeitungsrichtlinien wie PII-Maskierung, Anforderungsfilterung und kontrollierte Protokollierung durch. Wenn sie in VPC-, lokalen oder Air-Gap-Umgebungen eingesetzt werden, stellen sie sicher, dass sensible Daten niemals die Unternehmensgrenzen verlassen und gleichzeitig die Compliance-Anforderungen erfüllen.

Wie unterstützt ein KI-Gateway mehrere Teams und Umgebungen?

KI-Gateways ermöglichen die Isolierung auf Teamebene mithilfe von rollenbasierter Zugriffskontrolle (RBAC), API-Schlüsseln pro Team, Kontingenten und Nutzungsverfolgung. Auf diese Weise können mehrere Teams Modelle und Infrastruktur sicher gemeinsam nutzen und gleichzeitig die Unternehmensführung, die Rechenschaftspflicht und die Kostentransparenz aufrechterhalten.

Wie hilft der TrueFoundry AI Gateway Playground Entwicklern beim Entwickeln und Testen?

Der Playground ist die interaktive Benutzeroberfläche auf dem AI Gateway, auf der Entwickler verschiedene LLMs, Prompts, MCP-Tools und Konfigurationen ausprobieren können, bevor sie sie in Anwendungen integrieren. Sie können auf der Registerkarte „Modelle“ jedes Modell auswählen, das integriert wurde, Parameter wie Temperatur, maximale Tokens, Streaming- und Stoppsequenzen anpassen und sofort sehen, wie sich dies auf Antworten, Token-Nutzung und Latenz auswirkt. Das macht es einfach, mit Modelloptionen und Generierungseinstellungen zu experimentieren, ohne Code schreiben zu müssen.
‍
Sobald Sie mit einem Setup zufrieden sind, kann die gesamte Konfiguration — Eingabeaufforderung, Modell, Tools, Leitplanken und strukturiertes Ausgabeschema — als wiederverwendbare Vorlage in einem gemeinsamen Repository gespeichert werden. Der Playground generiert mithilfe der vereinheitlichten AI Gateway-API auch gebrauchsfertige Codefragmente für den OpenAI-Client, LangChain und andere Bibliotheken, sodass Teams ein funktionierendes Experiment durchführen und es mit minimalem Aufwand direkt in ihre Dienste einfügen können.

Was bedeutet „einheitlicher Zugriff“ für APIs, Schlüssel, Tools und Agenten?

Mit TrueFoundry AI Gateway befinden sich alle Modellanbieter und Tools hinter einer einzigen, einheitlichen API. Anstatt separate SDKs, Endpunkte und Schlüssel für OpenAI, Anthropic, Bedrock, selbst gehostete Modelle und andere zu verwalten, kommunizieren Anwendungen mit einem Gateway-Endpunkt und verwenden einen Gateway-Schlüssel. Das Gateway leitet dann Anfragen je nach Konfiguration an das richtige zugrunde liegende Modell weiter, sodass Sie Modelle oder Anbieter austauschen können, ohne Ihren Anwendungscode zu ändern. Diese einheitliche Zugriffsebene erstreckt sich auch auf Tools über das MCP-Protokoll und auf Agenten über das neue A2A-Protokoll, sodass Modelle, Tools und Agenten alle über dieselbe Steuerungsebene orchestriert werden können.
‍
Für Entwickler bedeutet dies eine einfachere Integration und ein saubereres Sicherheitsmodell: Provider-Schlüssel werden einmal im Gateway gespeichert, der Zugriff wird zentral mithilfe von RBAC und Richtlinien gesteuert, und Teams können ein einheitliches Client-Muster für alle Sprachen und Frameworks standardisieren. Sobald neue Modelle oder Anbieter auf den Markt kommen, können sie dem Gateway hinzugefügt werden und sind sofort hinter derselben einheitlichen Oberfläche verfügbar.

Wie arbeiten Promptmanagement, Versionierung und Agent-Apps zusammen?

Eingabeaufforderungen, Tools und Agentenkonfigurationen werden im AI Gateway als erstklassige Ressourcen behandelt. Im Playground können Sie Systemaufforderungen, Benutzeraufforderungen, Eingabevariablen, MCP-Tools, Leitplanken und Modelleinstellungen definieren und diese dann als benannte Vorlagen speichern. Jede Vorlage kann mehrere Versionen haben, sodass Teams sicher iterieren können, ohne die Logik der anderen zu überschreiben, und bei Bedarf zu früheren Versionen zurückkehren können. Dies wird effektiv zu einem Repositorium für schnelle und Agentenkonfigurationen für Ihr Unternehmen.
‍
Wenn eine bestimmte Konfiguration bereit ist, in größerem Umfang geteilt zu werden, kann sie als Agenten-App veröffentlicht werden. Agenten-Apps werden über das Gateway bereitgestellt, sind jedoch über eine einfache, geschützte Oberfläche zugänglich: Geschäftsbenutzer oder interne Teams können mit dem Agenten genau so interagieren, wie er in der Produktion ausgeführt wird, während die zugrundeliegenden Eingabeaufforderungen, Tools und Leitplanken unverändert bleiben. Dadurch eignen sich Agent-Apps ideal für Benutzerakzeptanztests, Stakeholder-Demos und interne Copiloten, da Produkt- und Plattformteams die Kontrolle über die Konfiguration behalten und gleichzeitig anderen eine sichere Möglichkeit bieten, agentische Workflows auszuprobieren.

Wie funktionieren Leitplanken, Sicherheitskontrollen und PII-Kontrollen durchgängig?

Die Leitplanken im TrueFoundry AI Gateway funktionieren sowohl auf den Eingabe- als auch auf den Ausgabepfaden, um eine tiefgreifende Verteidigung zu gewährleisten. Bevor eine Anfrage ein Modell erreicht, können Eingabe-Guerdrails es nach sensiblen Daten wie PII, Aufforderungsmustern oder unzulässigen Themen durchsuchen und die Aufforderung entweder blockieren, redigieren oder transformieren, je nach Ihren Richtlinien. Nachdem das Modell eine Antwort generiert hat, bewerten die Output-Gudrails den Inhalt erneut auf Toxizität, Vorurteile, Halluzinationen, Richtlinienverstöße oder versehentliche Datenlecks und entscheiden, ob die Antwort zurückgegeben, geändert oder abgelehnt wird.
‍
Das Gateway kann in bestehende Sicherheits- und Compliance-Dienste wie OpenAI Moderation, AWS Guardrails, Azure Content Safety und Azure PII Detection integriert werden und unterstützt auch benutzerdefinierte Regeln, die als Konfiguration oder Python-Code geschrieben werden. Da die Leitplanken zentral konfiguriert und auf alle Modelle und Anwendungen, die das AI Gateway durchlaufen, einheitlich angewendet werden, erhalten Sicherheits- und Compliance-Teams eine vorhersehbare Möglichkeit, Unternehmensrichtlinien für die Nutzung von GenAI durchzusetzen, auch in regulierten Umgebungen wie Gesundheitswesen, Finanzdienstleistungen und Versicherungen.

Welche Beobachtungs-, Tracing- und Debugging-Funktionen bietet das AI Gateway?

Jede Anfrage, die das TrueFoundry AI Gateway durchläuft, ist instrumentiert, sodass Sie genau sehen können, wie sich Ihre GenAI-Workloads verhalten. Die Überwachungsansichten zeigen aggregierte Kennzahlen wie Gesamtzahl der Anfragen, Eingabe- und Ausgabe-Tokens sowie Kosten, aufgeschlüsselt nach Modell, Team, Benutzer, Kunde, Umgebung oder anderen Metadaten, die Sie anhängen möchten. Die Leistung wird anhand der P99-, P90- und P50-Latenz, der Zeit bis zum ersten Token und der Latenz zwischen den einzelnen Token verfolgt, sodass Sie Modelle oder Routen, die zu Verlangsamungen oder Fehlern führen, schnell identifizieren können.
‍
Für ein tieferes Debugging gibt es eine Ansicht auf Anforderungsebene, in der Sie einzelne Anrufe überprüfen, die vollständige Aufforderung und Antwort sehen und nachvollziehen können, wie Routing, Fallbacks und Guardrails angewendet wurden. Bei agentischen Workflows, die Tools und MCP verwenden, kann das Gateway Traces erfassen, aus denen hervorgeht, welche Schritte ein Agent unternommen hat, welche Tools er aufgerufen hat und wie die Zwischenergebnisse das System durchliefen. All diese Logs und Metriken werden auch über APIs bereitgestellt, sodass Plattform- und Observability-Teams benutzerdefinierte Dashboards und Warnmeldungen in ihren vorhandenen Monitoring-Stacks erstellen können.

Wie werden Richtlinien, Ratenlimits, Fallbacks und Budgets konfiguriert und automatisiert?

Mit dem AI Gateway können Sie Zuverlässigkeits- und Governance-Regeln als Konfiguration ausdrücken, sodass sie konsistent und automatisiert angewendet werden können. Ratenlimits können pro Team, Benutzer, Modell, Anwendung oder Umgebung definiert werden, um sicherzustellen, dass kein einzelner Verbraucher die Kapazität ausschöpfen oder zu viel ausgeben kann. Budgets und Kontingente können so festgelegt werden, dass Anfragen je nach Ihren Geschäftsregeln gedrosselt, auf günstigere Modelle herabgestuft oder blockiert werden, wenn die Nutzung bestimmte Schwellenwerte überschreitet. Richtlinien für den Lastenausgleich können den Datenverkehr auf der Grundlage fester Gewichtungen, gemessener Latenz oder Priorität weiterleiten, während Fallback-Ketten die Reihenfolge der Modelle beschreiben, die bei Fehlern oder Timeouts ausprobiert werden.
‍
Alle diese Steuerelemente können über die Benutzeroberfläche verwaltet oder in YAML deklariert und über die TrueFoundry-CLI angewendet werden. Dadurch wird ein GitOps-Workflow ermöglicht, bei dem die Gateway-Konfiguration neben Anwendungscode und Infrastrukturdefinitionen enthalten ist. In Kombination mit Caching, Batching und zentralisierter API-Schlüsselverwaltung ermöglichen diese Funktionen den Plattformteams, das AI Gateway als den einzigen Ort zu betrachten, an dem sie definieren, wie GenAI verwendet werden soll, wie viel ausgegeben werden kann und wie sich Anwendungen bei einem Ausfall verhalten sollen — ohne dass einzelne Anwendungsteams gezwungen werden, diese Bedenken immer wieder neu umzusetzen.