Was ist Model Context Protocol (MCP) und wie funktioniert es?
.webp)
Auf Geschwindigkeit ausgelegt: ~ 10 ms Latenz, auch unter Last
Unglaublich schnelle Methode zum Erstellen, Verfolgen und Bereitstellen Ihrer Modelle!
- Verarbeitet mehr als 350 RPS auf nur 1 vCPU — kein Tuning erforderlich
- Produktionsbereit mit vollem Unternehmenssupport
Was wäre, wenn Ihr KI-System tatsächlich Dinge tun könnte, z. B. Daten aus einem CRM abrufen, ein Dashboard aktualisieren oder eine E-Mail senden könnte, ohne dass ein Team von Ingenieuren alles verkabelt? An dieser Stelle kommt Model Context Protocol (MCP) ins Spiel. Es ist ein neuer offener Standard, der hilft KI-Agenten Stellen Sie mit weitaus weniger Aufwand eine sichere Verbindung zu Tools, Systemen und Datenquellen her.
Da die KI immer leistungsfähiger wird, ist die eigentliche Herausforderung nicht das Modell. Es verschafft ihr den Zugang zum richtigen Kontext und zu den richtigen Aktionen. Also, wie löst MCP das? Wie sieht es unter der Motorhaube aus? Und warum setzen Unternehmen wie Anthropic und Microsoft darauf? Lassen Sie uns eintauchen.
.webp)
Was ist Model Context Protocol?
.webp)
MCP, kurz für Model Context Protocol, ist ein offener Standard, der KI-Agenten helfen soll, auf strukturierte und sichere Weise mit externen Tools, Daten und Diensten zu interagieren. Stellen Sie sich das wie einen Universalanschluss vor, über den Ihr KI-Modell in reale Systeme „eingesteckt“ werden kann, genau wie ein USB-Anschluss Geräte mit Ihrem Computer verbindet. Anstatt sich auf fest codierte APIs oder proprietäre Integrationen zu verlassen, bietet MCP eine gemeinsame Sprache, in der Tools und Agenten miteinander kommunizieren können. Das ist der Kern von MCP gegen API: Traditionelle APIs stellen vordefinierte Endpunkte zur Verfügung, während MCP ein strukturiertes Protokoll hinzufügt, mit dem KI-Systeme Tools, Ressourcen und Eingabeaufforderungen zur Laufzeit dynamisch erkennen können.
Das Protokoll wurde von Anthropic als Teil ihrer umfassenderen Vision eingeführt, KI-Agenten leistungsfähiger, sicherer und autonomer zu machen. Es verwendet eine einfache, aber leistungsstarke Architektur: Clients (wie ein KI-Modell) senden Anfragen an Server (die Tools oder Datenquellen umfassen) und erhalten strukturierte Antworten, die als Kontext in das Modell zurückgeführt werden können.
Einer der größten Vorteile von MCP ist, dass es modular ist. Egal, ob es sich bei Ihrem Tool um eine Datenbank, eine interne App, ein SaaS-Produkt oder sogar ein Dateisystem handelt, Sie können es als MCP-Server. Das bedeutet, dass Ihre Agenten nicht jedes Mal neu geschult oder neu integriert werden müssen, wenn ein neues System hinzugefügt wird. Sie folgen einfach dem Protokoll.
MCP ist auch sprachunabhängig und transportflexibel. Es unterstützt mehrere SDKs (Python, TypeScript, Java, C#) und kann über verschiedene Kommunikationsebenen, einschließlich HTTP und WebSockets, funktionieren. Dies erleichtert die plattformübergreifende Verwendung, unabhängig davon, ob Sie KI-Workflows in der Cloud, am Edge oder sogar in Unternehmens-IT-Umgebungen ausführen.
Im Kern verlagert MCP die KI-Konversation von „Was kann das Modell sagen?“ hin zu „Was kann das Modell tun?“ Und genau das ist der Sprung, den Agenten benötigen, um von passiven Assistenten zu echten Entscheidungsträgern zu werden.
Architektur von MCP
Das Model Context Protocol (MCP) wurde entwickelt, um KI-Agenten die sichere Interaktion mit externen Tools und Datenquellen über eine standardisierte Schnittstelle zu ermöglichen. Seine Architektur unterteilt die Verantwortlichkeiten klar auf drei Ebenen: den Host, den Client und den Server. Jede Ebene spielt eine bestimmte Rolle bei der Verwaltung des Zugriffs, der Aufrechterhaltung der Isolierung und der Aktivierung des Kontextaustauschs.
Im Mittelpunkt steht ein strukturiertes, zustandsbehaftetes Kommunikationsprotokoll, das auf JSON-RPC 2.0 basiert und den Request-Response-Flow zwischen Agenten und Toolschnittstellen verarbeitet. Das Ergebnis ist ein modulares System, das es Entwicklern ermöglicht, einmal zu erstellen und ohne erneute Implementierung über Agenten, Tools und Domänen hinweg zu skalieren. Diese Trennung der Belange ermöglicht es den Teams auch, parallel an der Agentenentwicklung und der Systemintegration zu arbeiten. Die Architektur ist so konzipiert, dass sie sowohl lokale als auch verteilte Bereitstellungen unterstützt.
.webp)
Gastgeber
Der Host ist die primäre Ausführungsumgebung für den AI-Agenten oder das AI-Modell. Er koordiniert alles, von den Sicherheitsrichtlinien über die Stichprobenstrategie bis hin zu den Workflows zum Aufrufen von Tools. Hosts sind für das Erstellen und Verwalten von Client-Instanzen verantwortlich und spielen eine zentrale Rolle dabei, wie eine KI-Anwendung mit dem MCP-Ökosystem interagiert.
- Hosts setzen Zugriffskontrolle, Benutzereinwilligungen und Sitzungsgrenzen toolübergreifend durch
- Sie kümmern sich um die Kontextaggregation und bestimmen, wie Daten von mehreren Clients zusammengeführt und an das Modell weitergegeben werden.
In einem System wie Claude Desktop verwaltet der Host beispielsweise mehrere Client-Verbindungen, von denen jede mit einem anderen externen Dienst interagiert, während gleichzeitig ein einheitlicher Kontext für die Argumentationsschleife des Modells beibehalten wird.
Kunde
Jeder Client ist eine dedizierte Kommunikationsbrücke zwischen dem Host und einem einzelnen MCP-Server. Es handelt Funktionen mit dem Server aus, verwaltet die RPC-Sitzung und leitet Daten hin und her. Die Clients sind so konzipiert, dass sie isoliert und zustandslos sind, wenn sie den Rahmen einer einzelnen Sitzung überschreiten.
- Ein Client stellt eine Verbindung zu einem Server her, wodurch eine strikte Isolierung gewahrt und das Risiko minimiert wird
- Kunden verwalten die Erkennung (Tools, Ressourcen, Eingabeaufforderungen) und setzen die Nachrichtenvalidierung und Typsicherheit durch
Clients fungieren als Abstraktionsebene, die es dem KI-Modell ermöglicht, Tools aufzurufen oder Daten abzurufen, ohne direkt an die Implementierungsdetails des Systems gekoppelt zu sein.
Server
Ein MCP-Server ist ein Wrapper für ein externes Tool, eine API oder ein System. Er stellt Funktionen und Daten in einem standardisierten Format zur Verfügung und macht sie für jeden MCP-kompatiblen Client zugänglich. Server arbeiten unabhängig und sind für die Definition ihres Funktionsumfangs verantwortlich.
- Server stellen drei zentrale Grundelemente zur Verfügung: Tools (Aktionen), Ressourcen (Daten) und Eingabeaufforderungen (Template-Flows)
- Sie respektieren Zugriffsbeschränkungen und können je nach Systemarchitektur lokal oder über das Netzwerk eingesetzt werden.
Ein Server könnte beispielsweise eine Postgres-Datenbank als abfragbare Ressource bereitstellen oder die GitHub-API als eine Reihe von aufrufbaren Tools umschließen. Einmal erstellt, kann derselbe Server mehrere Clienttypen auf verschiedenen Hosts bedienen.
Hinweis: Das Host-Client-Server-Design von MCP erzwingt eine strikte Trennung der Verantwortlichkeiten. Der Host kontrolliert den Zugriff und den Kontext, jeder Client unterhält eine isolierte Sitzung, und die Server stellen die Funktionen der Tools über ein Standardprotokoll zur Verfügung. Diese Struktur ist entscheidend für den Aufbau sicherer, modularer und skalierbarer KI-Agentensysteme über verschiedene Toolchains hinweg.
Kernkomponenten von MCP
MCP-Interaktionen werden durch vier wichtige Grundelemente gesteuert: Tools, Ressourcen, Eingabeaufforderungen und die Sitzungsebene. Diese Komponenten abstrahieren die Komplexität auf niedriger Ebene und bieten eine übersichtliche Oberfläche, über die Modelle auf modulare und vorhersehbare Weise argumentieren, handeln und mit realen Systemen interagieren können.
Werkzeuge
Tools sind ausführbare Funktionen, die vom Server bereitgestellt und vom Modell über den Client aufgerufen werden können. Jedes Tool ist mit Eingabeparametern, einem Ausgabeschema und einer Beschreibung seines Zwecks definiert. Diese Metadaten werden vom Modell verwendet, um zu bestimmen, wann und wie ein Werkzeug verwendet werden soll. Beispiele hierfür sind das Erstellen von Support-Tickets, das Senden von Slack-Nachrichten oder das Initiieren von Workflows. Tools können je nach Backend-Implementierung synchron oder asynchron sein. Das Modell entscheidet über den Zeitpunkt des Aufrufs der Tools auf der Grundlage des aktuellen Kontextes und der Aufgabenabsicht.
Ressourcen
Ressourcen sind schreibgeschützte Daten, die Server bereitstellen, um Kontext für das Modell bereitzustellen. Dies können Datenbankeinträge, Dokumente, Protokolleinträge oder Suchergebnisse sein. Clients fordern Ressourcen an, wenn das Modell Daten suchen oder abrufen muss, bevor eine Aktion ausgeführt werden kann. Server definieren, was verfügbar ist, und der Client kümmert sich um die Formatierung, damit es in die Eingabeaufforderung des Modells aufgenommen wird. Ressourcen sind entscheidend, um die Antworten der Agenten anhand aktueller und relevanter Informationen zu untermauern.
Aufforderungen
Prompts sind vordefinierte Vorlagen oder Interaktionsabläufe, die vom Server registriert werden. Sie dienen als strukturierte Gerüste, die das Verhalten des Modells in bestimmten Kontexten steuern können. Beispielsweise könnte eine Aufforderung das Layout für einen Fehlerbericht, eine Eskalationsmail oder einen Onboarding-Leitfaden definieren. Aufforderungen können vom Benutzer ausgelöst oder programmgesteuert aufgerufen werden. Ihre Aufgabe besteht darin, Konsistenz durchzusetzen, Halluzinationen zu reduzieren und die strukturierte Generierung in Arbeitsabläufen zu beschleunigen, bei denen viel auf dem Spiel steht.
Sitzungsebene (JSON-RPC)
Die gesamte Kommunikation zwischen Clients und Servern erfolgt über JSON-RPC 2.0. Dieses Protokoll unterstützt statusbehaftetes, bidirektionales Messaging und ist transportflexibel. Es funktioniert über STDIO, HTTP/SSE oder WebSockets. Die Sitzungsebene ermöglicht Anforderungs-/Antwort-Aufrufe, Ereignisbenachrichtigungen, die Registrierung von Funktionen und lang andauernde Operationen. Durch die Einhaltung von JSON-RPC gewährleistet MCP eine starke Typisierung, vorhersehbare Kommunikationsmuster und sprach- und plattformübergreifende Kompatibilität. Dieses Sitzungsmodell ermöglicht die dynamische Toolerkennung und die Interaktion mit der Laufzeit.
Hinweis: Tools, Ressourcen, Eingabeaufforderungen und die Sitzungsebene bilden die Grundlage jeder MCP-Interaktion. Sie ermöglichen es Modellen, mithilfe strukturierter, vorhersehbarer Grundelemente zu argumentieren, zu handeln und Kontext abzurufen. So ist eine Echtzeitintegration mit externen Systemen möglich, ohne dass dabei Abstriche bei Sicherheit oder Flexibilität gemacht werden müssen.
Sicherheitsüberlegungen mit MCP
Bei der Verwendung von MCP-Servern (Model Context Protocol) hat Sicherheit oberste Priorität, da diese Server als Gateways zwischen KI-Modellen und externen Systemen dienen. Eine angemessene Sicherheit stellt sicher, dass vertrauliche Daten, APIs und Geschäftsabläufe geschützt bleiben und gleichzeitig eine nahtlose KI-Integration ermöglicht wird.
- Authentifizierung und Zugriffskontrolle: Stellen Sie sicher, dass nur autorisierte Benutzer oder Modelle auf Tools und APIs zugreifen können. Implementieren Sie einen rollenbasierten Zugriff oder eine tokenbasierte Authentifizierung, um eine unbefugte Nutzung zu verhindern.
- Datenverschlüsselung: Verschlüsseln Sie Daten sowohl während der Übertragung als auch im Ruhezustand, um vertrauliche Informationen zu schützen, die zwischen Modellen und externen Systemen ausgetauscht werden.
- Ratenbegrenzung und Drosselung: Vermeiden Sie Missbrauch oder versehentliche Überlastung verbundener Dienste, indem Sie die Anzahl der Anfragen kontrollieren, die ein MCP-Server verarbeiten kann.
- Prüfung und Protokollierung: Führen Sie detaillierte Protokolle aller Interaktionen, einschließlich Anfragen und Antworten, um Auffälligkeiten zu erkennen und die Rückverfolgbarkeit zu gewährleisten.
- Sicherer API-Zugriff: Beschränken Sie die Exposition interner Werkzeuge auf das Notwendige. Vermeiden Sie es, sensible Endgeräte der Öffentlichkeit zugänglich zu machen.
- Fallback und Fehlerbehandlung: Sorgen Sie für robuste Mechanismen zur Bearbeitung fehlgeschlagener oder nicht autorisierter Anfragen, ohne dass vertrauliche Daten verloren gehen.
Ein ordnungsgemäß gesicherter MCP-Server bietet KI-Modellen eine sichere Umgebung für die Interaktion mit externen Systemen und minimiert gleichzeitig das Risiko von Datenschutzverletzungen, Missbrauch oder Systemausfällen.
Wie funktioniert MCP?
MCP arbeitet in einem strukturierten, fünfstufigen Ablauf, der es Sprachmodellen ermöglicht, Tools und Datenquellen in Echtzeit zu erkennen, aufzurufen und mit ihnen zu interagieren. So funktioniert das Protokoll unter der Haube:
Schritt 1: Der Host initialisiert die Clients
Die Host-Anwendung startet den Prozess, indem sie einen oder mehrere MCP-Clients startet, von denen jeder so konfiguriert ist, dass er eine Verbindung zu einem bestimmten MCP-Server herstellt. Der Host ist auch für die Verwaltung der Benutzerautorisierung, die Durchsetzung von Zugriffskontrollrichtlinien und die Aufrechterhaltung des Kontextes bei mehreren Tool-Interaktionen verantwortlich.
Schritt 2: Kunden entdecken Serverfunktionen
Jeder Client initiiert einen Handshake mit seinem zugewiesenen Server. Während dieses Austauschs kündigt der Server seine unterstützten Tools, Ressourcen und Eingabeaufforderungen an, einschließlich Beschreibungen, Eingabeparametern und Rückgabetypen. Der Client verpackt diese Metadaten dann in den Kontext des Modells, sodass das Modell weiß, was es verwenden kann.
Schritt 3: Das Modell trifft Entscheidungen
Da die Funktionsdaten jetzt in die Eingabeaufforderung eingebettet sind, berücksichtigt das Modell die verfügbaren Tools und die aktuellen Benutzereingaben. Wenn für die Aufgabe eine Aktion oder ein Abrufen von Informationen erforderlich ist, entscheidet das Modell, welches Tool oder welche Ressource aufgerufen werden soll, formuliert die entsprechenden Parameter und sendet die Anfrage an den Client.
Schritt 4: Client und Server tauschen Daten aus
Der Client leitet die Anfrage des Modells mithilfe von JSON-RPC an den Server weiter. Der Server führt die Funktion aus oder ruft die Daten ab und gibt dann eine strukturierte Antwort zurück. Der Client liefert das Ergebnis zurück an das Modell, das es verwendet, um die Verarbeitung fortzusetzen oder weitere Entscheidungen zu treffen.
Schritt 5: Der Gastgeber verwaltet das Feedback und den Sitzungsablauf
Die Hostanwendung überwacht den gesamten Loop, verwaltet den laufenden Sitzungsstatus, protokolliert die Toolnutzung, setzt Ratenbegrenzungen durch und stellt sicher, dass der Agent innerhalb seines Zuständigkeitsbereichs bleibt. Dieser Schritt gewährleistet die Sicherheit, Rückverfolgbarkeit und Beobachtbarkeit von KI-gesteuerten Aktionen.
Wie bearbeitet ein KI-Agent ein Support-Ticket mithilfe von MCP?
.webp)
Dieses Diagramm zeigt, wie ein KI-Agent MCP verwendet, um Tools zu erkennen, Aktionen aufzurufen und Tickets auf mehreren Servern in Echtzeit zu bearbeiten. Es visualisiert den gesamten Ablauf von der Benutzereingabe bis zur Systemantwort.
Stellen Sie sich einen KI-Supportagenten vor, der in eine Helpdesk-Anwendung eingebettet ist. Wenn die Hostanwendung gestartet wird, initialisiert sie zwei MCP-Clients: einen, der mit einem Zendesk-MCP-Server verbunden ist, und ein anderer, der mit einem internen Eskalationssystem verknüpft ist. Jeder Client führt einen Capability Handshake mit seinem jeweiligen Server durch. Der Zendesk-Server bewirbt Tools wie getTicketById und updateTicketStatus, während der Eskalationsserver EscalateTicket verfügbar macht.
Diese Metadaten werden an den Kontext des Modells übergeben. Wenn ein Benutzer die Anweisung „Ticket #1289 eskalieren, falls es als dringend gekennzeichnet ist“ eingibt, interpretiert das Model die Anfrage und stellt fest, dass das Ticket zuerst abgerufen werden muss. Es ruft getTicketById („1289") über den Zendesk-Client auf. Der Server antwortet mit den Ticketdetails und gibt an, dass die Priorität „dringend“ ist. Auf dieser Grundlage entscheidet das Model, das Problem zu eskalieren, und ruft EscalateTicket („1289") über den zweiten Client auf.
Beide Aufrufe werden über JSON-RPC ausgeführt. Die Clients leiten die Anfragen an ihre jeweiligen Server weiter, die die Funktionen verarbeiten und strukturierte Antworten zurückgeben. Diese Antworten, Ticket-Metadaten und die Eskalationsbestätigung werden an das Modell zurückgeleitet und in seinen Kontext integriert. Der Host schließt dann die Schleife ab, indem er die Interaktionen protokolliert, die Zugriffsrichtlinien validiert und die Benutzeroberfläche mit der Ausgabe aktualisiert: „Ticket #1289 ist erfolgreich eskaliert“.
MCP gegen RAG: Warum ist es wichtig, den Unterschied zu verstehen?
Vor der Integration von KI-Systemen ist es wichtig zu verstehen, wie MCP (Model Context Protocol) und RAG (Retrieval-Augmented Generation) unterschiedlichen Zwecken dienen. Während beide die LLM-Funktionalität verbessern, konzentriert sich MCP auf die Verbindung von Modellen mit Tools und APIs, während RAG die Modellantworten mit externem Wissen anreichert.
Lesen Sie auch: MCP gegen RAG
Warum brauchen wir MCP?
Da KI-Agenten immer leistungsfähiger werden, ist ihre größte Einschränkung nicht das Denken, sondern der Zugriff. Die meisten Sprachmodelle arbeiten isoliert, ohne dass eine strukturierte Art der Interaktion mit externen Tools oder Datenquellen besteht. Am Ende codieren Entwickler API-Aufrufe fest, erstellen spröde Wrapper oder verwalten einmalige Integrationen, die sich nicht gut skalieren lassen. Dies verlangsamt nicht nur die Entwicklung, sondern führt auch zu Sicherheits- und Wartungsproblemen.
MCP löst dieses Problem, indem es standardisiert, wie KI-Agenten Tools entdecken, überdenken und aufrufen. Es definiert ein sauberes Protokoll, das es Systemen ermöglicht, ihre Funktionen wie APIs, Datenbanken oder Dateisysteme auf strukturierte, modellfreundliche Weise zugänglich zu machen. Agenten wiederum können dynamisch lernen, welche Aktionen verfügbar sind, entscheiden, wann sie verwendet werden, und sie mithilfe von JSON-RPC sicher auslösen.
Anwendungsfall aus der Praxis
Stellen Sie sich einen KI-Assistenten vor, der in eine HR-Plattform des Unternehmens eingebettet ist. Mithilfe von MCP kann der Assistent eine Verbindung zu einem Gehaltsabrechnungsserver, einer internen Wissensdatenbank und einem Mitarbeiterverzeichnis herstellen, jeweils als MCP-Server. Wenn ein Manager „Rahul fünf Tage Urlaub gewähren und die Personalabteilung benachrichtigen“ eingibt, ruft das Modell dynamisch die entsprechenden Tools auf, die von diesen Servern bereitgestellt werden: eines zur Aktualisierung des Abwesenheitsstatus, ein weiteres zum Senden einer Slack-Nachricht an die Personalabteilung und ein drittes, um die Anfrage im internen System zu protokollieren — alles in Echtzeit, ohne benutzerdefinierten Code im Modell.
Diese Art der Orchestrierung wäre fragil und teuer, wenn man sie manuell erstellen würde. Mit MCP wird es modular, wiederholbar und überall sicher MCP-Automatisierungsplattformen. Mit MCP wird es modular, wiederholbar und sicher. Da Unternehmen immer mehr Tools und Dienste bereitstellen, stellt MCP sicher, dass KI-Agenten sicher und intelligent mit ihnen interagieren können, ohne dass für jede Änderung neue Integrationen erforderlich sind.
Warum ist MCP mehr als nur Funktionsaufruf?
Der Funktionsaufruf ermöglichte es Sprachmodellen, strukturiert mit Tools zu interagieren. Sie definieren ein Tool, seine Parameter und seinen Zweck, und das Modell kann es aufrufen, indem es ein JSON-Objekt zurückgibt. Dies funktioniert gut für einfache Anwendungsfälle, insbesondere wenn die Anzahl der Tools klein und statisch ist. Der Funktionsaufruf hat jedoch entscheidende Einschränkungen: Es wird davon ausgegangen, dass Sie alle Tools im Voraus kennen, dass jedes Modell eng mit ihnen verknüpft ist und dass die Infrastruktur um sie herum entweder fest codiert oder fragil ist.
MCP schließt diese Lücken, indem es ein vollwertiges Protokoll einführt, nicht nur ein Format. Für Teams, die evaluieren MCP gegen A2A, diese Unterscheidung ist wichtig, weil MCP die Interaktion von Modell zu Tool standardisiert, während A2A sich auf die Kommunikation zwischen autonomen Agenten konzentriert. Es formalisiert die Interaktion zwischen KI-Agenten und externen Systemen mithilfe einer Host-Client-Server-Architektur und strukturierter Kommunikation über JSON-RPC. Anstatt Werkzeugdefinitionen direkt in die Eingabeaufforderung des Modells einzubetten, ermöglicht MCP den Modellen, dynamisch zu ermitteln, welche Tools zur Laufzeit verfügbar sind, sie sicher aufzurufen und strukturierte Antworten zu erhalten — alles über eine Standardschnittstelle.
Beispiel aus der Praxis
Stellen Sie sich einen KI-Assistenten vor, der in ein Dashboard für Einzelhandelsabläufe eingebettet ist. Beim Funktionsaufruf müsste das Modell manuell konfiguriert werden und Zugriff auf Tools wie GetInventory, UpdatePrice und NotifyWarehouse bieten. Jedes Tool muss fest mit der Systemaufforderung des Agenten verbunden sein. Mit MCP können Sie jedoch eine Verbindung zu verschiedenen Servern herstellen — einem für Inventar, einem für Preisgestaltung, einem für Logistik, und der Agent erkennt automatisch alle verfügbaren Tools. Kein hartes Programmieren, kein erneutes Deployment.
Warum es wichtig ist
- Trennung der Bedenken: Entwickler können Server einmal erstellen und sie modell- und teamübergreifend gemeinsam nutzen
- Dynamische Orchestrierung: Modelle können verfügbare Funktionen analysieren und Workflows im Handumdrehen anpassen
Der Funktionsaufruf war ein notwendiger erster Schritt. MCP baut auf dieser Grundlage auf und bietet die Infrastruktur, das Protokoll und die Flexibilität, die für den Aufbau robuster, produktionsfähiger Agentensysteme erforderlich sind.
Wie implementiert das Truefoundry Gateway den MCP-Server?
Vereinheitlichte MCP-Serverregistrierung
.webp)
True Foundry's MCP-Gateway bietet ein einziges Portal zur Erkennung und Registrierung all Ihrer MCP-Server, ob intern, lokal, hybrid oder von Drittanbietern, unter organisierten „MCP-Servergruppen“, die Umgebungen isolieren (z. B. Entwicklung und Produktion) und RBAC-gestützte Genehmigungsabläufe für Governance und Transparenz durchsetzen. Das Gateway ist sofort einsatzbereit und enthält vorgefertigte Konnektoren für Unternehmenstools wie Slack, Confluence, Datadog, Sentry und GitHub, die eine Null-Code-Integration in LLM-Agenten-Workflows ermöglichen. Für individuelle Anforderungen können Sie jede interne oder proprietäre API innerhalb von Minuten registrieren, sodass sie von LLM-Agenten sofort auffindbar und nutzbar ist, ohne Ihr SDK ändern zu müssen.
Sichere Authentifizierung und SDK-Integration

Das Gateway unterstützt mehrere Authentifizierungsschemata, darunter keine Authentifizierung, headerbasierte Token und OAuth2-Client-Anmeldeinformationen, mit föderiertem SSO über Identitätsanbieter wie Okta und Azure AD. OAuth2-Anmeldeinformationen werden sicher im integrierten Secrets Manager von TrueFoundry gespeichert und bei Proxyanforderungen automatisch eingefügt, wodurch die Verwaltung der Anmeldeinformationen zentralisiert und das Risiko reduziert wird.
.webp)
Entwickler können programmgesteuert mit registrierten MCP-Servern interagieren, indem sie die offiziellen Python- und TypeScript-SDKs verwenden, die MCP-Autorisierung Ende-zu-Ende oder über den AI Gateway Playground, eine intuitive Oberfläche, über die Sie MCP-Server hinzufügen, Tools auswählen und Eingabeaufforderungen in natürlicher Sprache ausführen, die Remotedienste in Echtzeit aufrufen. Sowohl der Playground als auch das SDK bieten „API-Codeausschnitt“ -Schaltflächen, mit denen Sie ein gebrauchsfertiges Integrations-Boilerplate in Ihrer bevorzugten Sprache erstellen können.
Beobachtbarkeit und Lastenausgleich
Das AI Gateway von TrueFoundry integriert Observability und Load Balancing auf Unternehmensebene. Anfragen werden je nach Gewicht oder Latenz an die gesündesten Endgeräte weitergeleitet, während alle MCP-Aufrufe protokolliert und in Governance-Dashboards überprüft werden, um die Einhaltung von Vorschriften und die Leistungsüberwachung sicherzustellen. In einem kürzlich erschienenen Blog beschreibt das Team, wie das Gateway als zentrale Steuerungsebene für moderne generative KI-Infrastrukturen fungiert und LLMs, MCP-Server und Agent-to-Agent-Protokolle unter einer Oberfläche vereint, was für niedrige Latenz, hohe Zuverlässigkeit und nahtlose Skalierbarkeit sorgt. Dieser Ansatz ermöglicht die Orchestrierung natürlicher Sprache in allen Unternehmenssystemen und ermöglicht eine durchgängige Automatisierung — beispielsweise das Erstellen von Jira-Problemen anhand von Slack-Benachrichtigungen — ohne Integrationscode schreiben zu müssen.
TrueFoundry AI Gateway bietet eine Latenz von ~3—4 ms, verarbeitet mehr als 350 RPS auf einer vCPU, skaliert problemlos horizontal und ist produktionsbereit, während LiteLM unter einer hohen Latenz leidet, mit moderaten RPS zu kämpfen hat, keine integrierte Skalierung hat und sich am besten für leichte Workloads oder Prototyp-Workloads eignet.
Der schnellste Weg, deine KI zu entwickeln, zu steuern und zu skalieren











.png)




.png)






.webp)

.webp)



