MCP-Server in Claude Code

Auf Geschwindigkeit ausgelegt: ~ 10 ms Latenz, auch unter Last

Unglaublich schnelle Methode zum Erstellen, Verfolgen und Bereitstellen Ihrer Modelle!

Verarbeitet mehr als 350 RPS auf nur 1 vCPU — kein Tuning erforderlich
Produktionsbereit mit vollem Unternehmenssupport

Beginnen Sie jetzt mit Truefoundry Sprechen Sie mit dem Experten

Was ist MCP

MCP ist definiert als „USB-C für KI-Anwendungen“. MCP bietet ein konsistentes Protokoll für die Verknüpfung von KI-Modellen mit externen Tools.

Mit MCP beschränken sich KI-Anwendungen wie Claude oder ChatGPT nicht nur auf die Generierung von Text. Sie können eine direkte Verbindung zu Datenquellen (wie lokalen Dateien oder Datenbanken), Tools (wie Suchmaschinen oder Taschenrechner) und strukturierten Workflows (spezielle Eingabeaufforderungen oder Automatisierungen) herstellen.

Wenn MCP noch nicht verfügbar ist.

Wenn es kein Protokoll wie MCP gibt, muss jede KI-Anwendung separat in jedes externe Tool integriert werden. Dies macht den Prozess sehr komplex, zeitaufwändig und kostspielig

Wenn wir mehrere KI-Anwendungen und viele Tools haben, wird die Anzahl der erforderlichen Integrationen extrem groß

Wenn MCP verfügbar ist

MCP löst das M × N-Integrationsproblem, indem es es über ein standardisiertes Verbindungsprotokoll in ein M+N-Modell umwandelt. Jede KI-Anwendung wird einmal auf der MCP-Clientseite integriert, und jedes Tool oder jede Datenquelle wird einmal auf der MCP-Server Seite.

Wichtige Terminologie von MCP

Komponenten

Ähnlich wie das Client-Server-Modell im HTTP-Protokoll folgt auch MCP einer Client-Server-Architektur.

Gastgeber: Die Umgebung, in der der Benutzer direkt mit der KI-Anwendung interagiert (z. B. Claude Desktop, Cursor).
‍Kunde: Eine Komponente innerhalb des Hosts, die für den Aufbau und die Verwaltung der Verbindung zum MCP-Server verantwortlich ist.‍
Server: Eine externe Anwendung oder ein externer Dienst, der Funktionen (wie Tools, Ressourcen und Eingabeaufforderungen) über das MCP-Protokoll bereitstellt.

Fähigkeiten

MCP kann zwar eine Verbindung zu vielen verschiedenen Tools herstellen, es gibt jedoch gemeinsame Tools, die von mehreren KI-Anwendungen gemeinsam genutzt werden. Im Folgenden sind die wichtigsten Kategorien von Tools aufgeführt, die in KI-Systemen häufig verwendet werden:

‍Werkzeuge: Ausführbare Funktionen, die ein KI-Modell aufrufen kann, um Aktionen oder Berechnungen durchzuführen (z. B. ein calculate_summary-Tool).‍
Ressourcen: Schreibgeschützte Datenquellen, die Kontextinformationen bereitstellen, ohne dass umfangreiche Berechnungen erforderlich sind (z. B. Seiten mit Unternehmensdokumentationen).‍
Aufforderungen: Vorlagen oder vordefinierte Workflows, die Interaktionen zwischen Benutzern, KI-Modellen und externen Tools steuern.

Komponenten der MCP-Architektur

Nachdem wir die wichtigsten Konzepte und die Terminologie von MCP verstanden haben, können wir uns nun seine Architektur ansehen.

Das Modellkontext-Protokoll (MCP) basiert auf einer Client-Server-Architektur, die es KI-Modellen ermöglicht, mit externen Tools und Diensten zu interagieren.

Gastgeber

Das Gastgeber ist die Umgebung, in der Endbenutzer direkt mit der KI-Anwendung interagieren (z. B. Claude Desktop, Cursor).

Der Gastgeber ist verantwortlich für:

Verwaltung von Benutzerinteraktionen und Berechtigungen
Initiieren von Verbindungen zu MCP-Servern über MCP-Clients
Bearbeitung von Benutzeranfragen und Weiterleitung an geeignete externe Tools
Rückgabe der Ergebnisse an den Benutzer

Kunde

Das Kunde ist eine Komponente innerhalb des Hosts, die die Verbindung zu einem bestimmten MCP-Server verwaltet.

Die wichtigsten Eigenschaften:

Jeder Client unterhält eine 1:1 -Verbindung mit einem einzelnen Server
Verarbeitet die Kommunikation auf MCP-Protokollebene
Fungiert als Vermittler zwischen dem Host und dem Server

Server

Das Server ist ein externes Programm oder Dienst, der dem KI-Modell über das MCP-Protokoll Funktionen zur Verfügung stellt.

Der Server ist verantwortlich für:

Bereitstellung des Zugriffs auf externe Tools, Datenquellen oder Dienste
Wird entweder lokal (auf demselben Computer wie der Host) oder remote (über das Netzwerk) ausgeführt
Bereitstellung standardisierter Schnittstellen, damit Kunden mit ihren Funktionen interagieren können

Aufbau des einfachen MCP-Servers

Installieren Sie fastmcp

pip install fastmcp

Basic MCP Server: Wetter-Tool

Das war's! FastMCP kümmert sich um alles, einschließlich:

JSON-RPC-Protokoll
Werkzeugregistrierung
Typvalidierung
Behandlung von Fehlern

Verbindung zu Claude Code herstellen

Claude Mcp Wetter hinzufügen --command python --args /full/path/to/get_weather.py

Starten Sie Claude Code neu → die MCP-Server stellen automatisch eine Verbindung her.

Jetzt kannst du Claude Dinge fragen wie:

„Wie ist die Temperatur in Japan?“
„Lies die Datei unter ~/documents/report.txt“

Claude ruft die Tools automatisch nahtlos von Ihren MCP-Servern auf.

MCP mit Claude Code einrichten

Basierend auf den Claude-Dokumenten (https://code.claude.com/docs/en/mcp), Einrichtung

McPin Claude Code ist ziemlich einfach — starte einfach

claude mcp hinzufügen

und es erledigt die Konfiguration automatisch für Sie

Um alle konfigurierten MCP-Server in Claude Code aufzulisten und zu überprüfen, versuchen Sie Folgendes auszuführen:

Claude McP Liste

Claude Code & MCP: Bewährte Verfahren

1. Serena MCP

Link: https://github.com/oraios/serena

Ich habe mit einem KI-gesteuerten Workflow experimentiert und ihn angeschlossen Serena MCP direkt rein (nur mit Sonet 4.5).

Ehrlich gesagt fühlt es sich irgendwie „wow“ an. Anstatt eine Menge Dateien auf die KI zu laden und zu hoffen, dass sie die Dinge herausfindet, liest sie die Codebasis tatsächlich wie ein leitender Entwickler im Team.

Warum funktioniert es so gut?

‍LAPPEN: Es indexiert die gesamte Codebasis, verwendet die semantische Suche, um nur die relevantesten Teile abzurufen, und fügt dem Modell einen sauberen Kontext hinzu → weniger Rauschen, bessere Antworten.
Gebaut auf Sprachserverprotokoll, sodass es Code strukturell versteht, nicht nur als Rohtext.‍
Tiefes Gedächtnis: Es merkt sich die indizierte Codebasis, sodass Sie die Token nicht jedes Mal neu laden müssen.‍
Semantische Suche ist — frage „Wo wird die Authentifizierung abgewickelt?“ und es findet verwandte Funktionen/Klassen, auch wenn die Benennung seltsam ist. Bei großen Projekten ist das ein Lebensretter.

Insgesamt: weniger Tokens, sauberer Kontext, viel tieferes Codeverständnis.

Wenn Sie Codierungsagenten erstellen, sollten Sie es ausprobieren. Es fühlt sich wirklich so an, als ob KI dein Teamkollege ist.

2. Sequentielles Denken (MCP)

Link: https://github.com/modelcontextprotocol/servers/tree/main/src/sequentialthinking

Die wichtigsten Höhepunkte

‍Strukturiertes Denken: Claude Code löst komplexe Probleme mit logischem, schrittweisem Denken.‍
Erledigt komplexe Aufgaben: Optimiert für mehrstufige Aufgaben wie Systemdesign oder architektonische Refactoring.‍
Skalierbarkeit: Unterstützt die schrittweise Planung und Analyse für umfangreiche Codebasen.

Anwendungsfälle

Refactoring von Microservice-Architekturen
Phasenbasierte Aufgabenplanung für große Projekte
Optimierung von Systemdesign- und Debugging-Workflows

3. Verwendung spezialisierter Unteragenten

Link: https://github.com/wshobson/agents
Dies ist ein umfassendes, produktionsbereites System, das für die Integration in Claude Code entwickelt wurde und dessen Funktionen erheblich erweitert.

Es kombiniert:

‍112 spezialisierte KI-Agenten
16 Workflow-Orchestratoren mit mehreren Agenten
146 Agentenfähigkeiten
79 Entwicklungstools‍
Organisiert in 72 fokussierte Einzweck-Plugins für Claude Code

Jeder Agent hat eine klar definierte Rolle — wie Backend-Architekturdesign, Frontend-Entwicklung, Cloud-Infrastrukturoptimierung, automatisiertes Testen, MLOps und mehr — alles konfiguriert nach modernen Best Practices.

Installation:

Git-Klon https://github.com/wshobson/agents.git ~/.claude/agents

TrueFoundry AI Gateway bietet eine Latenz von ~3—4 ms, verarbeitet mehr als 350 RPS auf einer vCPU, skaliert problemlos horizontal und ist produktionsbereit, während LiteLM unter einer hohen Latenz leidet, mit moderaten RPS zu kämpfen hat, keine integrierte Skalierung hat und sich am besten für leichte Workloads oder Prototyp-Workloads eignet.

Auf Geschwindigkeit ausgelegt: ~ 10 ms Latenz, auch unter Last

Vereinbaren Sie jetzt Ihre Demo