MCP-Server in Claude Code
.webp)
Auf Geschwindigkeit ausgelegt: ~ 10 ms Latenz, auch unter Last
Unglaublich schnelle Methode zum Erstellen, Verfolgen und Bereitstellen Ihrer Modelle!
- Verarbeitet mehr als 350 RPS auf nur 1 vCPU — kein Tuning erforderlich
- Produktionsbereit mit vollem Unternehmenssupport
Was ist MCP
MCP ist definiert als „USB-C für KI-Anwendungen“. MCP bietet ein konsistentes Protokoll für die Verknüpfung von KI-Modellen mit externen Tools.
Mit MCP beschränken sich KI-Anwendungen wie Claude oder ChatGPT nicht nur auf die Generierung von Text. Sie können eine direkte Verbindung zu Datenquellen (wie lokalen Dateien oder Datenbanken), Tools (wie Suchmaschinen oder Taschenrechner) und strukturierten Workflows (spezielle Eingabeaufforderungen oder Automatisierungen) herstellen.
Wenn MCP noch nicht verfügbar ist.
Wenn es kein Protokoll wie MCP gibt, muss jede KI-Anwendung separat in jedes externe Tool integriert werden. Dies macht den Prozess sehr komplex, zeitaufwändig und kostspielig

Wenn wir mehrere KI-Anwendungen und viele Tools haben, wird die Anzahl der erforderlichen Integrationen extrem groß
Wenn MCP verfügbar ist
MCP löst das M × N-Integrationsproblem, indem es es über ein standardisiertes Verbindungsprotokoll in ein M+N-Modell umwandelt. Jede KI-Anwendung wird einmal auf der MCP-Clientseite integriert, und jedes Tool oder jede Datenquelle wird einmal auf der MCP-Server Seite.

Wichtige Terminologie von MCP
Komponenten
Ähnlich wie das Client-Server-Modell im HTTP-Protokoll folgt auch MCP einer Client-Server-Architektur.
- Gastgeber: Die Umgebung, in der der Benutzer direkt mit der KI-Anwendung interagiert (z. B. Claude Desktop, Cursor).
- Kunde: Eine Komponente innerhalb des Hosts, die für den Aufbau und die Verwaltung der Verbindung zum MCP-Server verantwortlich ist.
- Server: Eine externe Anwendung oder ein externer Dienst, der Funktionen (wie Tools, Ressourcen und Eingabeaufforderungen) über das MCP-Protokoll bereitstellt.

Fähigkeiten
MCP kann zwar eine Verbindung zu vielen verschiedenen Tools herstellen, es gibt jedoch gemeinsame Tools, die von mehreren KI-Anwendungen gemeinsam genutzt werden. Im Folgenden sind die wichtigsten Kategorien von Tools aufgeführt, die in KI-Systemen häufig verwendet werden:
- Werkzeuge: Ausführbare Funktionen, die ein KI-Modell aufrufen kann, um Aktionen oder Berechnungen durchzuführen (z. B. ein calculate_summary-Tool).
- Ressourcen: Schreibgeschützte Datenquellen, die Kontextinformationen bereitstellen, ohne dass umfangreiche Berechnungen erforderlich sind (z. B. Seiten mit Unternehmensdokumentationen).
- Aufforderungen: Vorlagen oder vordefinierte Workflows, die Interaktionen zwischen Benutzern, KI-Modellen und externen Tools steuern.
Komponenten der MCP-Architektur
Nachdem wir die wichtigsten Konzepte und die Terminologie von MCP verstanden haben, können wir uns nun seine Architektur ansehen.

Das Modellkontext-Protokoll (MCP) basiert auf einer Client-Server-Architektur, die es KI-Modellen ermöglicht, mit externen Tools und Diensten zu interagieren.
Gastgeber
Das Gastgeber ist die Umgebung, in der Endbenutzer direkt mit der KI-Anwendung interagieren (z. B. Claude Desktop, Cursor).
Der Gastgeber ist verantwortlich für:
- Verwaltung von Benutzerinteraktionen und Berechtigungen
- Initiieren von Verbindungen zu MCP-Servern über MCP-Clients
- Bearbeitung von Benutzeranfragen und Weiterleitung an geeignete externe Tools
- Rückgabe der Ergebnisse an den Benutzer
Kunde
Das Kunde ist eine Komponente innerhalb des Hosts, die die Verbindung zu einem bestimmten MCP-Server verwaltet.
Die wichtigsten Eigenschaften:
- Jeder Client unterhält eine 1:1 -Verbindung mit einem einzelnen Server
- Verarbeitet die Kommunikation auf MCP-Protokollebene
- Fungiert als Vermittler zwischen dem Host und dem Server
Server
Das Server ist ein externes Programm oder Dienst, der dem KI-Modell über das MCP-Protokoll Funktionen zur Verfügung stellt.
Der Server ist verantwortlich für:
- Bereitstellung des Zugriffs auf externe Tools, Datenquellen oder Dienste
- Wird entweder lokal (auf demselben Computer wie der Host) oder remote (über das Netzwerk) ausgeführt
- Bereitstellung standardisierter Schnittstellen, damit Kunden mit ihren Funktionen interagieren können
Aufbau des einfachen MCP-Servers
Installieren Sie fastmcp
pip install fastmcp
Basic MCP Server: Wetter-Tool

Das war's! FastMCP kümmert sich um alles, einschließlich:
- JSON-RPC-Protokoll
- Werkzeugregistrierung
- Typvalidierung
- Behandlung von Fehlern
Verbindung zu Claude Code herstellen
Claude Mcp Wetter hinzufügen --command python --args /full/path/to/get_weather.py
Starten Sie Claude Code neu → die MCP-Server stellen automatisch eine Verbindung her.
Jetzt kannst du Claude Dinge fragen wie:
- „Wie ist die Temperatur in Japan?“
- „Lies die Datei unter ~/documents/report.txt“
Claude ruft die Tools automatisch nahtlos von Ihren MCP-Servern auf.
MCP mit Claude Code einrichten
Basierend auf den Claude-Dokumenten (https://code.claude.com/docs/en/mcp), Einrichtung
McPin Claude Code ist ziemlich einfach — starte einfach
claude mcp hinzufügen
und es erledigt die Konfiguration automatisch für Sie
Um alle konfigurierten MCP-Server in Claude Code aufzulisten und zu überprüfen, versuchen Sie Folgendes auszuführen:
Claude McP Liste
Claude Code & MCP: Bewährte Verfahren
1. Serena MCP
Link: https://github.com/oraios/serena
Ich habe mit einem KI-gesteuerten Workflow experimentiert und ihn angeschlossen Serena MCP direkt rein (nur mit Sonet 4.5).
Ehrlich gesagt fühlt es sich irgendwie „wow“ an. Anstatt eine Menge Dateien auf die KI zu laden und zu hoffen, dass sie die Dinge herausfindet, liest sie die Codebasis tatsächlich wie ein leitender Entwickler im Team.
Warum funktioniert es so gut?
- LAPPEN: Es indexiert die gesamte Codebasis, verwendet die semantische Suche, um nur die relevantesten Teile abzurufen, und fügt dem Modell einen sauberen Kontext hinzu → weniger Rauschen, bessere Antworten.
- Gebaut auf Sprachserverprotokoll, sodass es Code strukturell versteht, nicht nur als Rohtext.
- Tiefes Gedächtnis: Es merkt sich die indizierte Codebasis, sodass Sie die Token nicht jedes Mal neu laden müssen.
- Semantische Suche ist — frage „Wo wird die Authentifizierung abgewickelt?“ und es findet verwandte Funktionen/Klassen, auch wenn die Benennung seltsam ist. Bei großen Projekten ist das ein Lebensretter.
Insgesamt: weniger Tokens, sauberer Kontext, viel tieferes Codeverständnis.
Wenn Sie Codierungsagenten erstellen, sollten Sie es ausprobieren. Es fühlt sich wirklich so an, als ob KI dein Teamkollege ist.
2. Sequentielles Denken (MCP)
Link: https://github.com/modelcontextprotocol/servers/tree/main/src/sequentialthinking
Die wichtigsten Höhepunkte
- Strukturiertes Denken: Claude Code löst komplexe Probleme mit logischem, schrittweisem Denken.
- Erledigt komplexe Aufgaben: Optimiert für mehrstufige Aufgaben wie Systemdesign oder architektonische Refactoring.
- Skalierbarkeit: Unterstützt die schrittweise Planung und Analyse für umfangreiche Codebasen.
Anwendungsfälle
- Refactoring von Microservice-Architekturen
- Phasenbasierte Aufgabenplanung für große Projekte
- Optimierung von Systemdesign- und Debugging-Workflows
3. Verwendung spezialisierter Unteragenten
Link: https://github.com/wshobson/agents
Dies ist ein umfassendes, produktionsbereites System, das für die Integration in Claude Code entwickelt wurde und dessen Funktionen erheblich erweitert.
Es kombiniert:
- 112 spezialisierte KI-Agenten
- 16 Workflow-Orchestratoren mit mehreren Agenten
- 146 Agentenfähigkeiten
- 79 Entwicklungstools
- Organisiert in 72 fokussierte Einzweck-Plugins für Claude Code
Jeder Agent hat eine klar definierte Rolle — wie Backend-Architekturdesign, Frontend-Entwicklung, Cloud-Infrastrukturoptimierung, automatisiertes Testen, MLOps und mehr — alles konfiguriert nach modernen Best Practices.
Installation:
Git-Klon https://github.com/wshobson/agents.git ~/.claude/agents
TrueFoundry AI Gateway bietet eine Latenz von ~3—4 ms, verarbeitet mehr als 350 RPS auf einer vCPU, skaliert problemlos horizontal und ist produktionsbereit, während LiteLM unter einer hohen Latenz leidet, mit moderaten RPS zu kämpfen hat, keine integrierte Skalierung hat und sich am besten für leichte Workloads oder Prototyp-Workloads eignet.
Der schnellste Weg, deine KI zu entwickeln, zu steuern und zu skalieren











.png)




.png)






.webp)

.webp)



