Serie Agent Gateway (parte 2 de 7) | Registro de servicios para la era de las agencias

Diseñado para la velocidad: ~ 10 ms de latencia, incluso bajo carga
¡Una forma increíblemente rápida de crear, rastrear e implementar sus modelos!
- Gestiona más de 350 RPS en solo 1 vCPU, sin necesidad de ajustes
- Listo para la producción con soporte empresarial completo
En una arquitectura de microservicios, utilizamos DNS para buscar servicios. Si necesito el servicio de facturación, llamo a billing.svc.cluster.local. Es sencillo porque la relación es estática: El servicio A llama al servicio B.
En un Arquitectura agencial, las relaciones son dinámicas. No querrás que tu «agente gerente» codifique de forma rígida una conexión con finance-agent-v1. Quieres que pregunte: «Encuéntrame una capacidad que pueda consultar los ingresos del tercer trimestre».
A veces, esa capacidad es una herramienta (una consulta SQL directa a través de un servidor MCP).
A veces, esa capacidad es otro agente (un motor de razonamiento que analiza la salida de SQL).
Para resolver esto, TrueFoundry presenta el Registro unificado de MCP y agentes. Es un catálogo único que trata Herramientas y Agentes como activos detectables e interoperables.
1. La capa de abstracción unificada
El Registro de agentes de IA actúa como una capa de abstracción unificadora. Ingiere recursos dispares (scripts de Python, agentes de LangGraph, bases de datos de Postgres, API de SaaS) y los proyecta todos de forma estandarizada Capacidades.
Para el orquestador, una «base de datos» y un «agente analista junior» tienen el mismo aspecto: ambos son solo puntos finales que aceptan un esquema JSON y devuelven un resultado.

Figura 1: Modelo de datos de entrada de registro de agentes
2. El paradigma del «agente como herramienta» (a través de MCP)
El mayor obstáculo para la colaboración entre varios agentes es la falta de coincidencia de la interfaz. Un agente de LangGraph dice «Actualizaciones de estado»; un agente de CrewAI dice «Tareas».
TrueFoundry estandariza esto mediante el Protocolo de contexto modelo (MCP).
Al registrar un agente en el Gateway, Registro lo envuelve automáticamente en una interfaz MCP. Esto significa que su sofisticado «agente analista financiero» tiene exactamente el mismo aspecto que una llamada de función estándar para el resto del sistema.
- Realidad interna: Un agente de Python complejo con memoria, planificación y 3 subagentes.
- Interfaz externa: Una definición de la herramienta MCP.
Esto permite que un «agente administrador» invoque a un «subagente» con la misma facilidad con la que invoca una calculadora, lo que simplifica la orquestación hasta reducirla a un único protocolo.

Figura 2: Ejemplo de agente como herramienta
3. Descubrimiento semántico: encontrar la capacidad, no solo la identidad
¿Cómo sabe un agente qué herramienta usar? No debería necesitar saber el nombre.
El Registro utiliza Vector Embeddings para asignar la intención del lenguaje natural a las capacidades técnicas.
- Intención del agente: «Necesito comprobar si el servidor está en buen estado».
- Consulta de registro: Escanea las descripciones de todos los servidores y agentes MCP registrados.
- Coincidencia semántica:
- prometheus-mcp (Herramienta): «Consulta métricas de Prometheus» (Puntuación: 0,92)
- sre-bot-v1 (Agent): «Diagnosticar y solucionar problemas de infraestructura» (Puntuación: 0.88)
El Gateway devuelve ambas opciones. El agente que llama puede entonces decidir: ¿Necesito una métrica sin procesar (herramienta) o un diagnóstico (agente)?
4. Enrutamiento basado en la confianza: «Consígueme el Verificado Experto»
En una empresa descentralizada, es posible que diferentes equipos desplieguen cinco «agentes de codificación» diferentes. ¿Cuál deberías usar?
Un registro estático simplemente los enumeraría todos. El registro de TrueFoundry tiene estado. Se conecta al observabilidad de la pasarela de IA capa a pista
el rendimiento en vivo de cada activo, incluidas las tasas de éxito, la latencia y las puntuaciones de evaluación.
- coder-agent: v1 (tasa de éxito: 88%, latencia: 2 s)
- coder-agent:v2-canary (tasa de éxito: 95%, latencia: 5 s)
Puede configurar Políticas de enrutamiento directamente en el Registro:
«Para los cambios en el código de producción, diríjase ÚNICAMENTE a los agentes con una puntuación de fidelidad superior al 90% en la última edición de la evaluación».
Esto garantiza que su capa de orquestación no solo se conecte a disponible agentes, pero para competente unos.
5. Control de topología: el firewall del organigrama
A medida que crece hasta tener cientos de agentes y miles de herramientas de MCP, corre el riesgo de convertirse en una «malla de espagueti» en la que todos los agentes pueden utilizar todas las herramientas. Se trata de una pesadilla de seguridad.
El Registro hace cumplir Topología de grafos. Actúa como el «organigrama» de su fuerza laboral digital.
- Regla: El Public-Support-Bot puede llamar al Documentation-MCP.
- Regla: El Public-Support-Bot es DENEGADO acceso al agente de nómina.
Esta comprobación se realiza en Capa de descubrimiento. Cuando el bot de soporte pregunta «¿Quién puede ayudarme con la nómina?» , el Registro simplemente devuelve «No se han encontrado resultados». No puedes atacar lo que no puedes ver.
Conclusión
El registro unificado de MCP y agentes es la columna vertebral de Cognitive Enterprise. Tratando Agentes y herramientas como ciudadanos iguales y reconocibles, y agrupándolos en una capa unificada de seguridad y observabilidad, TrueFoundry le permite crear flujos de trabajo complejos y confiables a partir de componentes dispares.
TrueFoundry AI Gateway ofrece una latencia de entre 3 y 4 ms, gestiona más de 350 RPS en una vCPU, se escala horizontalmente con facilidad y está listo para la producción, mientras que LitellM presenta una latencia alta, tiene dificultades para superar un RPS moderado, carece de escalado integrado y es ideal para cargas de trabajo ligeras o de prototipos.
La forma más rápida de crear, gobernar y escalar su IA















.png)


.webp)




.webp)







