Convertir el caos de la IA en control: una conversación sobre la IA de agencia con Tesseract Talks
.webp)
Diseñado para la velocidad: ~ 10 ms de latencia, incluso bajo carga
¡Una forma increíblemente rápida de crear, rastrear e implementar sus modelos!
- Gestiona más de 350 RPS en solo 1 vCPU, sin necesidad de ajustes
- Listo para la producción con soporte empresarial completo
A medida que las empresas pasan de experimentar con modelos lingüísticos de gran tamaño a implementar sistemas de IA basados en agencias en la producción, está surgiendo un nuevo conjunto de desafíos. Los equipos avanzan más rápido que nunca, pero con frecuencia en direcciones diferentes. Los modelos, las herramientas, los marcos y los agentes se multiplican, y con ese crecimiento viene la fragmentación.
En un episodio reciente de Tesseract Talks, John K. Thompson conversó con Nikunj Bajaj, cofundador y director ejecutivo de TrueFoundry, para explorar lo que realmente se necesita para ampliar la IA de las agencias dentro de las grandes organizaciones.
Estas son algunas de las conclusiones más importantes de la conversación.
Desde aplicaciones de LLM simples hasta sistemas de agencia complejos
Los sistemas de IA han evolucionado drásticamente, especialmente durante el último año.
Lo que solía ser una única llamada de LLM con una herramienta ahora se ha convertido en una red de componentes que trabajan juntos. Los agentes aptos para la producción suelen combinar:
- Múltiples LLM (a menudo entre proveedores y nubes)
- Protocolos de contexto modelo (MCP) y herramientas
- Barandas para la seguridad, la privacidad y el cumplimiento
- Indicaciones y lógica de orquestación
- Otros agentes, compuestos jerárquicamente
Como explicó Nikunj, esta complejidad no es accidental, es el resultado natural de que los agentes se vuelvan más capaces. Pero también significa que los diferentes equipos de la misma empresa están creando agentes de maneras muy diferentes, utilizando diferentes conjuntos y marcos.
Esa flexibilidad ayuda a los equipos a moverse con rapidez. A gran escala, también crea caos.
El verdadero desafío empresarial: velocidad y control
Las empresas se enfrentan a la necesidad de equilibrar dos fuerzas contrapuestas: dar a los equipos autonomía para experimentar y ofrecer valor rápidamente y, al mismo tiempo, mantener la coherencia en toda la empresa en torno a la seguridad, la gobernanza y los costos. Nikunj definió esto como «ejecución federada con gobierno centralizado».
Al principio, cuando los equipos son pequeños, la autonomía funciona bien. Sin embargo, a medida que las organizaciones crecen, las políticas, los presupuestos y la supervisión se vuelven esenciales. Los empleados humanos operan con flexibilidad pero dentro de un sistema estructurado. La IA de las agencias necesita lo mismo.
La IA de las agencias necesita lo mismo.
Aquí es donde surge la idea de un Puerta de enlace de IA entra. Según Nikunj, la pasarela ha evolucionado mucho más allá de ser un simple proxy para enrutar solicitudes entre modelos. Hoy en día, se está convirtiendo en:
- Un punto de entrada unificado para los LLM, los MCP, los agentes, las indicaciones y las barandillas
- Una capa de normalización entre los proveedores de nube y los proveedores de modelos
- Un lugar para hacer cumplir el control de acceso, los límites presupuestarios y las políticas de cumplimiento
- Una base para la observabilidad y la depuración
En resumen, se convierte en la sede de la agencia, el plano de control del que carecían las empresas.
Cómo pensamos sobre el papel de TrueFoundry
En TrueFoundry, no vemos la IA agencial como una serie de proyectos puntuales. La vemos como una transformación a largo plazo. Como explicó Nikunj, nos centramos en ayudar a las empresas a:
- Mantenga su sistema de IA preparado para el futuro a medida que el ecosistema evoluciona
- Integre las nuevas capacidades de los agentes en la infraestructura existente
- Evite la falsa elección entre construir todo por sí mismos o comprar herramientas rígidas
Al proporcionar una plataforma flexible basada en API, los equipos pueden construir sobre una base sólida y avanzar más rápido sin perder el control.
Como dijo Nikunj: «Los agentes necesitan flexibilidad para actuar. Las empresas necesitan una sede para controlarlas».
TrueFoundry AI Gateway ofrece una latencia de entre 3 y 4 ms, gestiona más de 350 RPS en una vCPU, se escala horizontalmente con facilidad y está listo para la producción, mientras que LitellM presenta una latencia alta, tiene dificultades para superar un RPS moderado, carece de escalado integrado y es ideal para cargas de trabajo ligeras o de prototipos.
La forma más rápida de crear, gobernar y escalar su IA















.png)


.webp)




.webp)







