Gartner sobre las pasarelas de IA: esto es lo que deben saber los equipos de IA empresarial

Por Rhea Jain

Published: April 22, 2026

Diseñado para la velocidad: ~ 10 ms de latencia, incluso bajo carga

¡Una forma increíblemente rápida de crear, rastrear e implementar sus modelos!

Gestiona más de 350 RPS en solo 1 vCPU, sin necesidad de ajustes
Listo para la producción con soporte empresarial completo

Empieza con Truefoundry ahora Hable con el experto

Hace un año, la mayoría de los agentes de IA vivían en demostraciones.

Respondieron preguntas, redactaron correos electrónicos, tal vez activaron un chatbot interno. Si algo se rompía, era inconveniente, pero rara vez crítico. Hoy en día, eso ya no es cierto.

Los agentes de IA se están introduciendo silenciosamente en el sistema nervioso de la empresa. Dirigen las solicitudes de los clientes, activan los flujos de trabajo, modifican los datos de producción y hablan con otros agentes. Y ese cambio ha puesto de manifiesto una nueva clase de desafíos para los que muchos equipos no estaban diseñados. Gartner publicó recientemente varios informes sobre ingeniería de IA generativa, pasarelas de IA y sistemas basados en la MCP, haciendo referencia a TrueFoundry en todos ellos. En cada uno de estos informes, sigue surgiendo un tema: a medida que los agentes de IA pasan de los experimentos a los flujos de trabajo empresariales reales, los problemas más difíciles a los que se enfrentan las empresas son los relacionados con el control, la visibilidad y los costes.

Estos son los aspectos más destacados de los informes y lo que significan para los equipos empresariales.

GenAI es ahora una capa de plataforma, no solo una solución puntual

GenAI dejó de ser una función y pasó a ser una plataforma

La primera fase de GenAI Inside Enterprises se centró en ¿podemos hacer esto?
La siguiente fase trata sobre ¿podemos ejecutar esto?

Ese cambio se refleja claramente en la evolución del mercado. En la de Gartner Guía de innovación para la ingeniería de IA generativa, señala que los proveedores van mucho más allá de «impulsar un modelo» y se están decantando por plataformas GenAI completas: que abarcan los procesos, la ingeniería de contexto, la orquestación y la gobernanza. Como se afirma en el informe,»Durante los últimos dos años, los proveedores de ingeniería de IA actuales y nuevos se han apresurado a ofrecer herramientas y servicios que respalden los procesos de GenAI más allá de la simplista orientación de los modelos de GenAI... La ingeniería del conocimiento y el contexto se ha convertido en la capacidad fundamental que distingue las implementaciones exitosas de GenAI de los prototipos experimentales».

En otras palabras: una vez que GenAI se hace realidad, deja de ser una colección de herramientas y comienza a comportarse como una infraestructura, de forma muy parecida a como mejores herramientas de MLOps evolucionó de utilidades modelo aisladas a plataformas de producción completas.

Aquí es donde la idea de una capa de control centralizada se vuelve inevitable. Puede dejar que los equipos se muevan rápidamente entre modelos, nubes y agentes, pero alguien (o algo así) necesita mantener la coherencia del sistema.

En el informe, Gartner coloca a TrueFoundry en su ECuadrante de mercado emergente para la ingeniería de inteligencia artificial generativa como un desafío emergente, que refleja exactamente este cambio: GenAI no se trató como integraciones dispersas, sino como una plataforma con control centralizado y ejecución distribuida

Implicaciones a corto plazo para los líderes de producto

Una vez que GenAI se convierte en una infraestructura de plataforma, en lugar de en un conjunto de experimentos, la presión recae directamente en las personas responsables de administrarla. Las brechas de control que aparecen a nivel del sistema caen rápidamente en los escritorios de los líderes de productos y plataformas.

Para ellos, el enfoque ha empezado a cambiar de «¿Cómo creamos agentes?» a «¿Cómo mantenemos el control una vez que están funcionando?» Los sistemas con múltiples agentes escalan de formas difíciles de predecir. Un agente llama a otro. Ese agente busca herramientas. Los costos aumentan, las latencias aumentan y las fallas se multiplican en cascada en lugares donde nadie instrumenta.

Informe de Gartner Tecnología emergente: carrera de proveedores de IA: las pasarelas de IA marcan el comienzo de la economía de agente a agente lo dice sin rodeos:»Los MAS (sistemas multiagente) no se materializarán a escala en la empresa sin el control y la visibilidad de todos los componentes de estos sistemas.«Esto refleja lo que ya hemos observado en muchos equipos: los sistemas de agentes escalan más rápido que las barreras que los rodean.

Según el mismo informe, para 2028, el 70% de los equipos de ingeniería de software que creen aplicaciones multimodales utilizarán pasarelas de IA para mejorar la confiabilidad y optimizar los costos. Incluso antes, en 2027, el 40% de las empresas tendrán dos o más pasarelas de IA implementadas para controlar y monitorear un MAS heterogéneo. Estas previsiones reflejan una realidad cada vez mayor en las empresas de hoy en día.

Pero no se trata solo del control organizacional, sino que las pasarelas de IA ofrecen beneficios de costos reales a las empresas. En su informe,»Reduzca los costos de IA y mejore la confiabilidad con pasarelas de IA y modelos de enrutadores«Gartner estima que los enrutadores pueden «reducir el costo de inferencia hasta en un 85% para consultas sencillas».

Por qué las puertas de enlace MCP van a ser aún más cruciales

MCP ha hecho algo importante: estandarizó la forma en que los agentes se conectan a las herramientas y entre sí. Sin embargo, cualquiera que haya escalado los servidores MCP entre equipos sabe que la estandarización es solo el principio.

Sin una capa de control, las organizaciones se encuentran rápidamente con:

Definiciones de herramientas duplicadas o poco claras
Autenticación y permisos inconsistentes
Visibilidad limitada sobre qué agentes utilizan qué y por qué
Complejidad operativa que crece más rápido que el número de empleados

Gartner aborda este tema directamente en Prácticas emergentes para servidores y herramientas MCP, recomendando que los servidores MCP se traten «como API de producción» y se controlen mediante una arquitectura centrada en la puerta de enlace que centralice la autenticación, la autorización, la aplicación de políticas y la observabilidad. Gartner incluye a TrueFoundry entre IA y Agent Gateways con soporte para MCP, lo que subraya una conclusión más amplia para los equipos: escalar los sistemas de agencia no solo consiste en protocolos, sino en establecer las estructuras de control adecuadas antes de que la experimentación se convierta en una deuda operativa.

¿Qué deben sacar los equipos empresariales de este cambio?

Las empresas no suelen sentir los cambios arquitectónicos de una sola vez. Al principio se manifiestan como pequeñas fricciones: un aumento inesperado de los costos, un agente que se comporta de manera diferente durante la producción, una revisión de seguridad que, de repente, lleva semanas en lugar de días. Con el tiempo, esas fricciones se acumulan hasta convertirse en una realidad: el sistema ha superado la forma en que se administra.

Ese es el momento en que muchos equipos utilizan la IA de las agencias.

La investigación reciente de Gartner refleja este punto de inflexión. No porque las pasarelas de IA sean nuevas, sino porque los problemas que resuelven se han vuelto inevitables. A medida que los agentes se multiplican y las responsabilidades se difuminan entre modelos, herramientas y equipos, una capa de control centralizada deja de ser una infraestructura opcional y pasa a ser un requisito previo para la escalabilidad.

Los equipos que lo hagan bien no solo enviarán más rápido, sino que sabrán lo que está funcionando, por qué funciona y cómo cambiarlo sin estropear todo lo demás. Esa es la diferencia entre experimentar con la IA y utilizarla.

TrueFoundry AI Gateway ofrece una latencia de entre 3 y 4 ms, gestiona más de 350 RPS en una vCPU, se escala horizontalmente con facilidad y está listo para la producción, mientras que LitellM presenta una latencia alta, tiene dificultades para superar un RPS moderado, carece de escalado integrado y es ideal para cargas de trabajo ligeras o de prototipos.

Diseñado para la velocidad: ~ 10 ms de latencia, incluso bajo carga

Programe su demostración ahora