TrueFoundry: revisión de fin de año de 2025

Diseñado para la velocidad: ~ 10 ms de latencia, incluso bajo carga
¡Una forma increíblemente rápida de crear, rastrear e implementar sus modelos!
- Gestiona más de 350 RPS en solo 1 vCPU, sin necesidad de ajustes
- Listo para la producción con soporte empresarial completo
Si 2024 fue la ignición en órbita, 2025 fue el año en que capturamos un tirachinas gravitacional. En toda gran misión espacial, un tirachinas depende de dos cosas:
una potente fuente de gravedad externa, y suficiente empuje interno para alcanzarlo realmente.
Para nosotros, la rápida aceleración de la demanda de pasarelas de IA se convirtió en esa fuerza gravitacional. ¿Nuestra serie A fue el empuje interno, lo que nos dio la profundidad de ingeniería y la preparación para alcanzar la velocidad de escape y entrar en la órbita correcta para aprovecharla.
Así es como se veía el tirachinas:
Habilitación de velocidad (Serie A) → Alcanzar la órbita de inflexión (AI Gateway) → Asistencia por gravedad (demanda explosiva) → Nave espacial (TrueFoundry) acelera hacia adelante.
Si bien esto puede parecer una sola maniobra heroica impulsada por una chispa audaz, la realidad de construir una misión espacial es mucho más compleja. Los tirachinas no se dan por suerte: son el resultado de miles de cálculos precisos, una preparación incesante y un sinnúmero de correcciones de rumbo. 2025 no fue por arte de magia; fue la unión de la disciplina de la ingeniería, la colaboración con el cliente, la convicción de GTM y una cantidad extraordinaria de persistencia y aprendizaje. Y eso es lo que reflexionamos a continuación, empezando por el punto en el que nos dejó 2024.
TrueFoundry y el año 2024
En 2024, nos asociamos con varias empresas de la lista Fortune 500 y vimos cómo las aplicaciones de agencia comenzaban a funcionar valor empresarial real y medible, que a menudo genera un impacto de nueve cifras. El potencial de impacto ya no era teórico; era innegable. Como señalamos en nuestra última reseña de fin de año, esto también marcó el comienzo de nuestro viaje hacia un mundo de «IA gestionada por IA» con TrueFoundry cada vez más agente por diseño.
Pero a medida que profundizamos, surgieron dos realidades claras:
- El un ecosistema agencial estaba explotando, y construir sistemas confiables, mantenibles y aptos para la producción en un entorno tan dinámico se estaba volviendo mucho más complejo.
- Las empresas estaban por debajo inmensa presión para obtener resultados, y muchos necesitaban una experiencia más profunda, bases de infraestructura más sólidas y orientación práctica para hacerlo con éxito.
Estas ideas dieron forma directa a nuestras inversiones más importantes en 2025:
- Puerta de enlace de IA — para centralizar un ecosistema cada vez más fragmentado y ayudar a las empresas a conectar, observar y controlar las cargas de trabajo de IA de las agencias entre los proveedores.
- Implementación de IA — permite el despliegue de cargas de trabajo de IA, como la inferencia de modelos, el ajuste de LLM, los servidores MCP y los agentes, como aplicaciones de Kubernetes estándar en las pilas empresariales existentes a través de interfaces de desarrollador intuitivas.
- Resultados empresariales — nuestra iniciativa de ingeniería avanzada, que colabora estrechamente con los clientes para convertir la capacidad de la IA en un impacto empresarial real y mensurable.
TrueFoundry y el año 2025
2025 fue un año decisivo para TrueFoundry. Los nuevos ingresos netos se duplicaron (o más) trimestre tras trimestre y Empresas de Fortune 500 de todo el mundo La infraestructura de pagos, semiconductores, telecomunicaciones, seguridad, fabricación de chips, farmacéutica, atención médica y datos confiaron en TrueFoundry para impulsar sus aplicaciones agenciales de nivel de producción más críticas. Analicemos los temas definitorios del año.
Tema 1: AI Gateway
Por qué esto importaba en 2025
Uno de los temas más definitorios de 2025 fue el rápido aumento de la Puerta de enlace de IA como pieza central de la infraestructura de IA empresarial. Solo en los últimos meses, hemos visto cómo la demanda inherente de pasarelas de IA se ha disparado. En la actualidad, aproximadamente El 10% de las empresas utilizan activamente una puerta de enlace, y en los próximos tres años se espera que crezca hasta casi 70%. Lo que antes se consideraba una infraestructura opcional pasó rápidamente a ser fundamental.
La suposición que se rompió
Este cambio se produjo porque la industria, incluidos nosotros, subestimó el problema. En un principio, se supuso que las pasarelas eran capas de proxy delgadas e indiferenciadas que se interponían en la ruta crítica de las solicitudes de LLM y que era mejor crearlas internamente. La realidad demostró lo contrario.
A medida que las empresas pasaban de la experimentación a la producción, la puerta de enlace surgió como un plano de control profundamente complejo: un plano de control que debía gestionar modelos de API en constante cambio, controles organizativos centralizados, políticas de seguridad, gobernanza, observabilidad y confiabilidad a escala.
Vimos este cambio de primera mano cuando los clientes pasaron de «nunca usaremos una puerta de enlace externa» a ejecutar sus aplicaciones de producción más críticas a través de las nuestras en cuestión de meses.
Por qué la complejidad siguió aumentando
Al mismo tiempo, el alcance de lo que había que gobernar se amplió drásticamente. El acceso a la LLM por sí solo ya no era suficiente. A medida que MCP ganaba terreno, las empresas tenían dificultades para autenticar y autorizar un número cada vez mayor de servidores, por lo que, naturalmente, esta responsabilidad recaía en el gateway. A medida que comenzaron a surgir las interacciones entre agentes (A2A), quedó claro que los propios agentes debían estar conectados, observados y gobernados desde el mismo plano de control. Siguió la evolución lógica: LLM Gateway → MCP Gateway → Agent Gateway, que culminó en lo que ahora llamamos el Puerta de enlace de IA.
Cómo lo pensamos hoy
Hoy pensamos en esto de forma clara y sencilla. TrueFoundry proporciona una puerta de enlace de IA de nivel empresarial que abarca una puerta de enlace de LLM, una puerta de enlace de MCP y una puerta de enlace de agente, lo que permite a las empresas conectar, observar y controlar las cargas de trabajo de IA de las agencias en todos los proveedores desde un único plano de control. Nuestro AI Gateway ayuda a las empresas a mantenerse seguras, eficientes y seguras para el futuro mientras crean sistemas cada vez más autónomos, ya sea que se implementen como SaaS, locales o en entornos aislados.
A medida que AI Gateway surgió como el plano de control para gobernar los sistemas de agencias, se hizo evidente otra realidad. Conectar, observar y gobernar la IA era solo una parte de la ecuación. Las empresas también necesitaban un forma confiable y nativa de la empresa de ejecutar estos sistemas en producción — en una infraestructura en la que ya confiaban. Naturalmente, esto nos llevó a nuestro segundo tema, el 2025.
Tema 2: AI Deploy
Llevar los sistemas de agencia a la gama empresarial
A medida que el ecosistema de agencias explotó, las empresas necesitaron una capa de ejecución confiable para ejecutar este ecosistema de rápido movimiento y a menudo caótico en una infraestructura familiar y confiable. AI Deploy es esa capa de ejecución, que permite a los equipos implementar la inferencia de modelos, el ajuste de la LLM, los servidores MCP y los agentes como aplicaciones estándar de Kubernetes, directamente en las plataformas empresariales existentes.
- Se ejecuta en Kubernetes, donde ya se encuentran las cargas de trabajo empresariales
- Se integra perfectamente con los sistemas de observabilidad, RBAC y SSO existentes
- Trata las cargas de trabajo de IA como servicios de producción de primera clase, no como experimentos
Diseñado para un mundo soberano, híbrido y multinube
El 2025 también marcó un fuerte cambio hacia IA soberana. La residencia de datos, la geopatriación y las cargas de trabajo de IA rentables que se ejecutan en centros de datos internos adquirieron cada vez más importancia.
- Implementaciones locales y que dan prioridad a las VPC
- Las cargas de trabajo híbridas y multinube son las predeterminadas, no la excepción
- Escalado rentable en infraestructuras propiedad de la empresa
AI Deploy hizo posible adoptar sistemas de agencia de vanguardia sin abandonar las restricciones empresariales.
Nativo de la interfaz de usuario, el código es lo primero por diseño
Se hizo evidente otro patrón: las empresas necesitaban simplicidad sin pérdida de control.
- Flujos de trabajo nativos de la interfaz de usuario para una iteración más rápida y una adopción más amplia
- Flexibilidad que prioriza el código para una personalización avanzada y casos de uso complejos
- Interfaces sencillas para usuarios empresariales, con toda la potencia de código profesional para ingenieros
AI Deploy se convirtió en la capa de ejecución que permitió a los sistemas de agencia pasar del concepto a la producción de forma limpia, segura y a escala.
Tema 3: Resultados empresariales
A medida que AI Gateway surgió como el plano de control para la IA empresarial y AI Deploy permitió que las cargas de trabajo de las agencias se ejecutaran en las pilas empresariales existentes, una cosa quedó clara: la infraestructura por sí sola no es suficiente. Las empresas no se limitaban a preguntar cómo para construir sistemas de agentes: estaban bajo presión para cumplir resultados empresariales reales, a menudo con plazos ajustados y con un riguroso control reglamentario. Como resultado, redoblamos nuestra apuesta Estrategia de resultados empresariales.
Del experimento a la estrategia
Lo que comenzó como un experimento en 2024 se convirtió en una estrategia en toda regla en 2025. Creamos un equipo de liderazgo dedicado a dirigir Resultados empresariales como empresa y ampliamos nuestro equipo de investigadores de GenAI para trabajar en estrecha colaboración con los clientes en sus iniciativas de IA más importantes.
Creación conjunta de aplicaciones reales
A través de Enterprise Outcomes, desarrollamos conjuntamente aplicaciones de agencia de nivel de producción que definen la industria en atención médica, semiconductores, servicios financieros y telecomunicaciones — no se centró en demostraciones o pilotos, sino en un impacto empresarial mensurable.
Un ciclo de capitalización con la plataforma
También observamos cómo se formaba un poderoso volante. A medida que más casos de uso pasaban a la fase de producción gracias a Enterprise Outcomes, la adopción de nuestra plataforma de implementación fue profundizando. Y a medida que se implementaba una mayor parte de la plataforma, la creación y el escalamiento de nuevos casos de uso se hicieron considerablemente más fáciles. Cada uno se reforzó el otro, creando un ciclo de expansión compuesto que definió la forma en que trabajábamos con las empresas en 2025.
A finales de 2025, AI Gateway, AI Deploy y Enterprise Outcomes habían convergido en un único conjunto operativo: uno que conecta y gobierna los sistemas de Agentic, los ejecuta a escala empresarial y convierte la capacidad inteligente en resultados del mundo real.
Tirón del mercado: cuando la plataforma comenzó a venderse sola
Una de las señales más claras de que esta pila estaba teniendo éxito provino del propio mercado. A lo largo de 2025, empezamos a ver una fuerte atracción por parte de las empresas, tanto en volumen como en urgencia.
- La velocidad de las transacciones mejoró significativamente, con múltiples acuerdos empresariales que se cerraron de principio a fin en dos meses
- Varios POC pasaron del inicio a la producción en días, no semanas
- En algunos casos, los clientes avanzaron sin ningún POC, impulsada por la claridad del valor y la confianza en la plataforma
Este impulso se reflejó directamente en nuestras cifras: un fuerte crecimiento de los ingresos intertrimestral, ciclos de ventas más rápidos y una lista cada vez mayor de nuevos logotipos empresariales. Lo que antes exigía una educación intensiva se convirtió cada vez más en un tema de conversación qué tan rápido los clientes podrían pasar a la producción.
Detrás de este impulso había un equipo que creció con propósito, propiedad y creencias.
El equipo detrás del impulso
Una de las cosas de las que estoy más orgulloso en TrueFoundry es cómo el equipo desde los primeros días siguió creyendo profundamente en la misión y creciendo junto con la empresa. A medida que el tamaño del equipo se triplicó en 2025 (en ventas, marketing, resultados empresariales e ingeniería), ese primer grupo desempeñó un papel fundamental a la hora de dar forma a la cultura y dar la bienvenida a nuevos compañeros de equipo. A mediados de año, tuvimos la oportunidad de unirnos para formar un equipo realmente especial fuera de las instalaciones de las Maldivas. Comparto algunos momentos de eso aquí.


El año 2025 marcó el momento en que nuestra visión, ejecución y atracción del mercado se alinearon, convirtiendo años de preparación en un impulso sostenido hacia adelante.
Mirando hacia el futuro y dando la bienvenida al 2026
De cara al 2026, hay una creencia que sigue guiando nuestra dirección: Los sistemas de IA serán gestionados cada vez más por la IA. Los seres humanos ascenderán en la capa de abstracción (desde la operación de cada paso de un sistema hasta la definición de la intención, las restricciones y los resultados), mientras que los sistemas inteligentes se encargarán de la ejecución.
Vemos dos cambios estructurales que dan forma a la próxima generación de software.
Desde capacitar a los desarrolladores hasta capacitar a todos los trabajadores del conocimiento.
La última década del software consistió en empoderar a los desarrolladores, una de las personas más poderosas de la tecnología, a través de una explosión de herramientas de desarrollo y SaaS. Los próximos años girarán en torno al empoderamiento cada trabajador del conocimiento. GenAI ha ampliado radicalmente lo que puede hacer el software, dando lugar a una nueva clase de sistemas que permiten a las personas crear, razonar y operar flujos de trabajo complejos sin necesidad de ser programadores tradicionales.
De humano al día a humano fuera de lo común.
Estamos empezando a pasar de los sistemas de IA que ayudan a los humanos a sistemas que funcionan de forma autónoma. En este mundo, los agentes no solo responden, sino que planifican, crean, implementan y ejecutan flujos de trabajo de principio a fin. El software se construirá cada vez más para agentes, en el que los seres humanos marcan la dirección y las barandillas en lugar de intervenir de forma continua.
A medida que avanzamos hacia 2026, nuestro objetivo es permitir todos (humanos y sistemas de IA por igual) para construir, implementar y escalar sistemas inteligentes sin esfuerzo y de manera óptima a través de interfaces de computación intuitivas diseñadas tanto para personas como para máquinas.
Estamos aquí para crear sistemas inteligentes que realmente puedan funcionar por sí mismos, y para que los equipos sean lo suficientemente audaces como para hacerlos realidad. Estamos profundamente agradecidos a nuestro equipo, clientes e inversores por su confianza y apoyo, y nos acercamos al 2026 con claridad, convicción y optimismo.
La asistencia de gravedad de 2025 nos dio velocidad. 2026 es aproximadamente dirección — y distancia. ¡Feliz año nuevo!
TrueFoundry AI Gateway ofrece una latencia de entre 3 y 4 ms, gestiona más de 350 RPS en una vCPU, se escala horizontalmente con facilidad y está listo para la producción, mientras que LitellM presenta una latencia alta, tiene dificultades para superar un RPS moderado, carece de escalado integrado y es ideal para cargas de trabajo ligeras o de prototipos.
La forma más rápida de crear, gobernar y escalar su IA















.png)


.webp)




.webp)







