Próximo seminario web: Seguridad empresarial para Claude Code | 21 de abril · 11:00 a. m. PST. Regístrese aquí →

Evaluación comparativa del TrueFoundry LLM Gateway: es increíblemente rápido ⚡

Por Srihari Radhakrishna

Actualizado: November 12, 2024

Resumir con
  • TrueFoundry LLM Gateway proporciona una interfaz unificada compatible con OpenAI para varios proveedores de LLM como Anthropic, OpenAI, Bedrock, Gemini y muchos otros
  • TrueFoundry LLM Gateway se amplía sin problemas hasta 350 RPS en una sola réplica de 1 unidad de CPU y utiliza 270 MB de memoria. Lo comparamos con otro producto de puerta de enlace, LitellM, que tenía una configuración similar y LitellM no pudo escalar más allá de los 50 RPS
  • TrueFoundry LLM Gateway solo agrega una latencia adicional de 3 a 5 ms, mientras que LitELLM agrega entre 15 y 30 ms por solicitud.

¿Por qué su organización necesita un LLM Gateway?

Una pasarela de LLM proporciona una interfaz unificada para administrar el uso de LLM de su organización:

  • API unificada: Acceda a varios proveedores de LLM a través de un solo Compatible con OpenAI interfaz, no es necesario cambiar el código
  • Seguridad de claves de API: Administración de credenciales segura y centralizada
  • Gobernanza y control: Establezca límites, controles de acceso y filtrado de contenido
  • Limitación de velocidad: Prevenir el abuso y garantizar un uso justo
  • Observabilidad: Realice un seguimiento del uso, los costos, la latencia y el rendimiento
  • Equilibrio de carga: Dirige automáticamente las solicitudes entre los proveedores
  • Administración de costos: Supervise los gastos y establezca alertas presupuestarias
  • Registros de auditoría: Registra todas las interacciones de LLM para garantizar el cumplimiento

¿Qué tan rápido es TrueFoundry LLM Gateway?

Configuración de la prueba de carga

Para nuestro experimento de prueba de carga, configuramos una implementación de esto servicio de punto final falso de OpenAI usando TrueFoundry. El servicio simularía el formato de solicitud y respuesta de OpenAI sin producir realmente tokens.

También implementamos el TrueFoundry LLM Gateway y el servidor proxy LitELLM, ambos ejecutados en una única réplica con 1 unidad de CPU y 1 GB de memoria.

Añadimos nuestro proveedor falso de OpenAI a las pasarelas TrueFoundry y LitellM. Durante las pruebas de carga, realizamos solicitudes al servidor falso de OpenAI de tres maneras diferentes:

  • Configuración 1: Directamente sin usar ningún proxy o puerta de enlace
  • Configuración 2: A través de la puerta de enlace LLM de TrueFoundry implementada en 1 unidad de CPU y 1 GB de memoria
  • Configuración 3: A través del servidor proxy LitellM implementado en 1 unidad de CPU y 1 GB de memoria
RPS 10 RPS 50 RPS 200 RPS 300 RPS
OpenAI direct (Setup 1) 73 ms 73 ms 73 ms 73 ms
TrueFoundry LLM Gateway (Setup 2) 76 ms (+3 ms) 76 ms (+3 ms) 76 ms (+3 ms) 77 ms (+4 ms)
LiteLLM Proxy (Setup 3) 88 ms (+15 ms) 99 ms (+26 ms) Could not scale to 200 RPS Could not scale to 300 RPS

Observaciones

  1. TrueFoundry Gateway agrega solo 3 ms adicionales de latencia hasta 250 RPS y 4 ms a RPS > 300
  2. TrueFoundry LLM Gateway pudo escalar sin ninguna degradación en el rendimiento hasta aproximadamente 350 RPS (1 vCPU, máquina de 1 GB) antes de que la utilización de la CPU alcanzara el 100% y las latencias empezaron a verse afectadas. Con más CPU o más réplicas, el LLM Gateway puede escalar a decenas de miles de solicitudes por segundo.
  3. LitellM en la misma máquina no pudo escalar más allá de 40 a 50 RPS antes de alcanzar el límite de CPU

Más métricas

Configuración 1: Llamada directa a terminales de OpenAI

Estadísticas a 200 RPS
Estadísticas a 300 RPS
Tiempo de respuesta frente a RPS

Configuración 2: Puerta de enlace LLM de TrueFoundry

Estadísticas a 200 RPS
Estadísticas a 300 RPS
Tiempo de respuesta frente a RPS

Configuración 3: LitellM

Estadísticas a ~ 58 RPS
Tiempos de respuesta frente a RPS

Características de velocidad de LLM Gateway

  • Gastos generales casi nulos: Solo de 3 a 5 ms de latencia añadida
  • Backend optimizado: Construido con el marco Node.js de alto rendimiento
  • Almacenamiento en caché de configuración: La configuración se almacena en la memoria para una búsqueda rápida
  • Enrutamiento inteligente: Mínima sobrecarga de procesamiento
  • Listo para Edge: Implemente cerca de sus aplicaciones
  • Alta capacidad: UN t2.2 x grande La máquina de instancias de AWS (43$ al mes in situ) puede escalar hasta aproximadamente 3000 RPS sin problemas.
Implementación perimetral de TrueFoundry LLM Gateway

Proveedores compatibles

A continuación se muestra una lista completa de los proveedores de LLM populares compatibles con TrueFoundry LLM Gateway:

Provider Streaming Supported
GCP
AWS
Azure OpenAI
Self Hosted Models on TrueFoundry
OpenAI
Cohere
AI21
Anthropic
Anyscale
Together AI
DeepInfra
Ollama
Palm
Perplexity AI
Mistral AI
Groq
Nomic

La forma más rápida de crear, gobernar y escalar su IA

Inscríbase
Tabla de contenido

Controle, implemente y rastree la IA en su propia infraestructura

Reserva 30 minutos con nuestro Experto en IA

Reserve una demostración

La forma más rápida de crear, gobernar y escalar su IA

Demo del libro

Descubra más

July 20, 2023
|
5 minutos de lectura

LLMOps CoE: la próxima frontera en el panorama de los MLOps

April 16, 2024
|
5 minutos de lectura

Cognita: Creación de aplicaciones RAG modulares y de código abierto para la producción

May 25, 2023
|
5 minutos de lectura

LLM de código abierto: abrazar o perecer

August 27, 2025
|
5 minutos de lectura

Mapeando el mercado de la IA local: desde chips hasta aviones de control

April 22, 2026
|
5 minutos de lectura

Mercados de agentes de IA: el futuro de la automatización de nivel empresarial

No se ha encontrado ningún artículo.
Detailed Guide to What is an AI Gateway?
April 22, 2026
|
5 minutos de lectura

¿Qué es AI Gateway? Conceptos básicos y guía

No se ha encontrado ningún artículo.
April 22, 2026
|
5 minutos de lectura

Aprovechar la puerta de enlace de IA de TrueFoundry para el cumplimiento de FIPS

No se ha encontrado ningún artículo.
April 22, 2026
|
5 minutos de lectura

Integración de GraySwan con TrueFoundry

No se ha encontrado ningún artículo.
No se ha encontrado ningún artículo.

Blogs recientes

Realice un recorrido rápido por el producto
Comience el recorrido por el producto
Visita guiada por el producto