Precios de Cloudflare AI Gateway [Un desglose completo]

Diseñado para la velocidad: ~ 10 ms de latencia, incluso bajo carga
¡Una forma increíblemente rápida de crear, rastrear e implementar sus modelos!
- Gestiona más de 350 RPS en solo 1 vCPU, sin necesidad de ajustes
- Listo para la producción con soporte empresarial completo
Cloudflare AI Gateway se ha convertido rápidamente en una opción popular para los equipos que buscan administrar, monitorear y enrutar el tráfico de LLM a través de un proxy centralizado. A medida que la adopción de la LLM se acelera en todos los sectores, los equipos están introduciendo cada vez más pasarelas de IA para aumentar la observabilidad, la seguridad y el control entre sus aplicaciones y los modelos de terceros.
Sin embargo, a medida que aumenta el uso de la IA, la claridad de los precios se convierte en un factor fundamental. Los equipos deben comprender no solo los costos por llamada, sino también la infraestructura y los patrones operativos que influyen en el gasto a largo plazo.
A primera vista, Precios de Cloudflare AI Gateway parece simple, especialmente con acceso gratuito a las funciones principales. Sin embargo, el uso en el mundo real a menudo revela los costos ocultos relacionados con el registro, la retención de datos y los límites de escalado.
En este blog, desglosamos:
- Exactamente lo que pagas cuando usas Cloudflare AI Gateway
- Los costos indirectos que los equipos suelen pasar por alto
- Por qué las empresas que escalan eventualmente migran a alternativas integradas en la VPC, como TrueFoundry, para tener más control
¿Qué es Cloudflare AI Gateway?
Antes de cubrir Costo de Cloudflare AI Gateway, es importante entender qué hace y dónde encaja en la pila de IA.
Cloudflare AI Gateway actúa como una capa centralizada para los equipos que implementan aplicaciones de IA que dependen de proveedores de LLM externos. Permite a los equipos:
- Dirija el tráfico de IA de forma segura entre aplicaciones y múltiples proveedores de modelos básicos como OpenAI, Anthropic y Hugging Face.
- Obtenga visibilidad en indicaciones, respuestas, latencia y métricas de uso para la observabilidad y el monitoreo.
- Integre directamente con el paquete de IA más amplio de Cloudflare, que incluye Workers AI, almacenamiento en caché, limitación de velocidad e infraestructura perimetral global.
Características de Cloudflare AI Gateway que afectan su costo
Si bien Cloudflare AI Gateway no cobra por token, hay varias funciones que afectan indirectamente al coste total de propiedad (TCO) a medida que aumenta el uso:
- Enrutamiento de solicitudes y limitación de velocidad: Ayuda a controlar el flujo de tráfico, pero aumenta la cantidad de eventos registrados a medida que aumenta el uso de la IA. Requiere un plan Workers Paid de Cloudflare para una ejecución de gran volumen.
- Almacenamiento en caché de mensajes y respuestas: Reduce las llamadas repetidas a los modelos anteriores (lo que ahorra dinero en comisiones simbólicas), pero la eficiencia depende de los patrones de tráfico y de la tasa de aciertos de la caché.
- Análisis de uso y seguimiento de tokens: Requiere un registro persistente, lo que puede generar costos adicionales relacionados con el almacenamiento y la retención.
- Integración con varios proveedores de IA: Aumenta la flexibilidad, pero hace que los factores de observabilidad de los costos de la IA, como la atribución y la previsión entre los proveedores, sean más complejos.
- Facturación unificada (nueva para 2026): Cloudflare ahora te permite pagar el uso de modelos de terceros (OpenAI, etc.) directamente a través de tu factura de Cloudflare, añadiendo una pequeña tarifa de conveniencia por transacción.
- Integración con Logpush: La transmisión de registros a un bucket S3 externo o a una herramienta SIEM es una función de pago que conlleva costes adicionales (0,05 USD por millón de registros después de 10 millones al mes en planes de pago).

Niveles de precios de Cloudflare AI Gateway
Cloudflare utiliza un modelo «freemium» en el que la propia puerta de enlace está disponible para todos los usuarios, pero la escalabilidad de la aplicación normalmente requiere una transición del nivel gratuito al nivel Workers Paid.
El AI Gateway de Cloudflare está disponible en todos los planes de precios de Cloudflare y las funciones principales son de uso gratuito. Además de tu plan de Cloudflare, no hay ninguna tarifa de pasarela por llamada: solo tienes que añadir la pasarela y empezar a enviar tráfico.
De forma predeterminada, Cloudflare incluye una capa gratuita de análisis y panel de control, almacenamiento en caché, limitación de velocidad y registro, por lo que muchos equipos pueden activarla sin coste adicional.
Sin embargo, en el plan gratuito, se aplican algunos límites. Por ejemplo, la capa gratuita (Workers Free) de Cloudflare incluye un total de 100 000 registros de AI Gateway al mes (en todas las pasarelas) y deja de iniciar sesión más allá de esa cantidad.
Para aumentar los límites, debes cambiarte a un plan Workers Paid, que ofrece un total de 1 000 000 de registros. Cabe destacar que Cloudflare no cobra por registro en los niveles gratuitos o de pago: puedes mantenerte dentro de los registros incluidos o actualizarlos.
Planes de precios de Cloudflare AI gratuitos y de pago
Como Cloudflare AI Gateway se basa en Workers, el uso intensivo de la pasarela puede provocar la facturación de Workers.
De Cloudflare Trabajadores remunerados el plan comienza con un Suscripción mensual de $5 (https://developers.cloudflare.com/workers/platform/pricing/) e incluye una gran asignación de uso. Por ejemplo, los trabajadores estándar (remunerados) incluyen 10 millones de solicitudes y 30 millones de CPU ejecutadas al mes.
Más allá de eso, Cloudflare cobra 0,30 USD por cada millón de solicitudes adicionales y 0,02 USD por cada millón de milisegundos de CPU adicionales.
En la práctica, esto significa que una puerta de enlace que atiende 15 millones de solicitudes (con un uso promedio de CPU) cuesta alrededor de 8 dólares en total en un mes. Por el contrario, el plan gratuito de Cloudflare AI solo incluye 100 000 solicitudes al día y un uso mínimo de la CPU; una vez superados esos límites, tus trabajadores simplemente dejarán de funcionar (sin cargos inesperados, sino una interrupción del servicio).
💡 En resumen: Las aplicaciones de IA de uso ligero pueden permanecer dentro de la capa gratuita de Cloudflare, pero las cargas de trabajo de producción suelen requerir que los trabajadores paguen (más de 5 dólares de uso) para escalar de forma fiable.
Volumen de solicitudes y costos de registro
Según el plan Workers Paid, Cloudflare AI Gateway aún tiene pautas de uso. El plan Workers Paid incluye hasta 1 000 000 de registros de AI Gateway al mes (en todos los gateways).
Si subes los registros más allá de esa cantidad, no puedes pagar un excedente; debes eliminar los registros antiguos o actualizar tu plan a Enterprise. El almacenamiento de registros tiene un límite: de forma predeterminada, cada puerta de enlace puede almacenar aproximadamente 10 millones de registros (puedes establecer tu propio límite) y, una vez llena, no se guarda ningún registro nuevo.
Por lo tanto, aunque el registro está «incluido», hay un límite efectivo en cuanto a la cantidad de historial que guardas.
Cloudflare también ofrece Integración con Logpush (https://developers.cloudflare.com/logs/logpush/) transmisión de registros a tu almacenamiento, pero solo con el plan de pago: recibes 10 millones de solicitudes de logpush al mes gratis, entonces 0,05 USD por millón adicional.
En esencia, la puerta de enlace de IA de Cloudflare en sí misma no tiene una tarifa por solicitud, pero admitir un registro de gran volumen implica costos ocultos. Conservar más registros (más allá de la cantidad gratuita permitida) puede forzar el almacenamiento en sistemas externos o provocar una eliminación más agresiva de los registros. Y si deseas el envío automático de registros (por motivos de SIEM o para cumplir con las normas), esa función solo está disponible en los planes de pago con tarifas de uso.
Todos estos factores significan que los costos de las pasarelas de Cloudflare pueden aumentar indirectamente con el uso: pagas por el plan Workers más cualquier registro o almacenamiento que supere la línea de base.
Costos de uso indirecto
Más allá del servicio AI Gateway, recuerde que todas las solicitudes que gestiona la puerta de enlace siguen llamando a un proveedor de modelos subyacente. Cloudflare no sustituye al modelo: redirige tus llamadas a OpenAI, etc., por lo que sigues pagando las tarifas de los tokens del modelo por separado.
💡 En otras palabras: Cloudflare elimina la imprevisibilidad de la capa de red, pero no elimina los cargos por token de OpenAI/Anthropic/etc.
Además, el uso intensivo de Workers (por ejemplo, la lógica de solicitudes complejas o el almacenamiento en caché) conlleva gastos de procesamiento, como se indicó anteriormente. Básicamente, el uso de Cloudflare AI Gateway implica un coste base del plan Workers y unos límites de registro, más lo que gastes en llamar a los modelos actuales.
Los costos ocultos: lo que no está incluido en los precios de Cloudflare AI Gateway
Más allá de las tarifas publicadas, hay varios costos y riesgos ocultos a tener en cuenta con AI Gateway de Cloudflare.
1. Límites de retención de registros
Si bien el registro básico es gratuito, Cloudflare aplica límites de retención estrictos. Si tu aplicación necesita retener más de 100 000 registros (gratuitos) o 1 millón (de pago) al mes, no puedes simplemente pagar por los registros adicionales, sino que el almacenamiento simplemente se detiene.
Para mantener historiales largos, debes eliminar manualmente las entradas antiguas o actualizarlas (posiblemente a un plan empresarial). Este problema presupuestario puede resultar sorprendente si te basas en los registros para depurar o auditar.
2. Privacidad y soberanía de datos
De forma predeterminada, la puerta de enlace de Cloudflare captura todos los datos de solicitud y respuesta (incluidas las indicaciones, las respuestas del modelo, los tokens, etc.) en su propia infraestructura. Si bien Cloudflare te permite inhabilitar el registro para cumplir con la privacidad, excluirte significa perder visibilidad.
De lo contrario, estás enviando datos potencialmente confidenciales (consultas de usuarios, resultados, posiblemente PII) a la nube de Cloudflare. Muchos proveedores se refieren a esto como el enfoque de la «caja negra»: los registros y las métricas están fuera de tu control.
Como señala un análisis, esto puede «obligar a los datos del cliente, incluida la PII o la información privada, a abandonar su entorno seguro». En resumen, si necesitas una gobernanza de datos estricta o un cumplimiento estricto, puede resultar inaceptable enviar a Cloudflare instrucciones o respuestas sin procesar.
3. Enrutamiento por caja negra
En relación con esto, el enrutamiento dinámico y la lógica de respaldo de Cloudflare son opacas. Internamente, la puerta de enlace decide qué punto final del proveedor o respuesta en caché usar. Los clientes no pueden ver la heurística detallada de enrutamiento o rendimiento.
Este plano de control «cerrado» significa que debes confiar en los algoritmos de Cloudflare para la selección de modelos, el almacenamiento en caché y la conmutación por error, sin una visión granular. Para algunas organizaciones (como las que se someten a auditorías estrictas), esta falta de transparencia supone un coste oculto: no se puede certificar completamente lo que ha ocurrido dentro de la pasarela.
4. Límites de recursos y escalamiento
Los límites estrictos del plan gratuito (límites de solicitudes diarias, límites de registro) pueden provocar limitaciones repentinas o fallos en las aplicaciones en crecimiento. A diferencia de las nubes de pago por uso, la capa gratuita de Cloudflare simplemente se detiene, no factura.
Pasar a planes de pago puede requerir cambios en la arquitectura. Por ejemplo, llegar a los 100 000 registros al día sin darse cuenta disminuirá el registro de forma inesperada. Estas restricciones operativas se traducen en costos de productividad «ocultos»; es posible que necesite más trabajo de DevOps para gestionar los registros eliminados o realizar una actualización a mitad de proceso.
💡 Resumen: Los precios de AI Gateway de Cloudflare pueden parecer «gratuitos», pero cualquier implementación que no sea trivial debe tener en cuenta las tarifas de uso de los trabajadores, las necesidades de registro y almacenamiento y los problemas de gobernanza de datos. Los equipos deben presupuestar para monitorear el uso de Workers, el posible envío o almacenamiento de registros y el posible esfuerzo de ingeniería que implicaría mantenerse dentro de los límites de Cloudflare.
Cuando los precios de Cloudflare AI Gateway tienen sentido
Cloudflare AI Gateway brilla en escenarios específicos. Para Funciones de IA ligeras o centradas en la periferia, ofrece una rampa de acceso rápida. Si ya utilizas CDN/Workers de Cloudflare, puedes añadir llamadas de IA con cambios mínimos (basta con cambiar el punto final de la API).
Esto es ideal para equipos pequeños o empresas emergentes que desean una puerta de enlace instantánea implementada en el borde sin gastos de DevOps. Los proyectos en fase inicial pueden aprovechar el plan de precios gratuito de Cloudflare para crear prototipos de experiencias globales impulsadas por la IA y almacenar en caché las respuestas más populares para agilizar el proceso.
También se adapta a casos de uso en los que la distribución global importa. Por ejemplo, los chatbots o las inferencias que se ejecutan directamente en la red de Cloudflare pueden beneficiarse de los más de 250 PoP de Cloudflare y de la protección contra DDoS integrada. La simple limitación de la velocidad y los reintentos a través de Cloudflare también son atractivos para las aplicaciones que necesitan una resiliencia básica.
En esencia, los precios de Cloudflare AI Gateway tienen sentido cuando valoras la velocidad de integración y la amplitud de la red de Cloudflare, y cuando tu uso es lo suficientemente modesto como para mantenerse dentro del plan gratuito (o solo superarlo moderadamente).
Sin embargo, para las grandes organizaciones con cargas de trabajo de gran volumen o altamente reguladas, estas ventajas pueden verse superadas por los costos ocultos de la IA de Cloudflare. La falta de un control detallado y de asignaciones de uso fijas pueden dificultar la elaboración de presupuestos y el cumplimiento.
Por qué algunos equipos miran más allá de Cloudflare AI Gateway
A medida que los sistemas de IA maduran, las prioridades pasan de una configuración rápida a la previsibilidad de los costos, la seguridad y la propiedad. Los equipos comienzan a dejar atrás el tamaño de Cloudflare AI Gateway debido a:
- Uso creciente de la IA: A medida que aumenta el uso del modelo, aumenta el volumen de tokens y la necesidad de precios alineados con la infraestructura se vuelve urgente. Las abstracciones de Cloudflare pueden dificultar la previsión.
- Requisitos de cumplimiento y residencia de datos: Las industrias reguladas a menudo necesitan un control total sobre dónde se procesan las solicitudes y las finalizaciones. El modelo SaaS de Cloudflare presenta complicaciones legales y de auditoría en relación con el cumplimiento de la residencia de datos.
- Flujos de trabajo de agencias y canalizaciones de RAG: Las cargas de trabajo de generación aumentada con razonamiento en varios pasos y recuperación exigen un control estricto, registros más detallados y, a veces, un alojamiento de modelos locales, todo lo cual está limitado por la infraestructura de caja negra de Cloudflare.
Cómo TrueFoundry aborda los precios de AI Gateway de manera diferente
Si necesita los beneficios de una puerta de enlace de IA pero no puede comprometer la seguridad, la observabilidad o el control de la infraestructura, TrueFoundry ofrece un enfoque fundamentalmente diferente.
TrueFoundry implementa el AI Gateway directamente dentro de su propia cuenta en la nube (AWS, GCP, Azure) o servidor. El plano de control (que gestiona la configuración y los ajustes) lo gestiona TrueFoundry, pero el plano de datos, en el que se procesan las solicitudes y respuestas reales, permanece completamente en su VPC.
Sus datos nunca abandonan su infraestructura a menos que elija trasladarlos de forma explícita. En la práctica, esto significa:
- Usted aloja el servicio de puerta de enlace en su infraestructura y dirige todo el tráfico de LLM a través de su propia red.
- Los registros, las solicitudes y las respuestas nunca salen de su cuenta en la nube a menos que configure las exportaciones externas.
- La observabilidad está integrada de forma nativa: los registros van a su depósito, base de datos o herramientas de análisis internas de S3, lo que preserva la soberanía total de los datos.
- Usted controla las copias de seguridad, la asignación de recursos, las políticas de cifrado y el escalado mediante su propia infraestructura y protocolos de seguridad.
Esto elimina el problema de la «caja negra» que se observa en las plataformas que priorizan el SaaS, como Cloudflare. Con TrueFoundry AI Gateway, obtendrá un rendimiento transparente, una visibilidad de los costes y una propiedad total.
Precios de TrueFoundry
Si se hospeda automáticamente con un plan empresarial, el único costo marginal es la infraestructura (normalmente entre 600 y 1000 dólares al mes, según la escala). Incluso en la versión SaaS, TrueFoundry no cobra tarifas de alojamiento más allá del almacenamiento o el uso de la nube que hayas seleccionado.
Esto da como resultado una estructura de costos altamente predecible: los equipos pueden pronosticar el crecimiento, actualizar los niveles gradualmente y mantener el control a nivel de infraestructura en todo momento.
Con TrueFoundry, puede:
- Garantice una presupuestación granular: Asigne límites de uso por equipo, por ejemplo, «La ingeniería recibe 500 dólares y el marketing 200 dólares» y supervise el uso en tiempo real.
- Implemente el enrutamiento abierto: Conéctese a las API comerciales (OpenAI, Anthropic) o dirija el tráfico a sus propios modelos ajustados que se ejecutan en instancias de EC2, GKE o puntuales.
- Habilite el aislamiento de nivel empresarial: Mantenga el cumplimiento total de los mandatos de IAM, redes privadas y localidad de datos.
Cloudflare AI Gateway vs TrueFoundry: comparación detallada
Las empresas que evalúan las pasarelas de IA suelen comparar un servicio gestionado como Cloudflare con una plataforma autohospedada como TrueFoundry. A continuación se muestra una comparación de los factores clave:
¿Está preparado para crear IA sin sorpresas en los precios?
La selección de una puerta de enlace de IA es una decisión de infraestructura a largo plazo, no solo una cuestión de coste inicial. Puerta de enlace de IA de Cloudflare funciona bien para cargas de trabajo de IA ligeras y centradas en los bordes y para la experimentación temprana.
Sin embargo, a medida que los sistemas avanzan hacia la escala de producción, las prioridades pasan al control de costos, la observabilidad, el cumplimiento y la flexibilidad.
Plataformas como True Foundry están diseñados para equipos que escalan la IA en producción, donde la propiedad de la infraestructura, la privacidad de los datos y la presupuestación basada en el uso son muy importantes.
Una empresa emergente en expansión migró de Cloudflare a TrueFoundry después de que los impredecibles costos de registro comenzaran a superar los presupuestos de computación. Al cambiarse a una puerta de enlace autohospedada en su VPC de AWS, lograron Reducción de costos del 35%, unificó el registro en S3 y dirigió el tráfico a una combinación de modelos OpenAI y Mistral privados, todo ello con controles presupuestarios claros por equipo.
También puede obtener resultados similares para su organización. Reserva una demostración para ver cómo TrueFoundry puede aportar a su equipo la previsibilidad y el control de los costos de la IA.
Preguntas frecuentes
¿Cloudflare AI Gateway es gratuito?
Sí, Cloudflare ofrece acceso gratuito a las funciones de AI Gateway en sus niveles estándar y Workers Paid. Sin embargo, los límites de uso, las políticas de retención de registros y la computación subyacente (por ejemplo, el tiempo de CPU de los trabajadores) pueden generar costos ocultos a medida que aumenta la escala.
¿Cuánto costará Cloudflare AI?
Cloudflare AI Gateway en sí no tiene una tarifa por solicitud. Los costos surgen en función de:
- Volumen y retención de registros (p. ej., 100 000 registros en la capa gratuita y 1 millón en Workers Paid).
- Uso de los trabajadores para procesar y enrutar solicitudes.
- Nivel de plan de Cloudflare (p. ej., Standard o Enterprise).
Los precios pueden volverse impredecibles en grandes volúmenes sin planes personalizados o administración de registros externa.
¿Por qué es TrueFoundry más rentable que la IA de Cloudflare?
TrueFoundry se ejecuta completamente dentro de su propia nube (AWS, GCP, Azure), lo que elimina los costos de transferencia de datos y los márgenes de SaaS. Solo paga por el procesamiento y el almacenamiento que asigna, con total flexibilidad de enrutamiento, registros transparentes y sin depender de un proveedor. Los equipos también pueden optar por modelos privados o usar instancias puntuales para reducir los costos entre un 60 y un 70% en comparación con las API administradas.
TrueFoundry AI Gateway ofrece una latencia de entre 3 y 4 ms, gestiona más de 350 RPS en una vCPU, se escala horizontalmente con facilidad y está listo para la producción, mientras que LitellM presenta una latencia alta, tiene dificultades para superar un RPS moderado, carece de escalado integrado y es ideal para cargas de trabajo ligeras o de prototipos.
La forma más rápida de crear, gobernar y escalar su IA















.png)


.webp)




.webp)







