Explicación de los precios de Databricks Mosaic AI Gateway (2026)
.webp)
Diseñado para la velocidad: ~ 10 ms de latencia, incluso bajo carga
¡Una forma increíblemente rápida de crear, rastrear e implementar sus modelos!
- Gestiona más de 350 RPS en solo 1 vCPU, sin necesidad de ajustes
- Listo para la producción con soporte empresarial completo
Databricks Mosaic AI Gateway se posiciona como una interfaz unificada para administrar, proteger y monitorear el uso del modelo de IA dentro del ecosistema de Databricks. Para las organizaciones que ya utilizan Databricks para la ingeniería de datos y ETL, la integración de Mosaic AI proporciona una capa de gobierno consolidada.
Sin embargo, el precio de Mosaic AI Gateway no es un simple complemento. Los costos dependen fundamentalmente del modelo de unidades de Databricks (DBU), de las selecciones específicas de los niveles de procesamiento y de las dependencias a nivel de plataforma, como Unity Catalog.
Este análisis desglosa los precios de la IA de Databricks y explica por qué los equipos de ingeniería de gran escala suelen evaluar alternativas desagregadas como TrueFoundry para lograr una economía unitaria e independencia arquitectónica más claras.
.webp)
¿Qué es Databricks Mosaic AI Gateway?
La puerta de enlace de IA Mosaic de Databricks sirve como plano de control centralizado para enrutar, monitorear y controlar las solicitudes de modelos de IA. Actúa como un proxy entre la lógica de la aplicación y los puntos finales del modelo, tanto si esos modelos son externos (por ejemplo, GPT-4o a través de OpenAI) como si están alojados internamente mediante Mosaic AI Model Serving.
Desde el punto de vista arquitectónico, la puerta de enlace proporciona los ganchos de observabilidad necesarios para el registro de prontas y respuestas, el seguimiento de la latencia y la atribución de uso. No se trata de un binario aislado, sino de un conjunto de funciones integrado en la infraestructura de Model Serving de Databricks. Por lo tanto, su disponibilidad operativa está vinculada a las características de confiabilidad y escalabilidad del espacio de trabajo subyacente de Databricks y de la capa de gobierno de Unity Catalog.
La moneda «DBU»: cómo le factura realmente Databricks
Databricks no factura por solicitud de API en el sentido tradicional de SaaS. En cambio, el consumo se normaliza en Unidades Databricks (DBus). A principios de 2026, las tasas de DBU para las cargas de trabajo de IA generalmente comienzan en 0,07 USD por DBU para el servicio del modelo básico y puede superar 0,70 USD por DBU para operaciones de SQL sin servidor que se utilizan para analizar registros.
¿Qué es una DBU?
Una DBU es una métrica patentada que representa la potencia de procesamiento por hora. El desafío para los equipos de plataformas reside en pronosticar los precios de la IA de Databrick: una sola solicitud de IA puede implicar varios eventos que consumen mucha DBU, como el enrutamiento de una puerta de enlace, la ejecución de barreras y la incorporación de registros a Delta Tables. Los costos de la DBU varían según el plan (Standard, Premium o Enterprise) y el proveedor de la nube.
Economía de la computación integrada
En las implementaciones estándar, las organizaciones administran dos flujos de costos: el pago al proveedor de nube (AWS/Azure/GCP) por las instancias de VM sin procesar y el pago a Databricks por la tarifa de administración de DBU. Databricks Serverless agrupa estos costos en una tarifa única. Si bien esto simplifica la facturación, la tarifa combinada generalmente incluye una prima sobre los costos brutos de infraestructura para cubrir la administración y la orquestación de la plataforma.
Dónde encaja Mosaic AI Gateway en los precios de Databricks
Los costos de Mosaic AI Gateway se obtienen a través de los recursos informáticos necesarios para procesar las solicitudes. Cada solicitud que pasa por la puerta de enlace consume tiempo de procesamiento en un punto final de Model Serving.
El principal factor de costo de los precios de Databricks AI incluye:
- Procesamiento de solicitudes: La grabación de DBU asociada a la lógica de la puerta de enlace para el enrutamiento y el equilibrio de carga.
- Gastos generales de observabilidad: El costo de procesamiento y almacenamiento de escribir cargas útiles de solicitud/respuesta en tablas de inferencia.
- Punto de control de la gobernanza: La latencia y el costo de procesamiento agregados por las comprobaciones de permisos de Unity Catalog para cada invocación del modelo.
.webp)
Desglose de precios de Mosaic AI Gateway
El impacto financiero del uso de la puerta de enlace de IA de Databricks depende de si el tráfico se dirige a proveedores externos o a modelos alojados internos.
Enrutamiento de modelo externo
Cuando la puerta de enlace dirige el tráfico a proveedores externos como OpenAI o Anthropic, las organizaciones pagan directamente las tarifas simbólicas del proveedor. Además, Databricks AI cobra precios por las funciones de la pasarela (enrutamiento, seguimiento y registro) a través de DBus.
- Vector de costo: El tráfico procesado por la puerta de enlace incurre en un consumo de DBU en función del rendimiento.
- Requisito de infraestructura: Incluso para el enrutamiento externo, un punto final de servicio debe estar «Activo». En entornos de alta concurrencia, esto puede requerir una capacidad aprovisionada que impida la escalabilidad total a cero.
Servicio de modelos interno (servicio de modelos de Mosaic AI)
Para los modelos alojados en Databricks, los costos generalmente se dividen en dos modos:
- Pago por token: Se usa con frecuencia para pruebas de desarrollo o cargas de trabajo intermitentes. Los modelos propietarios se facturan con tasas de DBU específicas por cada 1 millón de tokens (por ejemplo, unos 94 USD por cada 1 millón de tokens para ciertos modelos de nivel superior).
- Rendimiento aprovisionado: El estándar para el rendimiento de producción. Este modo requiere un compromiso mínimo de simultaneidad, que a menudo comienza en 0,07 USD por DBU, donde pagas por la capacidad reservada las 24 horas del día. Este modelo garantiza la disponibilidad, pero puede generar costos de capacidad inactiva si el tráfico fluctúa de manera significativa.
Costos asociados a los ecosistemas
La puerta de enlace de IA Mosaic de Databricks en sí misma es un componente del costo total de propiedad. La infraestructura de soporte a menudo representa una parte importante del costo mensual de Databricks.
Dependencia de Unity Catalog
Mosaic AI Gateway confía en Unity Catalog para la gobernanza. Los registros de inferencias se almacenan en tablas delta, que incluyen:
- Costos de almacenamiento: Tarifas estándar de almacenamiento de objetos en la nube.
- Procesamiento de tablas de inferencia: Calcule los costos de los trabajos en segundo plano que ingieren los registros de la puerta de enlace.
- Costos de análisis: la consulta de estos registros para auditoría o facturación requiere SQL de Databricks. En 0,70 USD por DBU en el caso de SQL sin servidor, la ejecución de consultas frecuentes de observabilidad contribuye al gasto total de la plataforma.
Barandas y escáneres de datos
La activación de las barreras de protección de la IA, como el enmascaramiento de la PII o los filtros de toxicidad, requiere procesamiento adicional. Cada barrera ejecuta un modelo o un escáner de expresiones regulares en la carga útil de solicitud/respuesta.
- Impacto de latencia: Los puntos de referencia internos sugieren que la latencia de P95 puede aumentar en 50 ms a 200 ms dependiendo de la complejidad de la barandilla.
- Impacto de cálculo: La ejecución de Guardrail utiliza el procesamiento de Model Serving, que consume DBus a la velocidad estándar.
Desafíos de costos comunes a los que se enfrentan los equipos con los precios de Databricks AI
- Consumo de DBU variable: Los activadores de escalado automático son reactivos. Las ráfagas repentinas de tráfico pueden aprovisionar nodos de procesamiento adicionales que permanezcan activos durante un período mínimo, lo que repercute en la rentabilidad en caso de picos cortos.
- Complejidad de atribución: Las DBU suelen agregarse a nivel del espacio de trabajo. Para aislar los costos específicos de Mosaic AI Gateway de las cargas de trabajo de ingeniería de datos más amplias, normalmente es necesario etiquetar y analizar las tablas del sistema de forma personalizada.
- Dependencias del ecosistema: La utilización de la puerta de enlace vincula el registro y la gobernanza con la arquitectura de Databricks (Unity Catalog, Delta Tables). La migración posterior a una pila de inferencias diferente requiere volver a implementar estas capas de gobierno.
.webp)
Por qué algunos equipos miran más allá de Databricks Mosaic AI Gateway
A medida que las implementaciones de IA pasan de la prueba de concepto a la producción a gran escala, el modelo de precios de IA de Databricks basado en DBU para cada token puede afectar a la economía de las unidades. Los equipos de ingeniería suelen darse cuenta de que la naturaleza integral de la plataforma Databricks, si bien es eficaz para el almacenamiento de datos, añade peso arquitectónico al enrutamiento sencillo de la IA desde el punto de vista de las aplicaciones.
Además, el requisito de operar dentro del plano de control de Databricks puede limitar la adopción de hardware especializado (por ejemplo, AWS Trainium/Inferentia) o estrategias de implementación alternativas (por ejemplo, Kubernetes locales) que pueden reducir el TCO.
Cómo aborda TrueFoundry la infraestructura de IA
TrueFoundry proporciona una arquitectura alternativa diseñada para los equipos de ingeniería que priorizan la transparencia de los costos y el control de la infraestructura por encima de la complejidad de los precios de la IA de Databricks.
- Nativo de Kubernetes: TrueFoundry se implementa directamente en la cuenta de nube del cliente (AWS, Azure, GCP). Además de los costes brutos de las instancias, no se añade ninguna «DBU de administración».
- Enrutamiento directo: A diferencia de las pasarelas agrupadas en plataformas, TrueFoundry no cobra un recargo por token para el enrutamiento externo.
- Optimización de la infraestructura: La plataforma admite instancias puntuales para configuraciones granulares e inferentes de escala a cero. En muchos escenarios de producción, este enfoque reduce los costos de procesamiento inactivo en comparación con los modelos de rendimiento aprovisionados.
Tabla 1: Databricks Mosaic AI Gateway frente a TrueFoundry: comparación de la estructura de costos
Figura 1: Comparación de la arquitectura y el flujo de costos
.webp)
¿Estás listo para separar tu pila de IA?
Si bien Databricks Mosaic AI Gateway ofrece beneficios de integración para los equipos que ya están integrados en Lakehouse, el modelo de precios de Databricks AI basado en DBU puede generar costos variables a escala. TrueFoundry ofrece una alternativa rentable y de alto rendimiento que permite a los ingenieros ser propietarios de su infraestructura sin tener que pagar la prima de la plataforma.
Para los equipos que administran información confidencial, como información de identificación personal o números de tarjetas de crédito, TrueFoundry garantiza que los datos de la pasarela de IA permanezcan bajo su control y, al mismo tiempo, optimicen la administración de costos. Puedes ver tus ahorros en un ejemplo de panel de control de AI Gateway adaptado a tu gasto en aprendizaje automático.
Para ver cómo puede lograr la independencia arquitectónica y eliminar las marcas DBU, reserve una demostración con nuestro equipo hoy.
Preguntas frecuentes
¿Cuánto cuesta Databricks al mes?
Los costos mensuales son muy variables y dependen del consumo. Si bien el uso básico suele ser nominal para los equipos pequeños, las cargas de trabajo de producción a escala empresarial, impulsadas por requisitos de disponibilidad continua y un extenso registro de gobierno, pueden generar importantes gastos operativos mensuales, ya que el consumo de DBU aumenta de forma lineal con el rendimiento.
¿Cómo funcionan los precios de Databricks Mosaic AI?
Se basa en el consumo mediante el modelo Databricks Unit (DBU). Se le factura el tiempo de procesamiento del punto final de Model Serving, el almacenamiento de los registros de inferencias en tablas delta y los recursos informáticos necesarios para analizar esos registros mediante Databricks SQL.
¿Por qué es TrueFoundry más rentable que Databricks Mosaic AI?
TrueFoundry funciona con un modelo de «traiga su propia nube», lo que elimina la prima de administración de DBU que se encuentra en las plataformas agrupadas. Al implementarlo directamente en sus clústeres de Kubernetes y habilitar estrategias de optimización agresivas, como las instancias puntuales y la escalabilidad granular hasta cero, alinea los costos de servicio directamente con los precios brutos de la infraestructura.
TrueFoundry AI Gateway ofrece una latencia de entre 3 y 4 ms, gestiona más de 350 RPS en una vCPU, se escala horizontalmente con facilidad y está listo para la producción, mientras que LitellM presenta una latencia alta, tiene dificultades para superar un RPS moderado, carece de escalado integrado y es ideal para cargas de trabajo ligeras o de prototipos.
La forma más rápida de crear, gobernar y escalar su IA















.png)


.webp)




.webp)







