Blank white background with no objects or features visible.

Werden Sie Teil unseres VAR- und VAD-Ökosystems – und ermöglichen Sie die Governance von Unternehmens-KI über LLMs, MCPs und Agents hinweg. Read →

Databricks Mosaic AI Gateway — Preisgestaltung erklärt (2026)

von TrueFoundry

Aktualisiert: January 30, 2026

Understanding Databricks Mosaic AI Gateway Pricing in 2026
Fassen Sie zusammen mit
Metallic silver knot design with interlocking loops and circular shape forming a decorative pattern.
Blurry black butterfly or moth icon with outstretched wings on white background.
Blurry red snowflake on white background, symmetrical frosty design with soft edges and abstract shape.

Databricks Mosaic AI Gateway ist als einheitliche Schnittstelle für die Verwaltung, Sicherung und Überwachung der Nutzung von KI-Modellen innerhalb des Databricks-Ökosystems positioniert. Für Unternehmen, die Databricks bereits für ETL und Data Engineering nutzen, bietet die Integration von Mosaic AI eine konsolidierte Governance-Ebene.

Die Preisgestaltung für Mosaic AI Gateway ist jedoch kein einfaches Add-on. Die Kosten hängen im Wesentlichen vom Databricks Unit (DBU) -Modell, der Auswahl bestimmter Rechenstufen und Abhängigkeiten auf Plattformebene wie Unity Catalog ab.

Diese Analyse schlüsselt die KI-Preisgestaltung von Databricks auf und erklärt, warum hochkarätige Entwicklungsteams häufig entbündelte Alternativen wie TrueFoundry evaluieren, um eine klarere Wirtschaftlichkeit und architektonische Unabhängigkeit zu erreichen.

TrueFoundry reduces Databricks AI pricing overhead

Was ist Databricks Mosaic AI Gateway?

Das Databricks Mosaic AI Gateway dient als zentrale Steuerungsebene für das Routing, Überwachen und Steuern von KI-Modellanfragen. Es fungiert als Proxy zwischen Anwendungslogik und Modellendpunkten, unabhängig davon, ob es sich bei diesen Modellen um externe Modelle handelt (z. B. GPT-4O über OpenAI) oder intern über Mosaic AI Model Serving gehostet werden.

Architektonisch bietet das Gateway die Observability-Hooks, die für Prompt- und Response-Logging, Latenz-Tracking und Nutzungsattribution erforderlich sind. Es handelt sich nicht um eine isolierte Binärdatei, sondern um einen Funktionsumfang, der in die Databricks Model Serving-Infrastruktur integriert ist. Folglich hängt ihre Betriebsverfügbarkeit von den Zuverlässigkeits- und Skalierungsmerkmalen des zugrunde liegenden Databricks-Workspace und der Unity Catalog-Governance-Ebene ab.

Die „DBU“ -Währung: Wie Databricks Ihnen tatsächlich Rechnungen stellt

Databricks rechnet nicht pro API-Anfrage im herkömmlichen SaaS-Sinne ab. Stattdessen wird der Verbrauch normalisiert in Databricks-Einheiten (DBus). Ab Anfang 2026 beginnen die DBU-Raten für KI-Workloads in der Regel bei 0,07$ pro DBU für das Foundation Model Serving und kann mehr 0,70$ pro DBU für serverlose SQL-Operationen, die zur Analyse von Protokollen verwendet werden.

Was ist eine DBU?

Eine DBU ist eine proprietäre Metrik, die die Verarbeitungsleistung pro Stunde darstellt. Die Herausforderung für Plattformteams liegt in der Prognose der KI-Preise von Databricks: Eine einzelne KI-Anfrage kann mehrere DBU-intensive Ereignisse beinhalten, darunter Gateway-Routing, Guardrail-Ausführung und Protokollaufnahme in Delta-Tabellen. Die DBU-Kosten variieren je nach Tarif (Standard, Premium oder Enterprise) und Cloud-Anbieter.

Integrierte rechnergestützte Wirtschaftswissenschaften

In Standardbereitstellungen verwalten Unternehmen zwei Kostenströme: die Zahlung an den Cloud-Anbieter (AWS/Azure/GCP) für unformatierte VM-Instanzen und die Zahlung der DBU-Verwaltungsgebühr an Databricks. Databricks Serverless bündelt diese Kosten in einem einzigen Tarif. Dies vereinfacht zwar die Abrechnung, der Pauschalpreis beinhaltet jedoch in der Regel einen Aufschlag auf die reinen Infrastrukturkosten, um das Plattformmanagement und die Orchestrierung abzudecken.

Wo Mosaic AI Gateway in die Databricks-Preisgestaltung passt

Die Kosten für Mosaic AI Gateway werden durch die Rechenressourcen realisiert, die für die Verarbeitung von Anfragen erforderlich sind. Jede Anforderung, die das Gateway passiert, verbraucht Rechenzeit auf einem Model Serving-Endpunkt.

Zu den wichtigsten Kostentreibern für die KI-Preisgestaltung von Databricks gehören:

  • Bearbeitung der Anfrage: Der DBU-Burn, der der Gateway-Logik für Routing und Load Balancing zugeordnet ist.
  • Observability-Overhead: Die Rechen- und Speicherkosten für das Schreiben von Anforderungs-/Antwort-Nutzlasten in Inferenztabellen.
  • Kontrollpunkt der Unternehmensführung: Die Latenz und die Rechenkosten, die durch die Unity Catalog-Berechtigungsprüfungen für jeden Modellaufruf hinzugefügt wurden.

Preisaufschlüsselung für Mosaic AI Gateway

Die finanziellen Auswirkungen der Verwendung des Databricks AI Gateways hängen davon ab, ob der Datenverkehr an externe Anbieter oder an interne gehostete Modelle weitergeleitet wird.

Externes Modell-Routing

Wenn das Gateway den Verkehr an externe Anbieter wie OpenAI oder Anthropic weiterleitet, zahlen Organisationen die Token-Gebühren des Anbieters direkt. Darüber hinaus berechnet Databricks AI Gebühren für die Gateway-Funktionen (Routing, Tracking und Logging) über DBus.

  • Kostenvektor: Der vom Gateway verarbeitete Datenverkehr verursacht je nach Durchsatz einen DBU-Verbrauch.
  • Infrastrukturanforderung: Selbst für externes Routing muss ein Serving-Endpunkt „Aktiv“ sein. In Umgebungen mit hoher Parallelität erfordert dies möglicherweise bereitgestellte Kapazität, die eine vollständige Skalierung auf Null verhindert.

Interne Modellbereitstellung (Mosaic AI Model Serving)

Bei Modellen, die in Databricks gehostet werden, werden die Kosten im Allgemeinen in zwei Modi aufgeteilt:

  • Pay-Per-Token: Wird häufig für Entwicklungstests oder intermittierende Arbeitslasten verwendet. Proprietäre Modelle werden zu bestimmten DBU-Tarifen pro 1 Million Token in Rechnung gestellt (z. B. ~94 $ pro 1 Million Token für bestimmte High-Tier-Modelle).
  • Bereitgestellter Durchsatz: Der Standard für Produktionsleistung. Für diesen Modus ist ein Mindestmaß an Parallelität erforderlich. Oft beginnt es bei 0,07$ pro DBU, wo Sie rund um die Uhr für reservierte Kapazität bezahlen. Dieses Modell gewährleistet die Verfügbarkeit, kann jedoch zu Kosten für ungenutzte Kapazitäten führen, wenn der Verkehr stark schwankt.

Verbundene Ökosystemkosten

Das Databricks Mosaic AI Gateway selbst ist eine Komponente der Gesamtbetriebskosten. Die unterstützende Infrastruktur macht oft einen erheblichen Teil der monatlichen Databricks-Kosten aus.

Unity-Katalogabhängigkeit

Mosaic AI Gateway stützt sich bei der Verwaltung auf Unity Catalog. Inferenzprotokolle werden in Delta-Tabellen gespeichert. Dabei fallen folgende Daten an:

  • Lagerkosten: Standardgebühren für Cloud-Objektspeicher.
  • Verarbeitung von Inferenztabellen: Berechnen Sie die Kosten für die Hintergrundjobs, die Protokolle vom Gateway aufnehmen.
  • Analysekosten: Für die Abfrage dieser Protokolle zur Prüfung oder Abrechnung ist Databricks SQL erforderlich. Bei 0,70$ pro DBU Bei Serverless SQL trägt die Ausführung häufiger Observability-Abfragen zu den Gesamtausgaben für die Plattform bei.

Leitplanken und Datenscanner

Die Aktivierung von KI-Leitplanken — wie PII-Maskierung oder Toxizitätsfiltern — erfordert zusätzliche Rechenleistung. Auf jeder Leitplanke wird ein Modell- oder Regex-Scanner auf der Anforderungs-/Antwort-Nutzlast ausgeführt.

  • Auswirkung auf die Latenz: Interne Benchmarks deuten darauf hin, dass die P95-Latenz um Folgendes steigen kann 50 ms bis 200 ms abhängig von der Komplexität der Leitplanke.
  • Auswirkung berechnen: Bei der Guardrail-Ausführung wird die Model-Serving-Berechnung verwendet, die DBus mit der Standardrate verbraucht.

Häufige Kostenherausforderungen, denen sich Teams mit der KI-Preisgestaltung von Databricks stellen müssen

  • Variabler DBU-Verbrauch: Auto-Scaling-Trigger sind reaktiv. Plötzliche Datenverkehrsspitzen können zusätzliche Rechenknoten bereitstellen, die für eine Mindestdauer aktiv bleiben, was sich bei kurzen Spitzen negativ auf die Kosteneffizienz auswirkt.
  • Komplexität der Attribution: DBUs werden oft auf Workspace-Ebene aggregiert. Die Isolierung bestimmter Mosaic AI Gateway-Kosten von umfassenderen Datenverarbeitungslasten erfordert in der Regel ein benutzerdefiniertes Tagging und eine Analyse von Systemtabellen.
  • Abhängigkeiten des Ökosystems: Die Verwendung des Gateways verknüpft Logging und Governance mit der Databricks-Architektur (Unity Catalog, Delta Tables). Für die spätere Migration zu einem anderen Inferenz-Stack müssen diese Governance-Ebenen erneut implementiert werden.
TrueFoundry provides a cost-effective alternative to the high Databricks AI pricing

Warum manche Teams über Databricks Mosaic AI Gateway hinausgehen

Da KI-Bereitstellungen von der Machbarkeitsstudie zur Serienproduktion übergehen, kann sich das DBU-basierte KI-Preismodell von Databricks für jedes Token auf die Wirtschaftlichkeit der Einheiten auswirken. Entwicklungsteams stellen häufig fest, dass der umfassende Charakter der Databricks-Plattform zwar effektiv für Data Warehousing ist, aber das architektonische Gewicht für einfaches anwendungsseitiges KI-Routing erhöht.

Darüber hinaus kann die Anforderung, innerhalb der Databricks-Steuerungsebene zu arbeiten, die Einführung spezialisierter Hardware (z. B. AWS Trainium/Inferentia) oder alternativer Bereitstellungsstrategien (z. B. lokales Kubernetes) einschränken, die die Gesamtbetriebskosten senken können.

So geht TrueFoundry an die KI-Infrastruktur heran

TrueFoundry bietet eine alternative Architektur für Entwicklungsteams, die Kostentransparenz und Infrastrukturkontrolle Vorrang vor der Komplexität der KI-Preisgestaltung von Databricks einräumen.

  • Kubernetes-Nativ: TrueFoundry wird direkt im Cloud-Konto des Kunden (AWS, Azure, GCP) bereitgestellt. Zu den reinen Instanzkosten wird keine „Management-DBU“ hinzugefügt.
  • Direktes Routing: Im Gegensatz zu plattformgebündelten Gateways berechnet TrueFoundry kein Markup pro Token für externes Routing.
  • Optimierung der Infrastruktur: Die Plattform unterstützt Spot-Instances für Inferenz und granulare Scale-to-Zero-Konfigurationen. In vielen Produktionsszenarien reduziert dieser Ansatz die Rechenkosten im Leerlauf im Vergleich zu Modellen mit bereitgestelltem Durchsatz.

Tabelle 1: Databricks Mosaic AI Gateway im Vergleich zu TrueFoundry: Vergleich der Kostenstruktur

Databricks Mosaic AI Gateway vs TrueFoundry
Cost Dimension Databricks Mosaic AI Gateway TrueFoundry
Pricing Metric DBUs + token add-ons Flat platform fee + raw compute
External Routing Guardrails and logging charged per usage Included in platform fee
Model Serving Marked-up serverless rates Raw AWS / GCP costs (Spot instances supported)
Log Storage Unity Catalog (Delta Tables incur cost) Your own object storage
Infrastructure Flexibility Databricks-centric Cloud-agnostic Kubernetes

Abbildung 1: Architektur und Kostenflussvergleich

Sind Sie bereit, Ihren KI-Stack zu entbündeln?

Databricks Mosaic AI Gateway bietet zwar Integrationsvorteile für Teams, die bereits im Lakehouse tätig sind, aber das DBU-basierte Preismodell von Databricks AI kann zu variablen Kosten in großem Maßstab führen. TrueFoundry bietet eine leistungsstarke, kostentransparente Alternative, die es Ingenieuren ermöglicht, ihre Infrastruktur ohne die Plattformprämie zu besitzen.

Für Teams, die sensible Informationen wie personenbezogene Daten oder Kreditkartennummern verwalten, stellt TrueFoundry sicher, dass die KI-Gateway-Daten unter Ihrer Kontrolle bleiben, und optimiert gleichzeitig das Kostenmanagement. Sie können Ihre Einsparungen auf einem Beispiel für ein AI-Gateway-Dashboard einsehen, das auf Ihre Ausgaben für maschinelles Lernen zugeschnitten ist.

Um zu sehen, wie Sie architektonische Unabhängigkeit erreichen und DBU-Markups eliminieren können, eine Demo buchen heute mit unserem Team.

Häufig gestellte Fragen

Wie viel kostet Databricks pro Monat?

Die monatlichen Kosten sind sehr variabel und verbrauchsabhängig. Während die Nutzung im Einstiegssegment für kleine Teams oft nur eine geringe Belastung ist, können Produktionsworkloads auf Unternehmensebene — bedingt durch kontinuierliche Verfügbarkeitsanforderungen und umfangreiche Governance-Protokollierung — zu erheblichen monatlichen Betriebskosten führen, da der DBU-Verbrauch linear mit dem Durchsatz steigt.

Wie funktioniert die Preisgestaltung von Databricks Mosaic AI?

Es basiert auf dem Databricks Unit (DBU) -Modell auf dem Verbrauch. Ihnen werden die Rechenzeit des Model Serving-Endpunkts, die Speicherung von Inferenzprotokollen in Delta-Tabellen und die Rechenressourcen, die für die Analyse dieser Protokolle über Databricks SQL erforderlich sind, in Rechnung gestellt.

Inwiefern ist TrueFoundry kostengünstiger als Databricks Mosaic AI?

TrueFoundry arbeitet nach einem Bring-Your-Own-Cloud-Modell, wodurch die DBU-Management-Prämie entfällt, die bei gebündelten Plattformen üblich ist. Durch die direkte Bereitstellung auf Ihren Kubernetes-Clustern und die Unterstützung aggressiver Optimierungsstrategien wie Spot-Instances und granulare Skalierung auf Null werden die Servicekosten direkt an den Rohpreisen der Infrastruktur ausgerichtet.

Der schnellste Weg, deine KI zu entwickeln, zu steuern und zu skalieren

Melde dich an
Inhaltsverzeichniss

Steuern, implementieren und verfolgen Sie KI in Ihrer eigenen Infrastruktur

Buchen Sie eine 30-minütige Fahrt mit unserem KI-Experte

Eine Demo buchen

Der schnellste Weg, deine KI zu entwickeln, zu steuern und zu skalieren

Demo buchen

Entdecke mehr

Keine Artikel gefunden.
May 16, 2026
|
Lesedauer: 5 Minuten

The Agent Sprawl Problem: Why Enterprises Need Control Before Autonomy

Keine Artikel gefunden.
May 15, 2026
|
Lesedauer: 5 Minuten

Introducing Skills Registry: Reusable Agent Skills for Production AI Systems

Keine Artikel gefunden.
Types of AI agents governed by TrueFoundry enterprise control plane
May 15, 2026
|
Lesedauer: 5 Minuten

Types of AI Agents: Definitions, Roles, and What They Mean for Enterprise Deployment

Keine Artikel gefunden.
May 15, 2026
|
Lesedauer: 5 Minuten

OAuth at the MCP Layer: How We Solved Enterprise Token Management for AI Agents

Keine Artikel gefunden.
Keine Artikel gefunden.

Aktuelle Blogs

Black left pointing arrow symbol on white background, directional indicator.
Black left pointing arrow symbol on white background, directional indicator.
Machen Sie eine kurze Produkttour
Produkttour starten
Produkttour