Für eines der größten Gesundheitsunternehmen in den USA ist digitales Engagement von entscheidender Bedeutung. Bei der Verwaltung von jährlich über 500 Millionen Anrufen in Apotheken-, Einzelhandels- und Versicherungssparten stand das Unternehmen vor einer enormen technischen Hürde. Sie mussten ihre Sprachsysteme modernisieren — von einfachen Menüs bis hin zu intelligenten Agenten, die in der Lage waren, komplexe Patientenabsichten zu verarbeiten. Sie bauten zwar erfolgreich ein agentisches IVR-System auf, doch die betriebliche Komplexität der Skalierung offenbarte eine Lücke zwischen Innovation und Infrastruktur. Durch die Zusammenarbeit mit TrueFoundry beim Aufbau einer einheitlichen internen KI-Plattform automatisierte das Unternehmen seine Infrastruktur, verteilte erfolgreich Workloads zwischen Cloud und On-Premise und beschleunigte seine KI-Roadmap von Monaten auf Wochen.
Dieses Fortune-50-Unternehmen im Gesundheitswesen ist an der Schnittstelle von Einzelhandelsapotheken, Krankenversicherungen und medizinischen Dienstleistungen tätig. Ihre digitale Vision konzentriert sich auf Barrierefreiheit. Sie stellen sicher, dass jede Patienteninteraktion mit Präzision und Empathie abgewickelt wird, unabhängig davon, ob sie in einem ihrer 9.000 Geschäfte oder über einen digitalen Kanal stattfindet.
Die Reise des Unternehmens begann mit einer besonderen technischen Herausforderung: der Modernisierung seines Interactive Voice Response (IVR) -Systems. Das Unternehmen musste die starren Menüs „Drücken Sie 1 für die Apotheke“ hinter sich lassen und zu einem vollständig agentischen System übergehen, das in der Lage ist, natürliche Sprache zu verstehen.
Um das Spannungsfeld zwischen Latenz, Kosten und Genauigkeit in dieser Größenordnung zu bewältigen, entwarf das Engineering-Team eine ausgeklügelte 3-stufige Routing-Architektur.
Der Betrieb dieses Systems für Millionen von Benutzern erforderte eine tiefgreifende Optimierung, die über die Standardmodellinferenz hinausgeht:
Reduzierung der Latenz
Das Team implementierte die globale Instanziierung von Agentengraphen. Anstatt den Agentenkontext für jeden Anruf neu zu erstellen, verwaltet der Service aktive Agentendiagramme, die in mehreren Sitzungen wiederverwendet werden können. Zusätzlich werden die Eingabeaufforderungen 30 Minuten lang zwischengespeichert, um die Latenz beim Abrufen vom Verwaltungsdienst zu minimieren.
3-stufiger Entscheidungsablauf
Um teure GPU-Berechnungen für komplexe Überlegungen zu vermeiden, verwendet das System einen mehrstufigen Ansatz:
Sicherheit geht vor
Leitplanken sind nicht nur ein nachträglicher Einfall. Sie werden über Aufforderungen auf der Gateway-Ebene angewendet und stellen so sicher, dass jeder Wirkstoff über einen Ausweichmechanismus für toxische oder außerhalb des Geltungsbereichs liegende Themen verfügt, bevor irgendeine Logik ausgeführt wird.
Die IVR-Architektur war zwar solide, aber der Betriebsaufwand war immens. Das Team sah sich mit einer Realität von Tag 2 konfrontiert: Verwaltung der aktiv-passiven Zuverlässigkeit in geografisch isolierten Clustern, Konfiguration von GPU-Ressourcen und Bewältigung der Diskrepanz zwischen Cloud-Entwicklung und On-Premise-Produktion.
Da sie erkannten, dass manuelles Infrastrukturmanagement ihre Roadmap zum Erliegen bringen würde, nutzten sie TrueFoundry, um eine einheitliche interne KI-Plattform aufzubauen, die nicht nur IVR, sondern alle zukünftigen Anwendungsfälle abdeckt.
1. Von „Cloud-First“ zur „Best-Infrastructure“
Der primäre Reibungspunkt war die Divergenz zwischen den Umgebungen. Entwickler bevorzugten die Agilität der Cloud, aber die wirtschaftlichen Anforderungen erforderten umfangreiche Rückschlüsse, um sie vor Ort ausführen zu können. TrueFoundry lieferte die Abstraktionsebene, die diese Lücke überbrückte.
2. Das KI-Gateway: Die zentrale Steuerebene
Da das System über 9 Millionen LLM-Anfragen pro Monat verarbeitet, benötigte das Team einen robusten Verkehrscontroller. Das AI Gateway von TrueFoundry wurde zum zentralen Nervensystem für ihren Inferenz-Stack.
3. Wirtschaftlichkeit per Autopilot
Um den Umfang der erforderlichen Rechenleistung zu bewältigen, nutzt die Plattform die Autopilot-Funktionen von TrueFoundry. Anstatt GPUs für Spitzenanrufvolumen statisch bereitzustellen, skaliert Autopilot automatisch die Ressourcen auf der Grundlage der Verkehrsnachfrage in Echtzeit und orchestriert den Einsatz von Spot-Instances für unkritische Workloads. Dieses dynamische Ressourcenmanagement machte aus einer potenziellen Kostenstelle eine optimierte Anlage.
Der Übergang von einem eigenständigen IVR-Projekt zu einer umfassenden Plattformstrategie hat die KI-Roadmap des Unternehmens zukunftssicher gemacht.
Dieses Fortune-50-Unternehmen aus dem Gesundheitswesen hat die Erkenntnisse aus seinem massiven IVR-Einsatz in einer einheitlichen Plattform auf der Grundlage von TrueFoundry kodifiziert und damit das komplexeste Problem der Unternehmens-KI gelöst. Betrieb am zweiten Tag. Sie haben ihren Entwicklern den Zugang zu hochmoderner Infrastruktur demokratisiert und gleichzeitig die strengen Kontrollen aufrechterhalten, die im Gesundheitswesen erforderlich sind. Das Ergebnis ist ein System, das nicht nur leistungsstark genug ist, um eine halbe Milliarde Patientenstimmen zu verstehen, sondern auch effizient genug, um dies nachhaltig zu tun.

Mehr als 10 Fortune-500-Unternehmen vertrauen uns