米国最大級のヘルスケア企業にとって、デジタルエンゲージメントは極めて重要です。薬局、小売、保険の各分野で年間5億件以上の通話を管理する同組織は、巨大な技術的課題に直面していました。彼らは、単純なメニューから、複雑な患者の意図に対応できるインテリジェントなエージェントへと音声システムを近代化する必要がありました。エージェント型IVRシステムの構築には成功したものの、その拡張における運用上の複雑さが、イノベーションとインフラの間のギャップを露呈しました。TrueFoundryと提携して統合された社内AIプラットフォームを構築することで、同企業はインフラを自動化し、クラウドとオンプレミス間のワークロードを適切に調整することに成功し、AIロードマップを数ヶ月から数週間に短縮しました。
このフォーチュン50にランクインするヘルスケア企業は、小売薬局、健康保険、医療サービスの交差点で事業を展開しています。彼らのデジタルビジョンはアクセシビリティを中心に据え、9,000店舗のいずれか、またはデジタルチャネルを通じて行われる患者とのあらゆるやり取りが、正確かつ共感をもって処理されることを保証しています。
この組織の取り組みは、明確なエンジニアリング課題から始まりました。それは、インタラクティブ音声応答(IVR)システムの近代化です。彼らは、「薬局は1を押してください」といった硬直的なメニューから、自然言語を理解できる完全なエージェントシステムへと移行する必要がありました。
この規模でレイテンシ、コスト、精度の間のバランスを取るため、エンジニアリングチームは洗練された3段階ルーティングアーキテクチャを設計しました。
数百万人のユーザー向けにこのシステムを稼働させるには、標準的なモデル推論を超えた深い最適化が必要でした。
レイテンシの削減
チームはエージェントグラフのグローバルインスタンス化を実装しました。呼び出しごとにエージェントコンテキストを再作成する代わりに、サービスはセッション間で再利用可能なアクティブなエージェントグラフを維持します。さらに、管理サービスからのフェッチ時のレイテンシを最小限に抑えるため、プロンプトは30分間キャッシュされます。
3段階の意思決定フロー
複雑な推論のために高価なGPUコンピューティングを温存するため、システムは階層的なアプローチを採用しています。
安全第一
ガードレールは後付けのものではありません。ゲートウェイレベルでプロンプトを介して適用され、ロジックが実行される前に、すべてのエージェントが有害な内容や範囲外のトピックに対するフォールバックメカニズムを持つことを保証します。
IVRアーキテクチャ自体は堅牢だったものの、その運用上の負担は非常に大きいものでした。チームは「Day 2」の現実に直面しました。地理的に離れたクラスター間でのアクティブ/パッシブの信頼性管理、GPUリソースの構成、そしてクラウド開発とオンプレミス本番環境間の乖離への対応です。
手動でのインフラ管理ではロードマップが停滞すると認識し、彼らはTrueFoundryを活用して、IVRだけでなく将来のあらゆるユースケースに対応する統合された社内AIプラットフォームを構築しました。
1. 「クラウドファースト」から「最適なインフラ」へ
主な課題は、環境間の乖離でした。開発者はクラウドの俊敏性を好む一方で、経済的な要件により、大規模な推論をオンプレミスで実行する必要がありました。TrueFoundryは、このギャップを埋める抽象化レイヤーを提供しました。
2. AI Gateway: 中央制御プレーン
システムが月に900万件以上のLLMリクエストを処理するため、チームには堅牢なトラフィックコントローラーが必要でした。TrueFoundryのAI Gatewayは、彼らの推論スタックの中枢神経システムとなりました。
3. Autopilotによる経済的効率性
必要な計算処理の膨大な規模を管理するため、このプラットフォームはTrueFoundryのAutopilot機能を活用しています。ピーク時の通話量に合わせてGPUを静的にプロビジョニングするのではなく、Autopilotはリアルタイムのトラフィック需要に基づいてリソースを自動的にスケーリングし、重要度の低いワークロードにはスポットインスタンスの利用を調整します。この動的なリソース管理により、潜在的なコストセンターが最適化された資産へと変わりました。
スタンドアロンのIVRプロジェクトから包括的なプラットフォーム戦略への移行は、組織のAIロードマップを将来にわたって保証するものとなりました。
大規模なIVR導入から得られた教訓をTrueFoundry上に構築された統合プラットフォームに体系化することで、このフォーチュン50ヘルスケア企業は、エンタープライズAIにおける最も複雑な問題である「Day 2 Operations(運用継続)」を解決しました。彼らは、ヘルスケア分野で求められる厳格な管理を維持しつつ、開発者向けに最先端のインフラへのアクセスを民主化しました。その結果、5億人もの患者の声を理解できるほど強力であるだけでなく、持続可能な方法でそれを実現できるほど効率的なシステムが誕生しました。
