Blank white background with no objects or features visible.

TrueFoundryはSeldon AIの買収を発表し、エンタープライズAI向けコントロールプレーンを拡張します。プレスリリース全文はこちら→

ケーススタディ

Fortune 50にランクインするヘルスケアリーダーが、TrueFoundryとの提携により統合された社内AIプラットフォームを構築し、エージェント型AIを拡張した方法。

この成功事例についてさらに詳しく知りたいですか?

専門家にご相談ください
arrow1
Blue dots represent AI Agents, red dots represent Healthcare Systems on a scatter plot graph.

概要

米国最大級のヘルスケア企業にとって、デジタルエンゲージメントは極めて重要です。薬局、小売、保険の各分野で年間5億件以上の通話を管理する同組織は、巨大な技術的課題に直面していました。彼らは、単純なメニューから、複雑な患者の意図に対応できるインテリジェントなエージェントへと音声システムを近代化する必要がありました。エージェント型IVRシステムの構築には成功したものの、その拡張における運用上の複雑さが、イノベーションとインフラの間のギャップを露呈しました。TrueFoundryと提携して統合された社内AIプラットフォームを構築することで、同企業はインフラを自動化し、クラウドとオンプレミス間のワークロードを適切に調整することに成功し、AIロードマップを数ヶ月から数週間に短縮しました。

クライアント:現代医療の柱

このフォーチュン50にランクインするヘルスケア企業は、小売薬局、健康保険、医療サービスの交差点で事業を展開しています。彼らのデジタルビジョンはアクセシビリティを中心に据え、9,000店舗のいずれか、またはデジタルチャネルを通じて行われる患者とのあらゆるやり取りが、正確かつ共感をもって処理されることを保証しています。

きっかけ:「5億回通話」IVRのエンジニアリング

この組織の取り組みは、明確なエンジニアリング課題から始まりました。それは、インタラクティブ音声応答(IVR)システムの近代化です。彼らは、「薬局は1を押してください」といった硬直的なメニューから、自然言語を理解できる完全なエージェントシステムへと移行する必要がありました。

この規模でレイテンシ、コスト、精度の間のバランスを取るため、エンジニアリングチームは洗練された3段階ルーティングアーキテクチャを設計しました。

技術的な詳細:大規模な最適化

数百万人のユーザー向けにこのシステムを稼働させるには、標準的なモデル推論を超えた深い最適化が必要でした。

Diagram illustrating AI agent routing and intent classification with voice stream processing and toxicity identification.

レイテンシの削減

チームはエージェントグラフのグローバルインスタンス化を実装しました。呼び出しごとにエージェントコンテキストを再作成する代わりに、サービスはセッション間で再利用可能なアクティブなエージェントグラフを維持します。さらに、管理サービスからのフェッチ時のレイテンシを最小限に抑えるため、プロンプトは30分間キャッシュされます。

3段階の意思決定フロー

複雑な推論のために高価なGPUコンピューティングを温存するため、システムは階層的なアプローチを採用しています。

  1. ルールベースのトリアージ 静的なクエリ(店舗の営業時間など)をパターンマッチングにより即座に処理します。
  2. スコープ分類器 軽量モデルがドメインの意図(例:「これは薬局に関する問い合わせか、保険に関する問い合わせか?」)を判断し、ルーティング    エラーを防ぎます。
  3. メインエージェントは、複雑で範囲内のクエリに対してのみ呼び出されます。これにより、不要なLLM呼び出しを10~20%削減できます。

安全第一

ガードレールは後付けのものではありません。ゲートウェイレベルでプロンプトを介して適用され、ロジックが実行される前に、すべてのエージェントが有害な内容や範囲外のトピックに対するフォールバックメカニズムを持つことを保証します。

Flowchart illustrating rule-based system and agent classification process for escalation and response handling.

戦略的転換:成功のプラットフォーム化

IVRアーキテクチャ自体は堅牢だったものの、その運用上の負担は非常に大きいものでした。チームは「Day 2」の現実に直面しました。地理的に離れたクラスター間でのアクティブ/パッシブの信頼性管理、GPUリソースの構成、そしてクラウド開発とオンプレミス本番環境間の乖離への対応です。

手動でのインフラ管理ではロードマップが停滞すると認識し、彼らはTrueFoundryを活用して、IVRだけでなく将来のあらゆるユースケースに対応する統合された社内AIプラットフォームを構築しました。

1. 「クラウドファースト」から「最適なインフラ」へ

主な課題は、環境間の乖離でした。開発者はクラウドの俊敏性を好む一方で、経済的な要件により、大規模な推論をオンプレミスで実行する必要がありました。TrueFoundryは、このギャップを埋める抽象化レイヤーを提供しました。

  1. インフラストラクチャ・アービトラージ: このプラットフォームにより、チームは安定したベースラインのためにオンプレミスでNVIDIA NIMsを利用しつつ、ピーク負荷時にはクラウドにバーストすることができます。
  2. 統合デプロイメント: 開発者は、クラウドにデプロイするのと同じ容易さで、セキュアなエアギャップ型オンプレミス・クラスターにモデルをデプロイできます。
  3. ゼロオペレーション: プラットフォーム内でKubernetes管理を一元化することで、データサイエンスチームはYAML構成の管理から解放され、モデルロジックに純粋に集中できるようになりました。

2. AI Gateway: 中央制御プレーン

システムが月に900万件以上のLLMリクエストを処理するため、チームには堅牢なトラフィックコントローラーが必要でした。TrueFoundryのAI Gatewayは、彼らの推論スタックの中枢神経システムとなりました。

  1. アクティブ/パッシブの信頼性: このプラットフォームは、地理的に分離されたクラスター(東/西リージョン)間でトラフィックを管理します。いずれかのリージョンで遅延が発生した場合、ゲートウェイはトラフィックをシームレスに再ルーティングし、中断のない患者サービスを保証します。
  2. モデルの独立性: このプラットフォームは、アプリケーションロジックを特定のモデルプロバイダーから分離します。これにより、ベンダーロックインを防ぎ、ベンチマークが向上するにつれてチームはモデルを即座に交換できます。

3. Autopilotによる経済的効率性

必要な計算処理の膨大な規模を管理するため、このプラットフォームはTrueFoundryのAutopilot機能を活用しています。ピーク時の通話量に合わせてGPUを静的にプロビジョニングするのではなく、Autopilotはリアルタイムのトラフィック需要に基づいてリソースを自動的にスケーリングし、重要度の低いワークロードにはスポットインスタンスの利用を調整します。この動的なリソース管理により、潜在的なコストセンターが最適化された資産へと変わりました。

影響: 速度、経済性、ガバナンス

スタンドアロンのIVRプロジェクトから包括的なプラットフォーム戦略への移行は、組織のAIロードマップを将来にわたって保証するものとなりました。

  1. 生産速度: 標準化により、新しいエージェントのデプロイ時間が数か月から数週間に短縮されました。チームは、「グローバルエージェントグラフ」とガードレール構成を、FAX自動化やチャットなどの異なるビジネスライン間で再利用できるようになりました。
  2. 経済的効率性: このプラットフォームを活用して、マネージドクラウドエンドポイントから自社ホストのオンプレミスGPUにワークロードを移行することで、組織は大幅なコスト削減を実現しました。インフラストラクチャを適切にサイジングする能力は、数百万ドル規模のクラウド支出予測の削減に貢献し、GPUの設備投資効率を12%以上向上させました。
  3. 全体的なガバナンス: リーダーシップは、断片的な可視性から「シングルペインオブグラス」へと移行しました。これにより、すべてのトランザクションを追跡し、部門ごとのコストを監査し、すべてのやり取りが厳格な医療コンプライアンス基準に準拠していることを確認できます。

結論

大規模なIVR導入から得られた教訓をTrueFoundry上に構築された統合プラットフォームに体系化することで、このフォーチュン50ヘルスケア企業は、エンタープライズAIにおける最も複雑な問題である「Day 2 Operations(運用継続)」を解決しました。彼らは、ヘルスケア分野で求められる厳格な管理を維持しつつ、開発者向けに最先端のインフラへのアクセスを民主化しました。その結果、5億人もの患者の声を理解できるほど強力であるだけでなく、持続可能な方法でそれを実現できるほど効率的なシステムが誕生しました。

Purple gradient background with thin wavy lines on gray, forming a dynamic abstract design pattern.

生成AIインフラ - シンプル、高速、低コスト

フォーチュン500企業10社以上が信頼