Blank white background with no objects or features visible.

تعلن TrueFoundry عن استحواذها على Seldon AI، موسعة بذلك لوحة التحكم الخاصة بها للذكاء الاصطناعي للمؤسسات. البيان الصحفي الكامل →

دراسة حالة

كيف وسّعت شركة رائدة في الرعاية الصحية ضمن قائمة فورتشن 50 نطاق الذكاء الاصطناعي القائم على الوكلاء من خلال الشراكة مع TrueFoundry لبناء منصة ذكاء اصطناعي داخلية موحدة.

هل ترغب في معرفة المزيد عن هذا النجاح

تحدث إلى خبيرنا
arrow1
Blue dots represent AI Agents, red dots represent Healthcare Systems on a scatter plot graph.

Executive Summary

بالنسبة لإحدى أكبر مؤسسات الرعاية الصحية في الولايات المتحدة، تُعد المشاركة الرقمية بالغة الأهمية. فمع إدارتها لأكثر من 500 مليون مكالمة سنويًا عبر قطاعات الصيدلة والتجزئة والتأمين، واجهت المنظمة عقبة هندسية ضخمة. كانت بحاجة إلى تحديث أنظمة الاتصال الصوتي الخاصة بها من قوائم بسيطة إلى وكلاء أذكياء قادرين على التعامل مع نوايا المرضى المعقدة. وبينما نجحت في بناء نظام رد صوتي تفاعلي (IVR) قائم على الوكلاء، كشف التعقيد التشغيلي لتوسيع نطاقه عن فجوة بين الابتكار والبنية التحتية. من خلال الشراكة مع TrueFoundry لبناء منصة ذكاء اصطناعي داخلية موحدة، قامت المؤسسة بأتمتة بنيتها التحتية، ونجحت في إدارة أعباء العمل بين السحابة والأنظمة المحلية، وسرّعت خارطة طريق الذكاء الاصطناعي الخاصة بها من أشهر إلى أسابيع.

The Client: A Pillar of Modern Healthcare

تعمل مؤسسة الرعاية الصحية هذه، المصنفة ضمن قائمة فورتشن 50، عند تقاطع صيدليات التجزئة والتأمين الصحي والخدمات الطبية. تتمحور رؤيتهم الرقمية حول إمكانية الوصول، لضمان التعامل مع كل تفاعل للمريض بدقة وتعاطف، سواء حدث ذلك في أحد متاجرهم البالغ عددها 9000 أو عبر قناة رقمية.

المحفز: هندسة نظام الاستجابة الصوتية التفاعلية (IVR) "لـ 500 مليون مكالمة"

بدأت رحلة المنظمة بتحدٍ هندسي مميز: تحديث نظام الاستجابة الصوتية التفاعلية (IVR) الخاص بهم. كانوا بحاجة إلى تجاوز قوائم "اضغط 1 للصيدلية" الجامدة إلى نظام يعتمد على الوكلاء بشكل كامل وقادر على فهم اللغة الطبيعية.

لإدارة التوازن بين زمن الاستجابة والتكلفة والدقة على هذا النطاق، صمم الفريق الهندسي بنية توجيه متطورة من 3 مراحل.

دقة فنية: التحسين على نطاق واسع

تطلب تشغيل هذا النظام لملايين المستخدمين تحسينًا عميقًا يتجاوز الاستدلال النموذجي القياسي:

Diagram illustrating AI agent routing and intent classification with voice stream processing and toxicity identification.

تقليل زمن الاستجابة

طبق الفريق تهيئة عالمية لرسوم بيانية الوكلاء. فبدلاً من إعادة إنشاء سياق الوكيل لكل مكالمة، تحتفظ الخدمة برسوم بيانية وكلاء نشطة يمكن إعادة استخدامها عبر الجلسات. بالإضافة إلى ذلك، يتم تخزين المطالبات مؤقتًا لمدة 30 دقيقة لتقليل زمن الاستجابة عند جلبها من خدمة الإدارة.

تدفق قرار من 3 مراحل

للحفاظ على قوة معالجة وحدات معالجة الرسوميات (GPU) باهظة الثمن للاستدلال المعقد، يستخدم النظام نهجًا متعدد المستويات:

  1. الفرز القائم على القواعد: يتعامل مع الاستفسارات الثابتة (مثل ساعات عمل المتجر) فورًا عبر مطابقة الأنماط.
  2. مصنفات النطاق: نماذج خفيفة الوزن تحدد نية المجال (على سبيل المثال، "هل هذا يتعلق بالصيدلة أم التأمين؟") لمنع أخطاء التوجيه.
  3. يُستدعى الوكيل الرئيسي فقط للاستفسارات المعقدة وذات الصلة بالنطاق. وهذا يقلل من استدعاءات نماذج اللغة الكبيرة (LLM) غير الضرورية بنسبة 10-20%.

السلامة أولاً

حواجز الحماية ليست مجرد فكرة لاحقة. بل تُطبق عبر المطالبات على مستوى البوابة، مما يضمن أن كل وكيل لديه آلية احتياطية للتعامل مع المحتوى الضار أو المواضيع خارج النطاق قبل تنفيذ أي منطق.

Flowchart illustrating rule-based system and agent classification process for escalation and response handling.

التحول الاستراتيجي: تحويل النجاح إلى منصة

بينما كانت بنية نظام الاستجابة الصوتية التفاعلية (IVR) سليمة، كان العبء التشغيلي لتشغيله هائلاً. واجه الفريق واقع "اليوم الثاني": إدارة الموثوقية النشطة-الخاملة عبر مجموعات معزولة جغرافيًا، وتهيئة موارد وحدات معالجة الرسوميات (GPU)، والتعامل مع التباين بين التطوير السحابي والإنتاج المحلي.

إدراكًا منهم أن الإدارة اليدوية للبنية التحتية ستعيق خطة عملهم، استخدموا TrueFoundry لبناء منصة ذكاء اصطناعي داخلية موحدة لخدمة ليس فقط نظام الاستجابة الصوتية التفاعلية (IVR)، بل جميع حالات الاستخدام المستقبلية.

1. من "السحابة أولاً" إلى "أفضل بنية تحتية"

كانت نقطة الاحتكاك الرئيسية هي التباين بين البيئات. فبينما فضل المطورون مرونة السحابة، تطلبت المتطلبات الاقتصادية تشغيل عمليات الاستدلال المعقدة محليًا. قدمت TrueFoundry طبقة التجريد التي سدت هذه الفجوة.

  1. مراجحة البنية التحتية: تمكن المنصة الفريق من استخدام NVIDIA NIMs في الموقع لخطوط الأساس المستقرة مع التوسع إلى السحابة للأحمال القصوى.
  2. النشر الموحد: ينشر المطورون النماذج إلى مجموعات آمنة ومعزولة هوائيًا في الموقع بنفس سهولة النشر إلى السحابة.
  3. عمليات صفرية: من خلال مركزية إدارة Kubernetes داخل المنصة، لم تعد فرق علم البيانات تدير تكوينات YAML، مما يحررهم للتركيز بشكل كامل على منطق النموذج.

2. بوابة الذكاء الاصطناعي: مستوى التحكم المركزي

مع معالجة النظام لأكثر من 9 ملايين طلب LLM شهريًا، احتاج الفريق إلى وحدة تحكم قوية في حركة المرور. أصبح AI Gateway من TrueFoundry بمثابة الجهاز العصبي المركزي لمكدس الاستدلال الخاص بهم.

  1. الموثوقية النشطة-الخاملة: تدير المنصة حركة المرور عبر مجموعات معزولة جغرافيًا (مناطق الشرق/الغرب). إذا واجهت إحدى المناطق زمن انتقال، يقوم Gateway بإعادة توجيه حركة المرور بسلاسة لضمان خدمة مرضى متواصلة.
  2. استقلالية النموذج: تفصل المنصة منطق التطبيق عن مزودي النماذج المحددين. يمنع هذا الارتباط بمورد واحد ويسمح للفريق بتبديل النماذج على الفور مع تحسن المعايير.

3. الكفاءة الاقتصادية عبر Autopilot

لإدارة الحجم الهائل من الحوسبة المطلوبة، تستفيد المنصة من إمكانيات Autopilot من TrueFoundry. بدلاً من توفير وحدات معالجة الرسوميات (GPUs) بشكل ثابت لأحجام المكالمات القصوى، يقوم Autopilot تلقائيًا بتوسيع نطاق الموارد بناءً على طلب حركة المرور في الوقت الفعلي وينسق استخدام مثيلات Spot لأعباء العمل غير الحرجة. لقد حولت هذه الإدارة الديناميكية للموارد مركز تكلفة محتملاً إلى أصل محسن.

التأثير: السرعة، والاقتصاد، والحوكمة

لقد أدى الانتقال من مشروع نظام الاستجابة الصوتية التفاعلية (IVR) المستقل إلى استراتيجية منصة شاملة إلى تأمين خارطة طريق الذكاء الاصطناعي للمؤسسة في المستقبل.

  1. سرعة الإنتاج: لقد أدى التوحيد القياسي إلى تقليل وقت نشر الوكلاء الجدد من أشهر إلى أسابيع. يمكن للفرق الآن إعادة استخدام "رسوم بيانية للوكلاء العالمية" وتكوينات الحماية عبر خطوط الأعمال المختلفة مثل أتمتة الفاكس والدردشة.
  2. الكفاءة الاقتصادية: من خلال الاستفادة من المنصة لنقل أعباء العمل من نقاط نهاية السحابة المدارة إلى وحدات معالجة الرسوميات (GPUs) المستضافة ذاتيًا في الموقع، حققت المؤسسة تجنبًا هائلاً للتكاليف. ساهمت القدرة على تحديد حجم البنية التحتية المناسب في خفض الإنفاق السحابي المتوقع بملايين الدولارات، مما عزز كفاءة النفقات الرأسمالية لوحدات معالجة الرسوميات (GPU CAPEX) بأكثر من 12%.
  3. الحوكمة الشاملة: انتقلت القيادة من الرؤية المجزأة إلى "لوحة تحكم موحدة". يمكنهم الآن تتبع كل معاملة، ومراجعة التكاليف لكل قسم، والتأكد من أن كل تفاعل يلتزم بمعايير الامتثال الصارمة للرعاية الصحية.

الخاتمة

من خلال تدوين الدروس المستفادة من نشرهم الضخم لنظام الاستجابة الصوتية التفاعلية (IVR) في منصة موحدة مبنية على TrueFoundry، تمكنت مؤسسة الرعاية الصحية هذه، المدرجة ضمن قائمة فورتشن 50، من حل المشكلة الأكثر تعقيدًا في الذكاء الاصطناعي للمؤسسات: عمليات اليوم الثاني. لقد أتاحوا وصولاً ديمقراطيًا إلى البنية التحتية المتطورة لمطوريهم مع الحفاظ على الرقابة الصارمة المطلوبة في مجال الرعاية الصحية. والنتيجة هي نظام ليس قويًا بما يكفي لفهم نصف مليار صوت مريض فحسب، بل فعالًا بما يكفي للقيام بذلك بشكل مستدام.

Purple gradient background with thin wavy lines on gray, forming a dynamic abstract design pattern.

البنية التحتية للذكاء الاصطناعي التوليدي - بسيطة، أسرع، وأقل تكلفة

موثوق به من قبل أكثر من 10 شركات من قائمة فورتشن 500