Blank white background with no objects or features visible.

تعلن TrueFoundry عن استحواذها على Seldon AI، موسعة بذلك لوحة التحكم الخاصة بها للذكاء الاصطناعي للمؤسسات. البيان الصحفي الكامل →

دراسة حالة
Three blue gradient cubes with circuit lines and light blue tops on white background with patterns.

ملخص

Innovaccer هي سحابة ذكاء صحي تعمل في بيئات شديدة التنظيم فيما يتعلق بالمعلومات الصحية المحمية (PHI). تستخدم Innovaccer الذكاء الاصطناعي لتحسين الكفاءة السريرية وإدارة الرعاية واتخاذ القرارات التشغيلية عبر منصتها للرعاية الصحية. يدعم الذكاء الاصطناعي حالات استخدام مثل التلخيص السريري، وتحديد فجوات الرعاية، وتصنيف المخاطر، ودعم الجودة والترميز، والرؤى باللغة الطبيعية حول بيانات الرعاية الصحية، مع العمل في بيئات منظمة وغنية بالمعلومات الصحية المحمية (PHI).

في رحلة تبني الذكاء الاصطناعي التوليدي (GenAI) عبر التطبيقات السريرية والتشغيلية، احتاجت Innovaccer إلى طريقة مركزية لحوكمة الاستخدام ومراقبته وتوسيع نطاقه، دون تجزئة الوصول أو المساس بالامتثال. وقد أدى ذلك إلى ظهور تحديات تتعلق بالمراقبة الآمنة للمعلومات الشخصية (PII)، وقابلية التدقيق، والتحكم في الوصول إلى النماذج، وحوكمة التكلفة عبر نماذج اللغات الكبيرة المتعددة (LLMs) ونماذج التضمين.

من خلال الشراكة مع TrueFoundry، قامت Innovaccer بتوحيد جميع حركة مرور الذكاء الاصطناعي التوليدي (GenAI) عبر بوابة الذكاء الاصطناعي الخاصة بـ TrueFoundry، مما أدى إلى إنشاء مستوى تحكم موحد للحوكمة على مستوى الرعاية الصحية على نطاق واسع. اليوم، تقوم Innovaccer بتوجيه حوالي 17 مليون طلب استدلال شهريًا، معالجة حوالي 34 مليار رمز إدخال و 3.4 مليار رمز إخراج عبر أكثر من 40 نموذجًا — بما في ذلك OpenAI و AWS Bedrock و Gemini والعمليات المنشورة ذاتيًا — مما يدعم أكثر من 25 تطبيقًا للرعاية الصحية. مع تسجيل مركزي، وإخفاء معلومات التعريف الشخصية (PII)، وضوابط التكلفة، وتطبيق السياسات المدمجة افتراضيًا، قامت Innovaccer بدمج الذكاء الاصطناعي التوليدي بعمق في سير عمل الإنتاج مع الحفاظ على المراقبة والامتثال والحوكمة على مستوى المؤسسات عبر جميع موفري LLM الرئيسيين.

أظهرت دراسة مقارنة مركزة لـ TrueFoundry مقابل منصات استضافة النماذج البديلة أن وقت التوسع التلقائي انخفض من حوالي 8 دقائق إلى حوالي 5 دقائق (بانخفاض قدره 37.5%)، بالإضافة إلى إعداد بنية تحتية أسرع، ومراقبة أغنى، وخصائص تكلفة أفضل.

عن Innovaccer

تعمل Innovaccer على تنشيط تدفق بيانات الرعاية الصحية، مما يمكّن مقدمي الخدمات والجهات الداعمة والمنظمات الحكومية من تقديم تجارب ذكية ومترابطة تعزز النتائج الصحية. يجهز سحابة الذكاء الصحي كل طرف معني في رحلة المريض لتحويل البيانات المجزأة إلى إجراءات استباقية ومنسقة ترفع جودة الرعاية وتدفع الأداء التشغيلي. تثق مؤسسات الرعاية الصحية الرائدة مثل Orlando Health و Adventist Healthcare و Banner Health في Innovaccer لدمج نظام ذكاء في بنيتها التحتية الحالية، مما يوسع نطاق اللمسة الإنسانية في الرعاية الصحية. تدير Innovaccer بيانات ملايين المرضى بمليارات نقاط البيانات عبرهم.

السياق

"دعم ابتكارات Innovaccer في الذكاء الاصطناعي/تعلم الآلة" ليس مجرد شعار، بل يعكس كيفية توسيع Innovaccer نطاق استخدام الذكاء الاصطناعي عبر مؤسسات الرعاية الصحية، مع TrueFoundry كشريك البنية التحتية الممكن. تقوم Innovaccer بأتمتة العمل المعرفي عبر إدارة دورة الإيرادات (RCM)، ووصول المرضى، والمساعدين المشتركين للمقدمين، والترميز السريري، ورسم خرائط البيانات. لدعم ذلك على نطاق واسع، تتبع Innovaccer استراتيجية متعددة النماذج تشمل Azure و AWS Bedrock و OpenAI والنماذج المستضافة ذاتيًا — حيث توفر TrueFoundry العمود الفقري للحوكمة والتنسيق والنشر.

للحفاظ على هذا النمو، احتاجت Innovaccer إلى:

  • نقطة دخول واحدة للذكاء الاصطناعي للتجريب والإنتاج.
  • لاستخدام الرموز والأداء والتكلفة.
  • استضافة النماذج ذاتية الخدمة مع قابلية توسع تلقائي قوية وبدون اختناقات في عمليات DevOps.
  • مسار لحوكمة أعباء العمل الحساسة لـ PHI/PII وحالات الاستخدام المستقبلية القائمة على الوكلاء.

التحدي

قبل اعتماد TrueFoundry كمنصة مركزية، كانت البنية التحتية للذكاء الاصطناعي التوليدي لدى Innovaccer تستخدم اتصالات مباشرة من نقطة إلى نقطة بين تطبيقات الإنتاج ومقدمي الخدمات المختلفين مثل OpenAI و Azure و Bedrock.

على الرغم من فعاليتها، إلا أن هذا النهج المجزأ افتقر إلى البوابة الموحدة اللازمة للتتبع عالي المستوى والرقابة المالية الضرورية في بيئة الرعاية الصحية. كان توحيد سير العمل هذا خطوة استراتيجية لضمان الموثوقية المطلوبة للعمليات السريرية على مستوى المؤسسات.

تطور الذكاء الاصطناعي التوليدي (GenAI) على مستوى الرعاية الصحية

من خلال مركزية بنيتها التحتية للذكاء الاصطناعي التوليدي (GenAI) عبر TrueFoundry، انتقلت Innovaccer من نموذج مجزأ إلى عمود فقري موحد للذكاء الاصطناعي مصمم لمواجهة تعقيدات الرعاية الصحية.

  • الموثوقية وسير العمل المتمحور حول المريض: من خلال تطبيق آليات احتياطية مركزية والتحكم في حركة المرور، نضمن أن تظل مهام سير العمل الإدارية الحيوية — التي يعتمد عليها مقدمو الرعاية والمرضى — مرنة وعالية الأداء حتى أثناء انقطاعات الخدمة من قبل المزودين.
  • التتبع والامتثال السريري: توفر الطبقة المركزية مسارات تدقيق صارمة وقابلية تتبع ضرورية لحوكمة بيانات الرعاية الصحية. يمكن لـ Innovaccer الآن مراقبة كيفية تفاعل النماذج مع البيانات الحساسة، مما يضمن مساءلة كل مخرجات.
  • تعد إدارة تكلفة الخدمة أمرًا حيويًا لكفاءة الرعاية الصحية. يتيح هذا الإطار المركزي لـ Innovaccer قياس التكلفة وتحسينها عبر المنصة، مما يضمن أن توسيع نطاق الذكاء الاصطناعي لا يؤدي إلى تكاليف إدارية غير متوقعة.
  • سرعة المطورين عبر التكوين: باستخدام طبقة التنسيق من TrueFoundry، فصلت Innovaccer منطق التطبيق عن النموذج الأساسي وسرّعت تقديم القيمة. يمكن لفرق التطوير الآن اختبار والتبديل بين نماذج الأساس المختلفة من خلال التكوين فقط، دون الحاجة إلى أي تغييرات في الكود. تتيح لنا هذه البنية "القابلة للتوصيل" اعتماد أحدث نماذج اللغة الكبيرة السريرية فور توفرها.

بالنسبة لفرق الرعاية والأطباء والمرضى الذين يعتمدون على هذه التطبيقات للحصول على رؤى في الوقت المناسب ودعم اتخاذ القرار، أدى ذلك إلى مخاطر محتملة تتعلق باتساق التجربة، وتوفر الخدمة خلال أوقات الذروة السريرية، والثقة في كيفية التعامل مع البيانات الصحية الحساسة. بالإضافة إلى ذلك، قارنت TrueFoundry تجربة النشر والتحجيم التلقائي الخاصة بها بمنصات استضافة النماذج البديلة لدى مزودي الخدمات السحابية المشهورين. تطلبت هذه المنصات تهيئة يدوية لعدد الاستدعاءات، واعتمدت على التتبع القائم على السجلات عبر CloudWatch لفهم توقيت التحجيم التلقائي، وأضافت حوالي 25% زيادة على أسعار المثيلات. كانت الرؤية في أحداث مستوى الـ pod وسلوك التحجيم التلقائي محدودة، مما جعل الضبط أبطأ وأقل شفافية.


الحل: TrueFoundry كمنصة مركزية لتنسيق الذكاء الاصطناعي

تم اعتماد TrueFoundry كطبقة لتجربة المطورين (DevX) والتنسيق لكل من حركة مرور نماذج اللغة الكبيرة (بوابة الذكاء الاصطناعي) ومنصة نشر الذكاء الاصطناعي.

1. بوابة الذكاء الاصطناعي: لوحة تحكم واحدة لنماذج اللغة الكبيرة (LLMs)

في المتوسط شهريًا، تخدم بوابة الذكاء الاصطناعي:

  • حوالي 17 مليون طلب استدلال.
  • حوالي 34 مليار رمز إدخال و3.4 مليار رمز إخراج.
  • أكثر من 25 تطبيق رعاية صحية تم دمجها.
  • حوالي 40 نموذجًا مختلفًا، تشمل OpenAI وAWS Bedrock وAzure وGemini وLlama المستضافة ذاتيًا.
توفر البوابة:
  • توجيه مركزي عبر الموفرين والنماذج.
  • مقاييس موحدة مثل وقت الوصول إلى الرمز الأول وزمن الاستجابة بين الرموز.
  • تتبع الرموز والتكلفة مقسمًا حسب الفرق والمستخدمين والبيئات والنماذج.
  • مقاييس متوافقة مع OpenTelemetry تتدفق مباشرة إلى مكدس Grafana الحالي الخاص بـ Innovaccer للوحات المعلومات والتنبيهات.
حولت بوابة الذكاء الاصطناعي المركزية هذه استخدام Innovaccer لنماذج اللغات الكبيرة (LLM) من عمليات تكامل مجزأة لكل تطبيق إلى لوحة تحكم واحدة قابلة للمراقبة.

2. الموثوقية: حماية سير عمل الرعاية السريرية وتقديم الرعاية باستخدام آليات التراجع المركزية

تستخدم Innovaccer الذكاء الاصطناعي التوليدي عبر إدارة الرعاية، والذكاء السريري، وسير العمليات التشغيلية التي تدعم الأطباء، ومديري الرعاية، وفرق صحة السكان. تعرض هذه التطبيقات ملخصات المرضى، ورؤى المخاطر، وفجوات الرعاية، وأفضل الإجراءات التالية عند نقطة اتخاذ القرار.

في 10 يونيو، عندما واجهت OpenAI معدلات خطأ مرتفعة، قامت بوابة الذكاء الاصطناعي الخاصة بـ Innovaccer تلقائيًا بإعادة توجيه حركة المرور إلى Azure بناءً على قواعد احتياطية تم تكوينها مسبقًا. وقد ضمن ذلك استمرار فرق الرعاية في تلقي رؤى في الوقت المناسب دون انقطاع، حتى عندما واجه موفرو النماذج الأساسيون عدم استقرار.

من خلال تكوين تجاوز الفشل مركزيًا عند بوابة الذكاء الاصطناعي بدلاً من داخل التطبيقات الفردية، ضمنت Innovaccer موثوقية متسقة عبر منصتها للرعاية الصحية. قلل هذا النهج من التباين في تجربة الأطباء وفرق الرعاية، بينما سمح لفرق المنتجات بالتركيز على تحسين سير عمل الرعاية بدلاً من إدارة سيناريوهات الفشل الخاصة بالمزودين.

3. وصول سريع إلى قدرات الذكاء الاصطناعي المتقدمة

كما سرّعت TrueFoundry الوصول إلى واجهات برمجة تطبيقات OpenAI الأحدث عبر البوابة:

  • واجهة برمجة تطبيقات الاستجابات (Responses API): تتيح سير عمل استخدام الأدوات مثل البحث عبر الإنترنت.
  • تكامل Codex: يفتح إمكانيات توليد الأكواد.
  • يدعم سير عمل الاستدلال غير المتزامن وعالي الحجم.
بدلاً من أن يقوم كل فريق في Innovaccer بتطبيق هذه الإمكانيات بشكل منفصل، يتم عرضها مركزيًا عبر بوابة الذكاء الاصطناعي، مما يتيح حوكمة ومراقبة متسقة.

4. سير عمل ذكاء سريري أسرع مع توجيه يراعي زمن الاستجابة

يُستخدم الذكاء الاصطناعي التوليدي من Innovaccer في سير عمل إدارة الرعاية والذكاء السريري حيث يؤثر وقت الاستجابة بشكل مباشر على سهولة الاستخدام للأطباء وفرق الرعاية. لدعم ذلك، طبقت TrueFoundry توجيهًا يراعي زمن الاستجابة عند بوابة الذكاء الاصطناعي، حيث يوجه حركة المرور الحية ديناميكيًا إلى أسرع نقطة نهاية نموذج متاحة دون الحاجة إلى تغييرات في التطبيق.
بالإضافة إلى ذلك، أتاحت الإدارة المركزية للمطالبات لفرق Innovaccer إصدار وتطبيق تحديثات المطالبات بأمان عبر التطبيقات، مما يضمن سلوكًا متسقًا وموثوقًا للذكاء الاصطناعي في سير العمل السريري والتشغيلي.

5. سيادة البيانات وعمليات النشر المنظمة (GovCloud)

بالنسبة لحالات الاستخدام في الرعاية الصحية الحساسة للامتثال، تطلبت Innovaccer بنية تحتية للذكاء الاصطناعي التوليدي يمكنها العمل بالكامل ضمن بيئات سيادية ومنظمة. تم نشر TrueFoundry في AWS GovCloud (الولايات المتحدة)، مما مكن Innovaccer من تشغيل أعباء عمل الذكاء الاصطناعي التوليدي في مناطق مصممة لمتطلبات صارمة لإقامة البيانات والتحكم في الوصول والتدقيق.

يتيح ذلك لـ Innovaccer استخدام نفس بوابة الذكاء الاصطناعي وطبقة التنسيق لأعباء العمل المتوافقة مع HIPAA والتي تحتوي على بيانات صحية محمية (PHI) بكثافة، مع ضمان بقاء البيانات الصحية الحساسة ضمن الحدود السيادية المعتمدة وأطر الامتثال.

التأثير على استجابة البنية التحتية وتنسيق التوسع

1. تسريع جاهزية الخدمة وتقليل زمن الاستجابة

أدى تطبيق TrueFoundry (TF) إلى دورة حياة أكثر تحديدًا لنشر النماذج. في قياس الأداء، تم تقليل الجدول الزمني "من التشغيل إلى التشغيل" إلى نافذة زمنية ثابتة تبلغ حوالي 5 دقائق، مما يمثل تحسينًا بنسبة 37.5% مقارنة بالخطوط الأساسية للبنية التحتية السابقة.

  • سرعة التوفير: تم تثبيت الفترة الزمنية من ترشيح الـ pod إلى تهيئة الحاوية عند حوالي دقيقتين.
  • القياس عن بعد المتكامل: على عكس الأنظمة القديمة حيث يجب استنتاج أحداث التوسع من تدفقات السجلات الخارجية، توفر TF رؤية أصلية على مستوى المنصة لحالة النشر. وهذا يلغي "فجوة المراقبة" خلال فترات التوسع الحرجة.

2. المرونة المرتكزة على الطلبات (التوسع القائم على RPS)

غالبًا ما يتخلف التوسع القياسي القائم على الموارد (وحدة المعالجة المركزية/الذاكرة العشوائية) عن الطبيعة المتقطعة لحركة مرور الذكاء الاصطناعي التوليدي. اعتمدت Innovaccer التوسع القائم على الطلبات في الثانية من خلال TrueFoundry كمقياس أساسي للتوسع للتعامل بشكل أفضل مع حركة مرور الذكاء الاصطناعي التوليدي المتقطعة

  • المعالجة الديناميكية للحمل: من خلال التحجيم بناءً على طلبات في الثانية (RPS)، تتكيف البنية التحتية بشكل استباقي مع الارتفاعات المفاجئة في حركة المرور قبل حدوث تشبع الحوسبة، مما يضمن أوقات استجابة متسقة لواجهة برمجة التطبيقات (API) للمساعدين المشتركين الموجهين للمقدمين.
  • منطق التحجيم الهجين: يدمج نظام التحجيم الخاص بـ TrueFoundry المحفزات القائمة على طلبات في الثانية (RPS) مع الاستدلالات القائمة على الوقت. يتيح ذلك فترات "إحماء" خلال ساعات الذروة السريرية، مما يضمن توفرًا عاليًا دون الهدر المالي الناتج عن التوفير الزائد على مدار الساعة طوال أيام الأسبوع.

3. الحوكمة الموحدة ومستوى التحكم

من خلال توحيد حركة مرور الذكاء الاصطناعي التوليدي (GenAI) على بوابة TrueFoundry المركزية، أرست Innovaccer "التوازن" التقني المطلوب لعمليات الرعاية الصحية للمؤسسات:

  • قابلية التتبع البرمجية: يمكن الوصول إلى سلوك التحجيم ومقاييس الأداء عبر واجهة برمجة تطبيقات (API) وواجهة مستخدم (UI) موحدتين، مما يسمح بالتدقيق الآلي لصحة النظام.
  • الرقابة المالية: تتيح الإدارة المركزية تتبعًا دقيقًا للتكلفة عبر مقدمي النماذج المتنوعين، مما يضمن بقاء سير العمل الإداري والسريري ضمن القيود الميزانية دون تدخل يدوي.

4. القيمة الملاحظة للمنصة

أبرزت الشراكة العديد من مزايا منصة TrueFoundry القائمة على Kubernetes:

  • إعداد سريع للبنية التحتية: تم الانتهاء من إعداد مستوى التحكم والحوسبة في Azure في غضون يوم واحد.
  • تجربة المطور: تعلم عالم البيانات الذي قاد المشروع المنصة بسرعة ونفذ سير العمل بشكل مستقل مثل النشر والتحجيم التلقائي. وقد تم تسليط الضوء على ميزات مثل تحديد إصدار نظام الملفات، وتخزين النماذج مؤقتًا، والتصورات في وقت التشغيل أثناء عمليات البناء، والتحجيم التلقائي القائم على طلبات في الثانية (RPS) كميزات بارزة.
  • قابلية مراقبة أفضل: يكشف TrueFoundry عن السجلات والمقاييس وأحداث Kubernetes مباشرة، مما يوفر قدرة أعمق على تصحيح الأخطاء مقارنة بالتجربة المدارة الأكثر غموضًا لمنصات استضافة النماذج البديلة.
  • وحدات معالجة الرسوميات الجزئية والمثيلات الفورية: تدعم المنصة تخصيص وحدات معالجة الرسوميات الجزئية والمثيلات الفورية عبر سير العمل، مما يضيف المزيد من الروافع لتحسين التكلفة.
  • نموذج التكلفة: بينما يضيف SageMaker حوالي 25% هامش ربح على تسعير المثيلات، يستخدم TrueFoundry Kubernetes فوق المثيلات الخام، مما يسمح له بتمرير وفورات البنية التحتية للمستخدمين. تشير الوثيقة إلى أن العملاء حققوا وفورات في التكلفة بنسبة 30% على الأقل مقارنة بـ SageMaker، مما يميز الميزة التنافسية المحتملة للمنصة من حيث التكلفة.

النتائج حتى الآن

من خلال مبادرات بوابة الذكاء الاصطناعي وعمليات التعلم العميق (DLOps) المدمجة، حققت Innovaccer ما يلي:
  • الذكاء الاصطناعي التوليدي (GenAI) على نطاق الإنتاج عبر منصة الرعاية الصحية: حوالي 17 مليون طلب استدلال شهريًا وأكثر من 37 مليار رمز (حوالي 34 مليار إدخال، 3.4 مليار إخراج) يتم توجيهها عبر بوابة ذكاء اصطناعي واحدة تغطي أكثر من 40 نموذجًا وأكثر من 25 تطبيقًا للرعاية الصحية. يعكس هذا النطاق دمج الذكاء الاصطناعي التوليدي في سير العمل الأساسي مثل التلخيص السريري، وتحديد فجوات الرعاية، وتصنيف المخاطر، ودعم الترميز، والذكاء التشغيلي — وليس مجرد مشاريع تجريبية معزولة.

  • تتدفق جميع حركة مرور نماذج اللغة الكبيرة (LLM) الآن عبر مستوى تحكم موحد مع استخدام الرموز، وزمن الاستجابة (الوقت حتى الرمز الأول، زمن الاستجابة بين الرموز)، ومقاييس التكلفة المدمجة مباشرة في حزمة Grafana الخاصة بـ Innovaccer. يتيح ذلك إشرافًا مركزيًا عبر الفرق والبيئات ومقدمي النماذج في البيئات المنظمة والغنية بالمعلومات الصحية المحمية (PHI).

  • المرونة أثناء عدم استقرار المزود: أثناء ارتفاع معدلات أخطاء OpenAI، تم إعادة توجيه حركة المرور تلقائيًا إلى Azure عبر قواعد استعادة مسبقة التكوين، مما حافظ على استمرارية تطبيقات الرعاية الصحية التابعة دون الحاجة إلى تغييرات على طبقة التطبيق.

  • تحجيم تلقائي أسرع وأكثر شفافية لأعباء عمل تعلم الآلة (ML): أظهرت المقارنة المعيارية مع منصات استضافة النماذج البديلة انخفاضًا في الوقت المستغرق من تفعيل التحجيم التلقائي إلى التشغيل من حوالي 8 دقائق إلى حوالي 5 دقائق (أسرع بنسبة 37.5%)، مع رؤية أعمق على مستوى المنصة لأحداث التحجيم وحالات النشر.

  • جاهزية النشر المنظم: يتيح نشر TrueFoundry في AWS GovCloud لشركة Innovaccer تشغيل أعباء عمل الذكاء الاصطناعي التوليدي (GenAI) في بيئات سيادية وحساسة للامتثال، مع استخدام نفس إطار عمل الحوكمة والتنسيق.