Blank white background with no objects or features visible.

تعلن TrueFoundry عن استحواذها على Seldon AI، موسعة بذلك لوحة التحكم الخاصة بها للذكاء الاصطناعي للمؤسسات. البيان الصحفي الكامل →

examroom.ai هي منصة تقييم تعتمد على الذكاء الاصطناعي في المقام الأول للجامعات وهيئات الاعتماد ومنظمات إصدار الشهادات. تدير دورة حياة الاختبارات بالكامل — بدءًا من تأليف الأسئلة (التي يسميها الفريق "عناصر") وصولًا إلى تسجيل المرشحين، ومراقبة الاختبارات عبر الإنترنت وخارجها، وإرجاع النتائج المعتمدة فور انتهاء المرشح. تستمر بعض الاختبارات لمدة تصل إلى 28 ساعة. خلف تجربة مرشح سلسة ومصممة بعناية، يكمن نظام كبير من الذكاء الاصطناعي: أكثر من 60 حلًا متميزًا للذكاء الاصطناعي يشمل رؤية الكمبيوتر لتصحيح أوراق الإجابة (OMR)، ونماذج اللغة الكبيرة للدعم والتقييم، والمراقبة، والتنبؤ، واختيار العناصر.

مع انتقال examroom.ai بهذه الحلول من مرحلة التجارب إلى الإنتاج لمئات الآلاف من المستخدمين، توقفت المشكلات الصعبة عن كونها تتعلق بدقة النموذج وبدأت تتعلق بـ تشغيل الذكاء الاصطناعي على نطاق واسع: قابلية المراقبة، والحوكمة، والتحكم في التكاليف، والضوابط الوقائية. تتناول دراسة الحالة هذه كيف قامت examroom.ai بتوحيد طبقة التشغيل هذه على TrueFoundry — باستخدام المنصة لنشر الخدمات في ساعات بدلاً من أيام، واعتماد بوابة TrueFoundry للذكاء الاصطناعي كلوحة تحكم للمراقبة والحوكمة عبر نظامها البيئي للذكاء الاصطناعي.

"يزيد الذكاء الاصطناعي من التعقيدات عندما لا تستخدمه بالطريقة الصحيحة. لكنه يحل المشكلة إذا استخدمته بالطريقة الصحيحة." — ديباك إم كيه، نائب الرئيس، examroom.ai

التحدي: الإنتاج عالم آخر تمامًا

تم بناء examroom.ai بمنهجية الإنتاج أولاً. يشرح ديباك: "تتبنى examRoom.ai عقلية الإنتاج أولاً. نحن نصمم الحل ليس فقط لأغراض التجريب أو إثبات المفهوم — بل يجب أن يكون لشبكة الإنتاج. لأن في مرحلة الإنتاج، التوسع وحل المشكلات أمر مختلف تمامًا."

تعلم الفريق هذا الدرس مبكرًا. في عام 2021، عمل نموذج لاكتشاف الكائنات (مبني على YOLO وخط أنابيب يعتمد على RCNN) لمراقبة نزاهة الاختبارات بشكل لا تشوبه شائبة على خادم محلي لمدة ست أو سبع ساعات من الاختبار. لكنه انهار في مرحلة الإنتاج: فقد يستغرق النموذج ما يصل إلى خمس دقائق للتشغيل، وفشل في اكتشاف الكائنات الصغيرة التي تهم أكثر في نزاهة الاختبار. يتذكر ديباك: "شعرنا بالقلق من النجاح المبكر على الجهاز المحلي. لكن في الإنتاج، تنهار أعصابك تمامًا."

عند تشخيص المشكلة، وجد الفريق أربع مشكلات متفاقمة: هندسة معمارية لم تظهر الأخطاء التي يمكن للمطورين التصرف بناءً عليها بسرعة؛ عدم وجود نظام تقديم قابل للتوسع؛ حوسبة مبرمجة بشكل ثابت بدون توسيع تلقائي؛ وافتراضات سعة انهارت تحت الحمل الحقيقي. مع ارتفاع الاستخدام، ارتفعت الذاكرة والحوسبة بشكل غير متوقع.

من الناحية التشغيلية، كان النشر أمرًا معقدًا بحد ذاته. حتى مع Kubernetes المُدار مع التوسيع التلقائي المضاف، استغرق نشر الخدمة من خمسة إلى ستة أيام، واحتفظ الفريق بـ ثلاثة مهندسين يعملون بدوام كامل على عمليات تعلم الآلة (ML Ops) وحدها. يلاحظ ديباك: "يمكن أن تتآكل التكلفة في الإنتاج إذا لم تستخدم الخدمات الصحيحة بالطريقة الصحيحة" — وعلى هذا النطاق، لم تعد الحوكمة وقابلية المراقبة خيارًا.

توسيع الأساس: من 6 أيام إلى أقل من ساعتين

كان التحول الأول هو نقل النشر إلى TrueFoundry. بدلاً من إدارة المجموعات يدويًا، يقوم الفريق الآن بدفع الحاويات وتتولى المنصة الباقي.

"الآن لم نعد بحاجة للعمل على ذلك، لأننا انتقلنا إلى TrueFoundry. ما عليك سوى دفع الحاويات، وستتولى المنصة تلقائيًا تشغيل جميع الخوادم بأقل عدد من النقرات. يمكنك إدارة الحوسبة، وإدارة التكلفة، ويمكنك رؤية كل ذلك بصريًا. لقد حول ذلك الأمر من 6 أيام إلى أقل من ساعتين بالنسبة لنا."

حرر هذا التغيير المهندسين الثلاثة المتخصصين في عمليات تعلم الآلة (ML Ops) للعمل على المنتج بدلاً من البنية التحتية. اليوم، تدير examroom.ai 94 خدمة على TrueFoundry عبر بيئات الإنتاج، والتجهيز، واختبار قبول المستخدم (UAT)، وضمان الجودة (QA)، والتطوير — بما في ذلك أعباء العمل المدعومة بوحدات معالجة الرسوميات (GPU) للتعرف الضوئي على الحروف (OCR)، وتوليد العناصر، والكشف — مع التوسع التلقائي على السعة الفورية والعودة التلقائية إلى السعة حسب الطلب. تحمل كل خدمة تفاصيل تكلفتها الخاصة، وتتبع حجم الطلبات وزمن الاستجابة (P50/P90/P99)، وصحة الحاويات (pods)، والسجلات المركزية، كل ذلك في مكان واحد.

مستوى التحكم: قابلية المراقبة والحوكمة عبر بوابة الذكاء الاصطناعي

بعد حل مشكلة النشر، برزت المشكلة الأصعب والأكثر استراتيجية: كيف يمكنك مراقبة وحوكمة أكثر من 60 حلًا للذكاء الاصطناعي تخدم 500,000 مستخدم دون إبطاء أي شخص؟ هنا تعتمد examroom.ai على بوابة TrueFoundry للذكاء الاصطناعي كمعيار، لتكون مستوى التحكم الوحيد أمام نماذجها، ووكلائها، وأدواتها.

"مؤخرًا، قدمت TrueFoundry البوابة أيضًا، حيث يمكننا حل جزء قابلية المراقبة والحوكمة."

1. قابلية المراقبة التي تشير إلى الحل

بالنسبة لـ examroom.ai، قابلية المراقبة ليست مجرد لوحات معلومات بحد ذاتها — إنها الفرق بين مرشح ينتظر ساعات للحصول على نتيجة ومهندس يحل السبب الجذري في دقائق. عندما تفشل نتيجة في التوليد، يجب أن يخبر النظام الفريق بالسبب: هل كانت مشكلة في التعرف على الأنماط، أم أن النموذج فشل ببساطة في قراءة الفقاعات؟ هذا التمييز يوجه الإشعار الصحيح إلى المسؤول الصحيح، الذي يتواصل بدوره مع المهندس المناسب.

"في السابق، كان فهم المشكلة بحد ذاته هو المشكلة. الآن ما عليك سوى الانتقال إلى السجلات، وتطبيق الفلتر، وستعرف بالضبط ما هي المشكلة — بفضل TrueFoundry، التي تمنحك الإجراء الذي يجب اتخاذه بناءً عليه. لا تحتاج إلى تصحيح الأخطاء أو طباعة جميع السجلات. كل شيء أمامك مباشرة. ما عليك سوى قراءته واتخاذ الإجراء."

ممارسة أساسية: تعامل مع قابلية المراقبة على أنها قابلة للتنفيذ، وليست مجرد مرئية — الهدف هو إجراء موصى به، وليس كومة من السجلات.

2. الحوكمة من خلال الضوابط الوقائية، وليس اللجان

غالبًا ما تُعامل الحوكمة كعبء على فرق الذكاء الاصطناعي. وجهة نظر ديباك هي العكس: قم ببناء الضوابط الوقائية بشكل صحيح مقدمًا، وتصبح الحوكمة تلقائية.

"الكثير من الناس يقولون إن الذكاء الاصطناعي غير قادر على التعامل مع الحوكمة. ولكن استخدمه بالطريقة الصحيحة وستدخل الحوكمة في الصورة تلقائيًا. أنشئ الضوابط الوقائية بالطريقة التي تحتاجها، ولن تضطر إلى إدارة الحوكمة على الإطلاق."

مثال ملموس: تدير examroom.ai مساعد دعم للمرشحين الذين يواجهون مشاكل أثناء التسجيل أو الدفع. يجب أن يحصل المرشح الذي دفع ولم يتلق تأكيدًا على المساعدة في ذلك بالضبط — ولا شيء آخر. يقول ديباك: "ماذا لو بدأ يسأل عن السياسة، أو أطعمةه المفضلة؟ هنا يأتي دور الضابط الوقائي". "أنت تقدم إجابة فقط للأسئلة ذات الصلة — المشكلة التي واجهها المرشح أثناء التسجيل أو إجراء الدفع." بوابة الذكاء الاصطناعي هي المكان الذي تُعرّف فيه هذه الضوابط الوقائية وتُفرض باستمرار عبر الخدمات، جنبًا إلى جنب مع التشفير الذي تستخدمه examroom.ai لحماية عناصر الاختبار، والذي قد يؤدي تسريبه إلى المساس بسلامة تقييم جامعة بأكملها.

ممارسة أساسية: قم بترميز الحوكمة كضوابط وقائية مفروضة عند البوابة، بحيث يرث كل نموذج ووكيل نفس السياسة تلقائيًا.

3. المرونة والعودة الذكية

مع 500,000 مستخدم، يمكن لمستخدم واحد أن يشغل عشرات من حلول الذكاء الاصطناعي التي تزيد عن 60 حلًا في وقت واحد. تتيح البوابة وهندسة الخدمات المصغرة لـ examroom.ai التعامل مع الأعطال بمرونة — بالتبديل من ثلاثة حلول إلى اثنين عندما يتعطل أحدها — دون تعطيل النظام بأكمله. يوضح ديباك: "على الرغم من تعطل خدمة واحدة، يمكنك اتخاذ إجراء بشأنها، لكن خدماتك الإجمالية لن تتعطل". مستوى التحكم نفسه هو المكان الذي يدير فيه الفريق توجيه النماذج، والنماذج الافتراضية، وبوابة MCP التي تربط وكلائها بالأدوات.

ممارسة رئيسية: صمم لآلية التعافي من الأعطال عند البوابة، بحيث يمكن إعادة توجيه حركة المرور عبر النماذج والخدمات دون تغيير نظام الإنتاج.

4. تقييم مصمم للتوسع

يوحد examroom.ai معاييره على مزيج هجين من RAG والضبط الدقيق، مع التقييم الآلي بدلاً من المراجعة البشرية كخيار افتراضي. يقول ديباك: "إذا نظرت إلى الرموز (tokens)، فهي ليست بضع مئات - بل بضعة آلاف. من المستحيل تتبعها يدويًا." ويضيف: "لذلك، تبني نظامًا يمكنه التقييم بنفسه، وإذا فشل، فأنت بالطبع موجود." يحافظ RAG على سهولة تحديد الذاكرة وضوابط الأمان فوق قاعدة المعرفة؛ بينما يتعامل الضبط الدقيق مع المصطلحات الخاصة بالمجال والمخرجات الموحدة.

النتائج

  • انخفض وقت النشر من 6 أيام إلى أقل من ساعتين — قفزة نوعية في سرعة الإصدار.
  • تم تحرير ثلاثة مهندسي ML Ops متخصصين من إدارة المجموعات للتركيز على المنتج.
  • توسع من 5 مستخدمين اختباريين إلى 500,000 مستخدم إنتاجي عبر دورة حياة التقييم.
  • 94 خدمة تعمل على TrueFoundry عبر بيئات prod و staging و UAT و QA و dev — مع التوسع التلقائي لوحدات معالجة الرسوميات (GPU autoscaling) على مثيلات spot و on-demand fallback، وتتبع التكلفة لكل خدمة، وسجلات مركزية ومقاييس زمن الاستجابة.
  • تحول حل الحوادث من التنقيب في السجلات إلى القراءة والتصرف، مع سجلات مصفاة وإجراءات موصى بها.
  • تتوحد إمكانية الرصد والحوكمة على بوابة الذكاء الاصطناعي كلوحة تحكم مركزية وحيدة لأكثر من 60 حلًا من حلول الذكاء الاصطناعي الخاصة بـ examroom.ai.

دروس عملية للفرق التي تضع الذكاء الاصطناعي في الإنتاج

عند سؤاله عما يميز الفرق التي تنجح في استخدام الذكاء الاصطناعي عن تلك التي تواجه صعوبات، كانت نصيحة ديباك واضحة ومحددة:

  • اربط كل حل بمؤشر أداء رئيسي للأعمال (KPI) — هل هو توفير للوقت أم توفير للتكلفة؟ "هذا هو الأثر التجاري الضروري لتشغيل المنظمة."
  • وحّد نمط التسليم. بالنسبة لصناعة معينة، يمكن حل 60-70% من المشكلة باستخدام بنية قابلة لإعادة الاستخدام — مسرعات، قوالب تنسيق، مسارات تقييم آلية، ونظام حوكمة. "في مشروع مدته ستة أشهر، هذا يقلل بالفعل أربعة أشهر."
  • لا تضع أي شيء في الإنتاج بدون قابلية للمراقبة، CI/CD، ونظام حوكمة.
  • لا تنبهر بالنجاح المبكر على جهاز محلي. الإنتاج هو المحك — "استمر في المراقبة."

الخلاصة

تُظهر رحلة examroom.ai أن الجزء الأصعب في الذكاء الاصطناعي الإنتاجي ليس بناء النموذج — بل هو تشغيل مجموعة كبيرة من النماذج بأمان، وبقابلية للمراقبة، وبتكلفة معقولة على نطاق واسع. من خلال توحيد النشر على TrueFoundry وتوحيد المراقبة والحوكمة على AI Gateway، حوّلت examroom.ai عملية نشر تستغرق ستة أيام وثلاثة مهندسين إلى عملية تستغرق ساعتين، وبنت لوحة التحكم التي تحتاجها لحوكمة أكثر من 60 حلًا للذكاء الاصطناعي لنصف مليون مستخدم. إذا كنت تقوم بتوسيع نطاق الذكاء الاصطناعي في الإنتاج وتحتاج إلى قابلية للمراقبة وحوكمة تواكب التطور، تحدث إلى TrueFoundry.

The fastest way to build, govern and scale your AI

شغّل مسار تعلم الآلة الخاص بك من اليوم الأول

مسار