محادثات تعلم الآلة الحقيقية #11 - LLMs، LLMops و GenAI المدير التقني في Greenhouse

Built for Speed: ~10ms Latency, Even Under Load
Blazingly fast way to build, track and deploy your models!
- Handles 350+ RPS on just 1 vCPU — no tuning needed
- Production-ready with full enterprise support
نعود إليكم بحلقة جديدة من نقاشات التعلم الآلي الحقيقية. في هذه الحلقة، نتعمق مرة أخرى في النماذج اللغوية الكبيرة (LLMs)، وعمليات النماذج اللغوية الكبيرة (LLMops)، والذكاء الاصطناعي التوليدي، ونتحدث مع مايكل بوفورد.
مايكل هو المدير التقني لشركة Greenhouse الذي انضم كأول موظف قبل حوالي 11 عامًا، وكتب بذلك الأسطر الأولى من التعليمات البرمجية وساهم في بناء الشركة لتصل إلى ما هي عليه اليوم.
📌
ستغطي محادثاتنا مع مايك الجوانب التالية:
- الهيكل التنظيمي لفرق التعلم الآلي في Greenhouse
- كيفية استخدام النماذج اللغوية الكبيرة (LLMs) ونماذج الذكاء الاصطناعي التوليدي في Greenhouse
- التعامل مع النماذج اللغوية الكبيرة
- فهم هندسة الأوامر (Prompt Engineering)
- عمليات النماذج اللغوية الكبيرة (LLMOps) والأدوات الأساسية لها
شاهدوا الحلقة الكاملة أدناه:
الهيكل التنظيمي لفرق علم البيانات والتعلم الآلي في Greenhouse
تطورت فرق علم البيانات والتعلم الآلي في Greenhouse مع نمو الشركة، منتقلة من أدوار عامة إلى أدوار متخصصة. تشمل الجوانب الرئيسية لهيكلهم التنظيمي ما يلي:
- هندسة البيانات والمنصة: يتولى فريق متخصص إدارة هندسة البيانات، وتخزين البيانات، وتطوير ميزات التعلم الآلي. كما يدعمون جهود التسويق ويتولون نشر وتشغيل التعليمات البرمجية والنماذج.
- علم بيانات المنتجات: يركز هذا الفريق على دعم اتخاذ القرارات المتعلقة بالمنتجات من خلال المشاريع المبتكرة، وتحليل البيانات، والرؤى التي تدفع تطوير المنتجات.
- هندسة تعلم الآلة (ML Engineering): لدى Greenhouse فريق هندسة تعلم الآلة متخصص في بناء نماذج قابلة للتطوير وموثوقة وجاهزة للإنتاج لحالات استخدام مختلفة للمنتج.
بالإضافة إلى ذلك، يقوم فريق محللي الأعمال بمعالجة الأسئلة المتعلقة بالأعمال وتقديم رؤى.
تعد إدارة البنية التحتية مسؤولية فريق البنية التحتيةالمنفصل، الذي يشرف على مكونات مثل Kubernetes و AWS. ولمخازن البيانات فريق مخصص لإدارتها.
كيف تُستخدم نماذج اللغات الكبيرة ونماذج الذكاء الاصطناعي التوليدي في Greenhouse
فيما يلي العديد من حالات الاستخدام التي تم فيها توظيف هذه النماذج ضمن عمليات Greenhouse.
- تشابه الوظائف ومعالجة البيانات: تستخدم Greenhouse نماذج اللغات الكبيرة (LLMs)، بما في ذلك Bard و GPT-2، لتحليل ومعالجة جوانب مختلفة من البيانات المتعلقة بالوظائف. تساعد هذه النماذج في تحديد أوجه التشابه بين قوائم الوظائف المختلفة، بالإضافة إلى تحليل ومعالجة بيانات السيرة الذاتية الخام. ينصب التركيز على معالجة البيانات بكفاءة وجهود التصنيف المتعلقة بأوصاف الوظائف.
- هندسة RAG للحصول على إجابات أسرع: استكشفت Greenhouse مؤخرًا استخدام GPT-4 لحالات استخدام مبتكرة. يتضمن أحد هذه الاستخدامات تطبيق هندسة RAG (التوليد المعزز بالاسترجاع) لتقديم استجابات سريعة لاستفسارات المستخدمين. من خلال الاستفادة من النماذج التوليدية، تهدف Greenhouse إلى تمكين المستخدمين من الحصول على إجابات لأسئلة معقدة كانت تتطلب سابقًا إنشاء تقارير يدوية. يعمل النموذج التوليدي كمترجم، حيث يحول الاستفسارات الإنجليزية إلى لغة استعلام تتفاعل مع مخزن البيانات، ثم يترجم الاستجابة مرة أخرى للاستهلاك.
- التقارير وذكاء الأعمال (BI): مع إمكانية الوصول إلى كميات هائلة من البيانات النصية في شكل أوصاف وظيفية وسير ذاتية، تتمتع Greenhouse بموقع جيد للاستفادة من نماذج اللغات الكبيرة والنماذج التوليدية لأغراض إعداد التقارير وذكاء الأعمال. تقدم Greenhouse بالفعل تقارير جاهزة، ومنشئ تقارير مخصص، ومنتج بحيرة بيانات. تتصور الشركة استخدام نماذج اللغات الكبيرة للإجابة على مجموعة واسعة من أسئلة التقارير المتعلقة بالتوظيف، مثل أداء المصادر، وعمليات المقابلة، وحالة التوظيف، وتحليل الميزانية، والمزيد.
التعامل مع نماذج اللغات الكبيرة: معالجة المشكلات واحتضان الاستضافة الذاتية
مشكلات نماذج اللغات الكبيرة
بينما يقدم ChatGPT، المدعوم بنماذج مثل GPT-4، نتائج مبهرة، لا تزال هناك بعض التحديات والمخاوف المرتبطة باستخدامه. فيما يلي بعض المشكلات التي تنشأ مع ChatGPT:
- الموثوقية: لا يزال GPT-4 في مراحله الأولى وقد لا يكون موثوقًا به تمامًا للنشر في البنية التحتية للإنتاج. ونتيجة لذلك، قد لا يكون من المستحسن الاعتماد كليًا على GPT-4 للأنظمة الحيوية التي تتطلب أداءً وموثوقية ثابتين.
- شروط الخدمة وخصوصية البيانات: كما هو الحال مع أي نموذج ذكاء اصطناعي، هناك مخاوف بشأن كيفية التعامل مع البيانات وما إذا كانت تُستخدم لأغراض التدريب. يمكن أن تكون الثقة في أن البيانات ستُعالج بأمان ولن تتسرب أو تُساء استخدامها مشكلة كبيرة، خاصة عند التعامل مع البيانات الحساسة مثل معلومات التعريف الشخصية (PII).
- النماذج المستضافة ذاتيًا: يمكن أن يوفر استخدام نماذج أصغر ومستضافة ذاتيًا مزايا من حيث الموثوقية والتكلفة والأداء. من خلال استضافة النماذج ضمن بنيتك التحتية الخاصة، يكون لديك سيطرة أكبر على معلمات الإدخال/الإخراج والمراقبة وتكوينات الأمان. يمكن لهذا النهج أن يقلل من المخاطر المرتبطة بالاعتماد على الخدمات الخارجية.
- الكفاءات والبنية التحتية: تتطلب استضافة حتى نماذج اللغة الأصغر مهارات متخصصة وبنية تحتية. قد يكون من الضروري بناء الخبرة والموارد اللازمة داخليًا لإدارة هذه النماذج واستخدامها بفعالية. بينما يقوم مزودو الخدمات السحابية مثل Azure وGoogle وAmazon بتطوير نماذج اللغة الكبيرة الخاصة بهم، قد لا يكون لديهم خبرة واسعة في التعامل مع المدخلات غير الموثوق بها والتحديات المحددة المرتبطة بها.
- أمان البيانات: حماية البيانات الحساسة أمر بالغ الأهمية، خاصة عند معالجة معلومات التعريف الشخصية (PII). أحد الأساليب هو تدريب النماذج دون الكشف المباشر عن البيانات الخام. على سبيل المثال، يمكن أن يساعد استخدام تجزئات (hashes) غير قابلة للفقد للقيم بدلاً من البيانات الفعلية في الحفاظ على الخصوصية مع الاستمرار في التقاط العلاقات الهادفة. سيكون تجربة أساليب مختلفة وضمان أمان البيانات أمرًا ضروريًا.
مزايا النماذج المستضافة ذاتيًا
- أداء أفضل للنموذج: يمكن للنماذج الأصغر أن توفر أداءً محسّنًا في الإجابة على الأسئلة.
- خفض التكاليف: تكون تكاليف الحوسبة أقل عند استخدام نماذج أصغر، دون التكاليف الإضافية لطرف ثالث.
- التحكم والمساءلة: تتيح استضافة النماذج ذاتيًا مزيدًا من التحكم والمساءلة، حيث تعمل ضمن بنيتك التحتية الخاصة.
- أمان البيانات وخصوصيتها: تقلل الاستضافة الذاتية من مخاطر تسرب البيانات وتضمن تحكمًا أفضل في معلمات الإدخال والإخراج.
- المراقبة والأمان: تتيح النماذج المستضافة ذاتيًا مراقبة أفضل والقدرة على إعداد تكوينات الأمان وفقًا لاحتياجاتك.
- مفضل لتطبيقات SaaS للمؤسسات: بالنسبة للميزات التي يمكن أن تخدمها النماذج المستضافة ذاتيًا وتلبي معايير الأداء المطلوبة، يُفضل اختيار الاستضافة الذاتية.
- جدوى GPT-4: لا تزال جوانب الموثوقية وأمن البيانات وخصوصية البيانات في GPT-4 قيد التقييم وتحتاج إلى مزيد من التقييم قبل النظر في استخدامها لأنظمة الإنتاج.
التقييم واتخاذ القرار
عند التفكير فيما إذا كان يجب الاستثمار في النماذج المستضافة ذاتيًا أو الاعتماد على نماذج اللغة التجارية الكبيرة، يجب على القادة تقييم العوامل التالية بعناية:
- حالات الاستخدام: قيّم ما إذا كانت المشكلة المطروحة يمكن معالجتها بفعالية بواسطة نماذج أصغر من حيث كفاءة التكلفة والفعالية الحسابية.
- الآثار طويلة الأجل على التكلفة: ضع في اعتبارك الوفورات المحتملة في التكاليف لاستضافة نموذجك الخاص مقارنة بالوصول إلى النماذج الكبيرة جدًا، والتي قد توفر عوائد متناقصة.
- التحكم والاستقلالية: وازن بين فوائد الحصول على قدر أكبر من التحكم والاستقلالية على البنية التحتية واتجاه النموذج، بالإضافة إلى القدرة على تخصيص النموذج وتكييفه لحالات استخدام محددة.
- فرص الاستثمار والتعلم: أقر بأن بناء وتدريب النماذج الأصغر قد يتطلب استثمارًا أوليًا من حيث موارد الفريق والتجريب والضبط الدقيق. ومع ذلك، يمكن أن يؤدي هذا الاستثمار إلى نماذج محسّنة مصممة خصيصًا لحالات استخدام معينة ويعزز معرفة الفريق وفهمه.
فهم هندسة الموجهات
أصبحت هندسة الموجهات موضوع نقاش في مجال نماذج اللغة الكبيرة (LLMs). تتضمن صياغة موجهات فعالة لاستخلاص الاستجابات المطلوبة من النموذج. فيما يلي بعض النقاط الرئيسية لفهم المفهوم وآثاره:
- هندسة الموجهات كدور مستقل: قد تصبح هندسة الموجهات مسمى وظيفيًا معترفًا به أو دورًا متخصصًا في هذا المجال، حيث يقوم الخبراء بتحسين الموجهات والتعامل مع الشبكات العصبية بفعالية.
- النهج الهندسي للموجهات: تتضمن هندسة الموجهات تطبيق المنهج العلمي لتوليد مخرجات يمكن التنبؤ بها عن طريق تعديل الموجهات وصقلها لتحقيق النتائج المرجوة.
- التمييز عن الاستخدام العادي للمطالبات: مجرد نسخ ولصق المطالبات دون فهم أعمق أو تعديلات لا يعتبر هندسة مطالبات.
- الطبيعة متعددة الأوجه لهندسة المطالبات: تتطلب هندسة المطالبات فهمًا شاملاً لكيفية تأثير المطالبات على الشبكات العصبية والمعلومات المحددة التي تلتقطها، متجاوزة المهارات اللغوية.
- غياب البرمجة الحتمية: تُدخل نماذج اللغة الكبيرة (LLMs) تعقيدًا بسبب الاختلافات في النماذج وبيانات التدريب والسلوكيات المتغيرة، مما يجعل هندسة المطالبات صعبة.
- تحسينات محتملة في الكفاءة والقدرة على التنبؤ: قد يؤدي تعميق فهم نماذج اللغة الكبيرة (LLMs) إلى تنشيط أكثر كفاءة لأجزاء الشبكة العصبية، مما ينتج عنه نتائج أكثر قابلية للتنبؤ واتساقًا.
- تصور الترميز الطبقي: تقوم معماريات المحولات في نماذج اللغة الكبيرة (LLMs) بترميز المعلومات في طبقات مختلفة، على غرار كيفية معالجة الشبكات العصبية التلافيفية (CNNs) للصور. يمكن لمهندسي المطالبات استكشاف تنشيط طبقات محددة للتأثير على المخرجات المولدة.
- مشهد الأدوات وعمليات نماذج اللغة الكبيرة (LLMOps): يتجه الاهتمام نحو مشهد الأدوات المحيط بنماذج اللغة الكبيرة (LLMs)، والذي يُشار إليه باسم LLMOps، ويشمل ممارسات التطوير والنشر والإدارة. لا يزال المصطلح في طور التطور.
LLMOps والأدوات الحيوية لنماذج اللغة الكبيرة (LLMs)
تكتسب LLMOps ومشهد الأدوات المحيط بنماذج اللغة الكبيرة (LLMs) اهتمامًا متزايدًا.
عندما يتعلق الأمر بإدارة المطالبات، والمعالجة السريعة للبيانات، وتصنيف الملاحظات، وغيرها من المهام الأساسية، فمن المتوقع أن تلعب أدوات معينة دورًا حاسمًا مع توسع استخدام نماذج اللغة الكبيرة (LLMs). تتضمن بعض الاعتبارات الرئيسية ما يلي:
- قواعد بيانات العوامل: ستكون قواعد البيانات القابلة للبحث مثل Minecon حاسمة لاسترجاع السياق ذي الصلة لإعادة تغذيته إلى الشبكة العصبية. يُمكّن الوصول إلى المعلومات ذات الصلة هندسة المطالبات وتحسينها.
- أطر عمل المشاريع: توفر مشاريع مثل LangChain أطر عمل برمجية تسهل تنفيذ مجموعة واسعة من الوظائف، مما يساهم في الاستخدام الفعال لنماذج اللغة الكبيرة (LLMs).
- التكامل والبنية التحتية: تعد نماذج اللغة الكبيرة (LLMs) عادةً جزءًا من برامج أوسع نطاقًا، مما يستلزم التكامل والإدارة الفعالة للمكونات المختلفة. يعد ربط الأجزاء المختلفة ببعضها لتحقيق النتائج المرجوة أمرًا حيويًا وقد يتطلب خبرة في إدارة البنية التحتية والذاكرة.
- المراقبة والصيانة: تظل ممارسات التعلم الآلي التقليدية، مثل مراقبة الانحدارات، وتقييم الأداء، وتقييم سعة البنية التحتية، ذات صلة في سياق نماذج اللغة الكبيرة (LLMs). يعد ضمان الدعم المناسب للبنية التحتية والسعة أمرًا بالغ الأهمية لتحقيق الأداء الأمثل.
- تخزين المطالبات: يتطلب حفظ المطالبات للاستخدام المستقبلي دراسة متأنية. على الرغم من إمكانية استخدام خيارات متنوعة، مثل قواعد البيانات، أو التخزين المؤقت، أو تخزين الملفات، لتخزين النصوص وحتى النصوص القابلة للتعديل بالمعاملات، إلا أن تصميم طرق ذات معنى لتخزين المطالبات لا يزال مجالًا مستمرًا للاستكشاف.
- تحسين الذاكرة: يمكن أن يكون التعامل مع متطلبات الذاكرة للنماذج الكبيرة أمرًا صعبًا. تصبح إدارة استخدام ذاكرة الوصول العشوائي لوحدة معالجة الرسوميات (GPU RAM) بالغة الأهمية، خاصة عند الضبط الدقيق للنماذج التي تزيد متطلبات الذاكرة بشكل كبير. يتطلب تحسين النماذج لأنواع معينة من وحدات معالجة الرسوميات أو متطلبات زمن الوصول خبرة ودعمًا للأدوات.
- أدوات إدارة البنية التحتية: مع تشغيل المؤسسات لنماذج اللغة الكبيرة (LLMs) على بنيتها التحتية السحابية الخاصة بها، تنشأ تحديات جديدة فيما يتعلق بإدارة البنية التحتية. هناك حاجة لدعم الأدوات لمهام مثل التحجيم التلقائي لوحدات معالجة الرسوميات (GPU)، وضمان وقت التشغيل، وتحسين التكاليف، وبناء أنظمة قابلة للتطوير تتوافق مع متطلبات العمل المحددة.
- سير عمل المطورين: تعد الأدوات التي تعزز سير عمل المطورين عند العمل مع نماذج اللغة الكبيرة (LLMs) ضرورية. يمكن أن يساعد تبسيط العمليات المعقدة وتوفير واجهات سهلة الاستخدام في تسريع التبني وجعل نماذج اللغة الكبيرة في متناول شريحة أوسع من المستخدمين.
- تثقيف المجتمع: مع بقاء مجال نماذج اللغة الكبيرة (LLM) في مرحلة استكشافية، فإن شركات مثل TrueFoundry لديها فرصة لتثقيف وتوجيه المجتمع بشأن الأدوات المتاحة، وأفضل الممارسات، والحلول للتحديات الشائعة.
📌
تقييم نماذج النطاق الكبيرة
في سياق التدخل البشري في التقييم، يُستخدم نهج "الإنسان في الحلقة" (human in the loop) بشكل شائع في حالات الاستخدام الجادة مع نماذج اللغة الكبيرة (LLMs). يعد التحقق البشري أمرًا بالغ الأهمية لتقييم أداء النموذج والتحقق من مخرجاته. حتى أثناء عملية الضبط الدقيق لنماذج GPT، لعب التدخل البشري دورًا أساسيًا.
بالنسبة لحالات الاستخدام الأقل أهمية حيث يوجد مجال لبعض هامش الخطأ، يتضمن نهج فعال من حيث التكلفة استخدام نماذج أكبر لتقييم استجابات النماذج الأصغر. يمكن مقارنة وتقييم الاستجابات المتعددة التي تولدها النماذج الأصغر بواسطة نموذج أكبر، مما يسمح بوضع مقاييس لقياس الأداء. بينما يتكبد هذا النهج بعض التكاليف، إلا أنه أكثر اقتصادية بشكل عام مقارنة بالاعتماد كليًا على الجهود البشرية.
البقاء على اطلاع في العالم دائم التطور
البقاء على اطلاع في عالم نماذج اللغة الكبيرة (LLMs) والتعلم الآلي المتطور باستمرار قد يكون تحديًا. إليك بعض الأساليب الفعالة للبقاء على اطلاع واكتساب المعرفة:
- فيديوهات شرح الذكاء الاصطناعي: مشاهدة فيديوهات شرح الذكاء الاصطناعي على منصات مثل يوتيوب توفر وسيلة مريحة لفهم النتائج الرئيسية والاستنتاجات للأوراق البحثية الأكاديمية دون الحاجة إلى قراءة مكثفة. تلخص هذه الفيديوهات المفاهيم المعقدة، مما يوفر الوقت والجهد.
- المجتمعات عبر الإنترنت: التفاعل مع المجتمعات عبر الإنترنت، مثل هاكر نيوز ومنتديات فرعية للتعلم الآلي، يقدم رؤى ومناقشات وتحديثات حول الاتجاهات والتقنيات الناشئة في هذا المجال.
- الخبرة العملية: المشاركة الفعالة في التطبيقات العملية لنماذج اللغة الكبيرة (LLMs) أمر بالغ الأهمية لاكتساب فهم أعمق لإمكانياتها وقيودها. من خلال التجريب واستكشاف القدرات، يمكن للمرء تعزيز معرفته.
- سهولة الوصول إلى واجهات برمجة التطبيقات (APIs): على عكس الماضي، حيث كان التعلم الآلي يتطلب مراجعة مفاهيم رياضية معقدة، فإن المشهد الحالي يعتمد بشكل أكبر على واجهات برمجة التطبيقات (APIs). تمكن واجهات برمجة التطبيقات والمكتبات الجاهزة المطورين من البدء في التجريب وبناء التطبيقات دون الحاجة إلى إعادة تعلم الرياضيات المتقدمة.
- مهارات البرمجة: تعلم أساليب مكتبات معينة وحل مشكلات البيئة هي مهارات قيمة في تطبيق نماذج اللغة الكبيرة (LLMs) بفعالية.
اقرأ مدوناتنا السابقة ضمن سلسلة "True ML Talks":
استمر في مشاهدة سلسلة TrueML على يوتيوب وقراءة سلسلة TrueML للمدونات.
TrueFoundry هي منصة كخدمة (PaaS) لنشر تعلم الآلة (ML) فوق Kubernetes لتسريع سير عمل المطورين مع منحهم مرونة كاملة في اختبار ونشر النماذج، وضمان الأمان والتحكم الكامل لفريق البنية التحتية. من خلال منصتنا، نمكّن فرق تعلم الآلة من نشر ومراقبة النماذج في 15 دقيقة بموثوقية 100%، وقابلية للتوسع، والقدرة على التراجع في ثوانٍ - مما يسمح لهم بتوفير التكلفة وإطلاق النماذج إلى الإنتاج بشكل أسرع، وبالتالي تحقيق قيمة تجارية حقيقية.
TrueFoundry AI Gateway delivers ~3–4 ms latency, handles 350+ RPS on 1 vCPU, scales horizontally with ease, and is production-ready, while LiteLLM suffers from high latency, struggles beyond moderate RPS, lacks built-in scaling, and is best for light or prototype workloads.
The fastest way to build, govern and scale your AI


















.png)
.webp)










.webp)






