TrueML Talks #27 - GenAI و LLMOps لنجاح العملاء في Level AI

Built for Speed: ~10ms Latency, Even Under Load
Blazingly fast way to build, track and deploy your models!
- Handles 350+ RPS on just 1 vCPU — no tuning needed
- Production-ready with full enterprise support
نعود إليكم بحلقة جديدة من True ML Talks. في هذه الحلقة، نتعمق في استراتيجية الذكاء الاصطناعي التوليدي (GenAI) وعمليات نماذج اللغة الكبيرة (LLMOps) في Level AI، حيث نتحدث مع أبيمانيو تالوار
أبيمانيو هو مهندس أبحاث الذكاء الاصطناعي الأول في Level AI. Level AI شركة متخصصة في الذكاء الاصطناعي للمحادثات. تستخدم التعلم الآلي لاستخلاص رؤى من بيانات المحادثات.
📌
ستغطي محادثاتنا مع أبيمانيو الجوانب التالية:
- الاستفادة من المحادثات السابقة لذكاء خدمة العملاء الاصطناعي
- مواجهة التحديات الخفية للذكاء الاصطناعي التوليدي
- المصدر المفتوح مقابل الضبط الدقيق
- فهم الوكلاء
- تبسيط ضمان الجودة في مراكز الاتصال باستخدام الذكاء الاصطناعي
- ذكاء خدمة العملاء الاصطناعي باستخدام GPT-4
- عمليات تعلم الآلة (MLOps) تُحدث ثورة في نجاح العملاء
شاهد الحلقة الكاملة أدناه:
الاستفادة من المحادثات السابقة لذكاء خدمة العملاء الاصطناعي
ذكاء خدمة العملاء الاصطناعي هو حديث الساعة، لكن الاعتماد فقط على قواعد المعرفة الثابتة له حدوده. مساعدة الوكيل و AgentGPT، أداتان مبتكرتان من Level AI، تطلقان العنان لقوة المحادثات السابقة لتعزيز كفاءة الوكلاء ورضا العملاء.
- Agent Assist: تحلل استفسارات العملاء وتقترح موارد ذات صلة من قاعدة المعرفة الحالية، مما يمكّن الوكلاء من الاستجابة بفعالية.
- AgentGPT: تذهب خطوة أبعد. فهي تحلل المحادثات السابقة، وتستخرج وتفهرس تلقائيًا معلومات قيّمة غير موجودة في قاعدة المعرفة. وهذا يخلق مجموعة ديناميكية ومتنامية باستمرار من الحلول لاستفسارات العملاء الدقيقة.
الاسترجاع: التنقيب في المحادثات السابقة عن إجابات
انسَ مطابقة الكلمات المفتاحية! تستخدم Level مسار استرجاع قويًا:
- المعالجة المسبقة: يتم تحويل المحادثات السابقة إلى تنسيق سهل البحث.
- الفهرسة المخصصة: يتم تصميم مفاتيح فريدة لمطابقة الاستفسارات الحالية مع التفاعلات السابقة ذات الصلة.
- التضمينات: نماذج التضمين المتقدمة (مثل مسارات RAG) تلتقط المعنى الدلالي للمحادثات، مما يتيح استرجاعًا دقيقًا.
لتقديم نتائج أفضل، يقومون أيضًا بما يلي:
- إعادة الترتيب: إعطاء الأولوية للنتائج الأكثر صلة بناءً على السياق وعوامل إضافية.
- مرشحات الكلمات المفتاحية: إزالة التفاعلات السابقة غير ذات الصلة أو غير المفيدة من البحث.
من خلال تسخير قوة قواعد المعرفة الثابتة والرؤى الديناميكية الكامنة في المحادثات السابقة، يقدم Agent Assist وAgentGPT لمحة عن مستقبل الذكاء الاصطناعي في خدمة العملاء. هذا المستقبل هو مستقبل يتم فيه تمكين الوكلاء بالمعلومات الصحيحة، مما يؤدي إلى حلول أسرع، وعملاء أكثر سعادة، ومركز اتصال أكثر كفاءة.
معالجة التحديات الخفية للذكاء الاصطناعي التوليدي
يُعد الذكاء الاصطناعي التوليدي أداة قوية، لكن نجاحه يعتمد على التنظيم الدقيق للبيانات، وأساليب التقييم القوية، والنهج القائم على البيانات.
اختيار البيانات الصحيحة من مجموعتك الضخمة يشبه العثور على المكونات المثالية لطبق شهي. يؤدي سوء اختيار البيانات إلى نموذج، حسناً، غير صالح للاستخدام.
أول شيء هو التركيز على بياناتك. بشكل أساسي، يجب أن يكون لديك فهم جيد لما يبدو عليه مزيج بياناتك. ما هي جودة تعليقاتك التوضيحية؟ كل ذلك مهم حقًا. وإلا، فما تدخله من بيانات سيئة، ستحصل على نتائج سيئة.
– أبهيمانيو
بعد اختيار البيانات الصحيحة، ستحتاج إلى تقييم نماذج الذكاء الاصطناعي التوليدي الخاصة بك. هذا ليس بالأمر المباشر مثل مهام الذكاء الاصطناعي التقليدية. انسَ المقاييس البسيطة مثل تداخل N-gram – فهي تفوت الفروق الدقيقة في الدقة. كلمة واحدة متبادلة ("نعم" بدلاً من "لا") يمكن أن تحدث فرقًا كبيرًا.
لهذا يمكنك استخدام:
- المقاييس البرمجية: استخدم أدوات مثل ROUGE وBERT لتقييم التشابه الدلالي.
- التقييمات البشرية: استعن ببشر حقيقيين لتقييم الجوانب النوعية مثل الاتساق والاكتمال.
لا تتسرع في استخدام النماذج الكبيرة. قم بإجراء التجارب باستخدام نقاط فحص أصغر للعثور على المزيج الأمثل للبيانات ووزن المهام.
المصدر المفتوح مقابل الضبط الدقيق
من المغري التمسك بتعدد استخدامات ChatGPT الظاهر. فبينما يتألق GPT-4 في السيناريوهات غير المقيدة، تعمل الشركات ضمن قيود العالم الحقيقي. يتطلب حجم حركة المرور المرتفع حلولاً فعالة ومنخفضة التكلفة دون التضحية بالأداء أو الاستجابة.
هنا تكمن ميزة الضبط الدقيق لنماذجك الخاصة:
- التركيز الفائق: بدلاً من محاولة أن تكون جيدًا في كل شيء، صمم نموذجك ليتفوق في مهام محددة وحيوية للأعمال. تخيل نموذجًا بارعًا في تفاعلات مركز الاتصال بدلاً من كتابة مقالات الدراسات العليا!
- الفعالية من حيث التكلفة: تتطلب النماذج الأصغر والأكثر تركيزًا قدرة حاسوبية أقل، مما يترجم إلى تكاليف تشغيلية أقل.
- التحكم والقدرة على التفسير: يمنحك الضبط الدقيق فهمًا أعمق وتحكمًا أكبر في سلوك نموذجك، مما يعزز الثقة والشفافية.
ChatGPT كنقطة انطلاق
لا تستبعد خيارات مثل ChatGPT تمامًا. يمكن أن تكون حلفاء قيمين! فكر في استخدامها كنقطة انطلاق لـ:
- التحقق من صحة فكرتك: جس النبض باستخدام النماذج مفتوحة المصدر قبل الاستثمار في التطوير المخصص.
- اكتساب زخم تجاري: استخدم الأدوات المتاحة بسهولة للحصول على ملاحظات واقعية وإثبات الجدوى قبل الخوض في الضبط الدقيق.
فهم الوكلاء
ما هي الوكلاء؟
فكر فيها كفرق متخصصة من نماذج اللغة الكبيرة (LLMs)، يلعب كل منها دورًا محددًا في سير عمل أكبر. بدلاً من استدعاءات API الفردية، تتضمن المهام تعاون عدة "وكلاء" من خلال استدعاءات API متسلسلة.
لماذا نستخدم الوكلاء؟
تخيل أنك تكتب قصيدة: أنت بحاجة إلى الإبداع، وتحليل القافية، وحتى التدقيق النحوي. قد يتفوق نموذج لغة كبير واحد في توليد الأبيات الأولية، وآخر في ضمان أنماط القافية، وثالث في صقل المسودة النهائية. يتيح لك الوكلاء الاستفادة من نقاط القوة الفريدة للنماذج المختلفة لتحقيق نتائج متفوقة.
متى يكون الوكلاء الخيار الصحيح؟
- المهام المعقدة: عندما يواجه نموذج لغة كبير واحد صعوبة في التعامل مع النطاق الكامل لهدفك، يمكن للوكلاء تقسيمها إلى خطوات قابلة للإدارة.
- الدقة والتحكم: تسلسل استدعاءات "الوكلاء" المختلفة يمنحك تحكمًا أكبر في العملية، مما يتيح لك تكييف الخطوات لتحقيق نتائج محددة.
- الجمع بين المهارات المتنوعة: استفد من نقاط القوة الفريدة لنماذج اللغة الكبيرة المتنوعة لتحقيق نتائج مبتكرة حقًا.
تبسيط ضمان الجودة في مراكز الاتصال باستخدام الذكاء الاصطناعي
أحد عروض Level AI هو Agent Assist، أداة ذكاء اصطناعي قوية مدعومة بتقنية GPT. تساعد في أتمتة ضمان الجودة من خلال تحليل المحادثات وتقديم رؤى حول أداء الوكلاء.
كيف يعمل:
- معايير ضمان الجودة: لدى مراكز الاتصال معايير محددة للمكالمات الجيدة، مثل حل المشكلات بشكل استباقي والتوصل إلى حل ناجح. يتعلم Agent Assist هذه المعايير من المحادثات السابقة.
- تحليل الذكاء الاصطناعي: يتم تحليل كل مكالمة، ويقدم Agent Assist درجة وتفسيرًا بناءً على معايير ضمان الجودة.
- قابلية التفسير بالأدلة: ليس مجرد صندوق أسود، بل يسلط Agent Assist الضوء على أجزاء محددة من المحادثة التي تدعم درجته، مما يمنح الوكلاء ملاحظات قيّمة.
- التدخل البشري: يمكن لمديري ضمان الجودة مراجعة نتائج Agent Assist وتعديل الدرجات إذا لزم الأمر، مما يضمن الدقة والعدالة.
فوائد Agent Assist:
- ضمان جودة أسرع: يوفر الوقت والموارد مقارنة بالمراجعات اليدوية.
- تحسين أداء الوكلاء: يقدم ملاحظات مستهدفة لمساعدة الوكلاء على التفوق.
- رؤى قائمة على البيانات: يكشف عن الاتجاهات ومجالات التحسين في خدمة العملاء.
- زيادة الكفاءة: يتيح المجال لمديري ضمان الجودة للقيام بمهام أكثر استراتيجية.
الذكاء الاصطناعي لخدمة العملاء باستخدام GPT-4
أثار وصول GPT-4 حماسًا في عالم الذكاء الاصطناعي، لكن هل هو الحل الشامل لتجارب خدمة عملاء استثنائية؟ ليس تمامًا. فبينما قوته لا يمكن إنكارها، هناك العديد من الطبقات الخفية وراء حلول الذكاء الاصطناعي ذات التأثير الحقيقي.
القوة والمزالق في النماذج الكبيرة:
إمكانات GPT-4 الخام مذهلة، متجاوزةً النماذج مفتوحة المصدر وواجهات برمجة التطبيقات في توليد الإجابات. ومع ذلك، فإن الاعتماد فقط على مخرجاته يتجاهل الأجزاء الحاسمة من مسار عمل الذكاء الاصطناعي: اختيار البيانات، استخلاص الميزات، التجميع، والمعرفة التجارية.
تكوين فريق ناجح:
- اختيار البيانات: يعد العثور على بيانات التدريب الصحيحة أمرًا أساسيًا. يساعد ترميز المحادثات السابقة الخاصة بصناعتك في تعليم الذكاء الاصطناعي شكل الخدمة "الجيدة" و"السيئة".
- استخلاص الميزات: البيانات الخام تحتاج إلى تنقية. يسمح استخلاص السمات الرئيسية من كل محادثة بالتحليل والمقارنة.
- التجميع والتصنيف العنقودي: تُعد ملايين المحادثات ذات السمات التي لا تُحصى أمرًا مربكًا. تعرض مخططات التصنيف العنقودي الذكية البيانات بطريقة يمكن للبشر فهمها والاستفادة منها.
- المعرفة التجارية: إن فهم ما يهم عملاءك حقًا يتجاوز المقاييس. تساعد الخبرة الصناعية في تحديد أولويات مؤشرات الأداء الرئيسية الصحيحة وتوجيه تطوير الذكاء الاصطناعي.
يمكنك قراءة المزيد حول كيفية استفادة الشركات من الخبرة البشرية والذكاء الاصطناعي لخدمة العملاء في المدونة أدناه.
MLOPs تُحدث ثورة في نجاح العملاء
تتم إعادة رسم مشهد نجاح العملاء بواسطة MLOPs، الصيغة السحرية وراء عمليات نشر الذكاء الاصطناعي الفعالة. إليك لمحة سريعة عن تأثيرها على مدى 5 سنوات:
- تعزيز الكفاءة: ودّع الاستعلامات البطيئة والعملاء المحبطين. فروبوتات الدردشة المدعومة بالذكاء الاصطناعي، والتي تعمل بتقنيات MLOPs، ستجيب على الأسئلة فورًا، مما يحرر الوكلاء للتفاعلات الهادفة.
- تناغم الإنسان والذكاء الاصطناعي: المستقبل ليس استبدال الروبوتات للبشر؛ بل هو عن التعاون. تمكّن MLOPs الوكلاء بإحصاءات مدفوعة بالبيانات لتقديم عروض مبيعات أكثر ذكاءً، وحل المشكلات بشكل استباقي، وتجارب مخصصة.
- قرارات مدفوعة بالبيانات: تطلق MLOPs العنان لقوة بيانات العملاء. ستتنبأ نماذج الذكاء الاصطناعي بالاحتياجات، وتخصص التوصيات، وتبني الثقة من خلال الإجراءات المستنيرة.
- التخصيص الفائق: تخصص MLOPs كل شيء بدءًا من العروض وصولاً إلى الدعم، مما ينمّي علاقات وولاء دائمين.
- ترويض وحش الهلوسة: تتصدى MLOPs لعدم الدقة من خلال التدريب المركّز والتحقق القائم على الأدلة، مما يضمن تفاعلات موثوقة مع العملاء.
MLOPs هي المفتاح لخلق مستقبل يركز على العملاء، ولكن الاستخدام المسؤول والأخلاقي أمر بالغ الأهمية. من خلال تبني إمكاناتها مع معالجة التحديات، يمكننا بناء قصص نجاح تستحق الاحتفاء بها.
يمكنك قراءة المزيد حول كيف سيشكل الذكاء الاصطناعي التوليدي مستقبل تجربة العملاء في المدونة أدناه.
اقرأ مدوناتنا السابقة في سلسلة True ML Talks:
تابع مشاهدة سلسلة TrueML على يوتيوب ومتابعة قراءة TrueML سلسلة المدونة.
TrueFoundry هي منصة كخدمة (PaaS) لنشر تعلم الآلة (ML) فوق Kubernetes، تهدف إلى تسريع سير عمل المطورين مع منحهم مرونة كاملة في اختبار ونشر النماذج، وضمان الأمان والتحكم الكامل لفريق البنية التحتية. من خلال منصتنا، نمكّن فرق تعلم الآلة من نشر ومراقبة النماذج في 15 دقيقة بموثوقية 100% وقابلية للتوسع، والقدرة على التراجع في ثوانٍ - مما يسمح لهم بتوفير التكاليف وإطلاق النماذج إلى الإنتاج بشكل أسرع، وتحقيق قيمة تجارية حقيقية.
TrueFoundry AI Gateway delivers ~3–4 ms latency, handles 350+ RPS on 1 vCPU, scales horizontally with ease, and is production-ready, while LiteLLM suffers from high latency, struggles beyond moderate RPS, lacks built-in scaling, and is best for light or prototype workloads.
The fastest way to build, govern and scale your AI


















.png)
.webp)










.webp)






