True ML Talks #12 - المؤسس المشارك في Llama-Index

By TrueFoundry

Published: July 4, 2026

Built for Speed: ~10ms Latency, Even Under Load

Blazingly fast way to build, track and deploy your models!

Handles 350+ RPS on just 1 vCPU — no tuning needed
Production-ready with full enterprise support

Get Started with Truefoundry Now Talk to the Expert

عدنا إليكم بحلقة جديدة من True ML Talks. في هذه الحلقة، نتعمق في Llama-Index، ونتحدث مع Jerry Liu.

جيري ليو هو مؤسس ومؤسس مشارك لـ LlamaIndex. يجلب خبرته في أبحاث وهندسة تعلم الآلة من شركات مرموقة مثل أوبر وكورا وRobust Intelligence. بتركيزه القوي على النماذج التوليدية وشغفه بتطوير تقنيات الذكاء الاصطناعي، قاد جيري تطوير LlamaIndex، وهي أداة مفتوحة المصدر تربط بسلاسة نماذج اللغة بمصادر البيانات الخاصة.

📌

ستتناول محادثاتنا مع جيري الجوانب التالية:
- نشأة Llama-Index
- ميزات LlamaIndex المتنوعة
- نموذج Anthropic 100k Window
- التحديات في نماذج توليد الاستجابات
- مقارنة بين مقاربات الاسترجاع والضبط الدقيق

شاهد الحلقة الكاملة أدناه:

نشأة LlamaIndex: بناء أنظمة تحتفظ بالحالة لنماذج اللغة

أعدت خلفية جيري ليو المتنوعة في تعلم الآلة والذكاء الاصطناعي، بما في ذلك خبراته في أوبر وكورا، لعمله على Llama-Index. وقد جذبه افتتانه بالنماذج التوليدية، الذي أشعله اكتشاف شبكات GANs، إلى عالم نماذج اللغة الكبيرة (LLMs).

إدراكًا للطبيعة عديمة الحالة المتأصلة لنماذج اللغة الكبيرة مثل GPT-3، سعى جيري لدمج بيانات خارجية في هذه النماذج لتزويدها بالسياق. مستوحى من بنية الحاسوب، تصور LlamaIndex كنظام شامل مزود بوحدات ذاكرة وتخزين إضافية. وقد سمح هذا لنموذج اللغة الكبير بتخزين البيانات الخارجية وتصفحها باستخدام بنية شجرية تسمى مؤشر GPT، مما يمكن من الاستدلال على البيانات داخل الشجرة.

لاقى مشروع جيري التصميمي الأولي صدى لدى آخرين يواجهون تحديات مماثلة، مما قاده إلى إدراك الإمكانات الكامنة في حل عملي. تطورت LlamaIndex إلى مجموعة أدوات شاملة، تمكن المستخدمين من الاستفادة من بياناتهم المنظمة وغير المنظمة في تطبيقات نماذج اللغة.

مكّن هذا التحول LlamaIndex من تسهيل آليات استرجاع البيانات وتقديم طرق بديهية لتعزيز نماذج اللغة الكبيرة (LLMs) بالحالة. من خلال سد الفجوة بين نماذج اللغة والبيانات الخاصة، فتح LlamaIndex آفاقًا جديدة للتطبيقات العملية في التعامل مع البيانات غير المهيكلة والمهيكلة.

تحول LlamaIndex من مجرد فكرة إلى مجموعة أدوات قوية، مما يمكّن المستخدمين من التغلب على تحديات دمج البيانات الخارجية في نماذج اللغة. لقد بسّط عملية الاستفادة من البيانات المخصصة وأحدث ثورة في تطبيقات نماذج اللغة.

إطلاق العنان لتمكين المستخدمين: ميزة LlamaIndex

اكتسب LlamaIndex شعبية كأداة متعددة الاستخدامات، يحظى بتقدير المستخدمين لميزاته المتنوعة. ثلاث ميزات رئيسية يحبها المستخدمون في LlamaIndex هي:

استيعاب البيانات وأدوات التحميل: يبسّط LlamaIndex عملية تحميل البيانات من مصادر مختلفة إلى الأداة. إحدى الميزات البارزة هي Llama Hub، وهو موقع مدعوم من المجتمع يقدم مجموعة واسعة من أدوات تحميل البيانات. تمكّن هذه المحملات المستخدمين من استيراد النصوص غير المهيكلة بسهولة من تنسيقات ملفات متنوعة مثل ملفات PDF وPowerPoint وجداول Excel، والبيانات من منصات مثل Salesforce وNotion وSlack. من خلال الاستفادة من مساهمات المجتمع، يمكّن LlamaIndex المستخدمين من تسخير قدرات تقنيات تحليل النصوص وتحليل المستندات، مما يعزز مرونة الأداة وإمكانية الوصول إليها.
سهولة البدء: يقدّر المستخدمون الطبيعة المباشرة لواجهة برمجة تطبيقات LlamaIndex (API). ببضعة أسطر من التعليمات البرمجية فقط، يمكن للمستخدمين تحميل البيانات وفهرستها والاستعلام عنها، مما يفتح قيمة الأداة بسرعة. تجذب هذه البساطة المستخدمين ذوي الكفاءة التقنية والمستخدمين ذوي الخبرة التقنية المحدودة على حد سواء. إن القدرة على التفاعل بسهولة مع بياناتهم والوصول إلى الميزات القوية تمكّن المستخدمين من استخلاص رؤى قيمة دون الحاجة إلى خبرة تقنية كبيرة.
قدرات الاسترجاع المتقدمة: يقدم LlamaIndex وظائف استرجاع متقدمة، تلبي احتياجات المستخدمين الذين يتطلبون ميزات متطورة لحالات استخدام محددة. تتيح هذه القدرات للمستخدمين طرح أسئلة معقدة، ومقارنة المستندات، وإجراء استدلال متعدد الخطوات، والتوجيه إلى مصادر بيانات مختلفة. يقدّر المستخدمون الذين يبحثون عن قدرات استرجاع أكثر تقدمًا قدرة LlamaIndex على التعامل مع سيناريوهات متنوعة ودعم احتياجاتهم المعقدة لاسترجاع المعلومات.

بفضل مزيج من الميزات سهلة الاستخدام، وخيارات استيعاب البيانات الشاملة، وسهولة الاستخدام، وقدرات الاسترجاع المتقدمة، اكتسب LlamaIndex قاعدة مستخدمين مخلصين. تستمر الأداة في التطور، مما يمكّن المستخدمين من الاستفادة من بياناتهم بفعالية واستخلاص رؤى ذات مغزى من مصادر بياناتهم غير المهيكلة والمهيكلة.

نظرة متعمقة في نموذج Anthropic ذي نافذة 100 ألف: رؤى واعتبارات

أثار نموذج Anthropic ذو نافذة 100 ألف حماسًا وكشف عن رؤى رائعة. تكمل نافذة السياق الواسعة هذه الأساليب الحالية مثل LlamaIndex، موسعة بذلك إمكانيات نمذجة اللغة بقدرتها على معالجة ما يصل إلى 100,000 رمز.

تجاوزت تجربة استخدام ملف Uber الطويل SEC 10-K حد الرموز، لكنها أبرزت ميزة النموذج: تضمين كمية هائلة من المعلومات دون الحاجة إلى طرق استرجاع معقدة أو مطالبات انتقائية. أدى إدخال المستند بأكمله في المطالبة إلى نتائج مثيرة للاهتمام.

أظهرت واجهة برمجة التطبيقات (API) ذات 100 ألف رمز سرعة مبهرة مقارنة بالاستعلام عن GPT-3 في أجزاء أصغر. لا تزال الخوارزمية الأساسية وراء هذه التسريعات غير معلنة، مما يثير التكهنات والفضول.

تمكّن نافذة السياق الأكبر نموذج اللغة من فهم البيانات بشكل شمولي، وتوليف العلاقات بين أجزاء النص المتباعدة بشكل جيد. يعد الضبط الدقيق أمرًا بالغ الأهمية لمعالجة الصعوبات العرضية مع التعليمات المعقدة والارتباك، وهو مجال يظهر فيه GPT-4 تحسنًا.

بينما فوائد نموذج نافذة 100 ألف واضحة، تظهر اعتبارات عملية. قد يكون ملء النافذة بأنواع معينة من الأسئلة مكلفًا من الناحية الحسابية، مما يؤدي إلى زيادة تكاليف الاستعلام. يصبح تقييم الجدوى الاقتصادية أمرًا بالغ الأهمية، حيث تتراوح تكلفة كل استعلام تقريبًا بين 1 دولار و2 دولار، اعتمادًا على حالة الاستخدام.

على الرغم من القيود والآثار المترتبة على التكلفة، يعطي الباحثون والمطورون الأولوية للاستكشاف المستمر لنموذج Anthropic ذي نافذة 100 ألف. ستدفع الرؤى القيمة المكتسبة من هذه التجارب التقدم المستقبلي في هذا المجال.

معالجة التحديات في نماذج توليف الاستجابات

يعد توليف الاستجابات جانبًا حاسمًا في سياق النموذج السحابي، ويهدف إلى معالجة التحديات المرتبطة بالتعامل مع نوافذ السياق الكبيرة التي تتجاوز حد المطالبة. يتضمن ذلك تطوير استراتيجيات لتبسيط عملية توليد استجابات دقيقة وشاملة. واثنتان من هذه الاستراتيجيات هما الإنشاء والتحسين و تلخيص الشجرة.

الإنشاء والتحسين

تتضمن طريقة الإنشاء والتحسين تقسيم السياق إلى أجزاء قابلة للإدارة. على سبيل المثال، عند التعامل مع وثيقة SEC الخاصة بشركة أوبر، سيتم تقسيمها إلى جزأين، كل جزء يتكون من 90,000 رمز. يتم إدخال الجزء الأول في المطالبة المدخلة، جنبًا إلى جنب مع السؤال، للحصول على استجابة أولية. ثم يتم تحسين هذه الاستجابة من خلال مطالبة محسّنة تتضمن الإجابة الحالية والسياق الإضافي والسؤال. تستمر هذه العملية التكرارية لتجميع إجابة شاملة لجميع السياقات.

بينما تُعد طريقة الإنشاء والتحسين فعالة، تميل المطالبة المحسّنة إلى إرباك النموذج. فتعقيدها، مع وجود مكونات متعددة يجب أخذها في الاعتبار، يعيق قدرات الاستدلال.

تلخيص الشجرة

تقدم طريقة تلخيص الشجرة نهجًا بديلاً أظهر أداءً محسّنًا. في هذه الاستراتيجية، يتم معالجة كل جزء من السياق بشكل مستقل لتوليد إجابات فردية. يتم دمج هذه الإجابات بشكل هرمي، لتشكيل بنية شبيهة بالشجرة، حتى يتم اشتقاق إجابة نهائية عند العقدة الجذرية، بناءً على السؤال. من خلال تبسيط المطالبة والاستفادة من الدمج الهرمي للإجابات، تحقق طريقة تلخيص الشجرة نتائج أفضل مقارنة بنهج المطالبة المحسّنة.

لا يزال السبب الدقيق وراء الفعالية المحسّنة لتلخيص الشجرة غير مفهوم تمامًا. ومع ذلك، يمكن أن يُعزى ذلك، جزئيًا على الأقل، إلى بساطة المطالبة المستخدمة في هذه الاستراتيجية. سيساهم الاستكشاف والتحسين المستمر لاستراتيجيات تجميع الاستجابات هذه في تحقيق مزيد من التقدم في توليد استجابات دقيقة وشاملة ضمن إطار نموذج السحابة.

📌

تحديات عملية في تحليل السياق:
عند تحليل السياق بشكل تكراري ضمن استراتيجيات تجميع الاستجابات، تنشأ تحديات معينة. تقدم هذه الاستراتيجيات حلولاً فعالة لاستيعاب السياق الموسع ضمن نافذة المطالبة، ولكنها تأتي مع قيود ومقايضات.

نهج الإنشاء والتحسين، الذي يهدف إلى ضغط المعلومات، يلاحظ ملاحظة مثيرة للاهتمام. بمرور الوقت، يميل النموذج إلى تجميع التفاصيل، مما يؤدي إلى إجابات أطول بغض النظر عن دقتها أو مدى صلتها. قد يشكل هذا التراكم عيبًا لطريقة الإنشاء والتحسين.

في المقابل، يقوم نهج تلخيص الشجرة بتلخيص السياق بشكل هرمي، عن طريق دمج استجابات الأجزاء الفردية. ومع ذلك، فإن عملية التلخيص هذه تضحي بالتفاصيل الدقيقة. يعد تحقيق التوازن بين التلخيص والحفاظ على المعلومات الدقيقة أمرًا بالغ الأهمية عند استخدام تلخيص الشجرة.

الاسترجاع مقابل الضبط الدقيق: تحليل مقارن

يعد الاختيار بين نهجي الاسترجاع والضبط الدقيق للتعامل مع البيانات موضوعًا يستحق الاستكشاف. التوليد المعزز بالاسترجاع، المستخدم عادة في أنظمة مثل LlamaIndex، يتضمن إدخال أجزاء السياق في نموذج لغوي مدرب مسبقًا، مما يوفر سهولة الاستخدام ولا يتطلب تدريب النموذج.

الضبط الدقيق هو نهج آخر ذو إمكانات كبيرة. من خلال الاستفادة من النماذج المدربة مسبقًا على بيانات واسعة النطاق، يمكّن الضبط الدقيق من أداء مهام مثل نقل الأسلوب، وتوليد الشعر، والعمل كمصدر للمعرفة. ومع ذلك، قد تشكل واجهات برمجة تطبيقات الضبط الدقيق الحالية من الشركات الكبرى تحديات من حيث التكلفة والصيانة وسهولة الاستخدام.

التقدمات الحديثة، مثل LoRA، وتوفر النماذج مفتوحة المصدر الأصغر حجمًا، توفر سبلًا أكثر سهولة للضبط الدقيق على بيانات المستخدم. يشير هذا إلى أنه في المستقبل، قد يوفر الضبط الدقيق مقايضة أفضل بين التكلفة والفائدة مقارنة بالاعتماد فقط على الأنظمة المعززة بالاسترجاع.

من المتوقع أن يسود نهج هجين يجمع بين الاسترجاع والضبط الدقيق في المستقبل. يتضمن هذا النهج نموذج تعلم مستمر يمكنه الرجوع إلى مصادر المعلومات الخارجية حسب الحاجة، مما يسمح بدمج المعرفة الداخلية والخارجية.

مع استمرار التطورات وتحسن إمكانية الوصول، من المتوقع أن يشكل مزيج من أساليب الاسترجاع والضبط الدقيق مستقبل العمل مع البيانات ضمن إطار نموذج السحابة.

اقرأ مدوناتنا السابقة ضمن سلسلة True ML Talks:

‍

True ML Talks #11 - LLMs, LLMops and Generative AI

Deep dive into LLMs, LLMops, Generative AI and ChatGPT. We talk with Micheal, CTO at GreenHouse about the trends in the Machne Learning Space.

TrueFoundry Blog TrueFoundry

استمر في مشاهدة TrueML سلسلة يوتيوب وقراءة TrueML سلسلة المدونات.

TrueFoundry هي منصة PaaS لنشر تعلم الآلة (ML) فوق Kubernetes لتسريع سير عمل المطورين مع منحهم مرونة كاملة في اختبار ونشر النماذج، مع ضمان الأمان والتحكم الكامل لفريق البنية التحتية. من خلال منصتنا، نمكّن فرق تعلم الآلة من نشر ومراقبة النماذج في 15 دقيقة بموثوقية 100% وقابلية للتوسع والقدرة على التراجع في ثوانٍ - مما يسمح لهم بتوفير التكلفة وإطلاق النماذج إلى الإنتاج بشكل أسرع، مما يحقق قيمة تجارية حقيقية.

Discuss About your ML Pipeline Challenges with us here

TrueFoundry AI Gateway delivers ~3–4 ms latency, handles 350+ RPS on 1 vCPU, scales horizontally with ease, and is production-ready, while LiteLLM suffers from high latency, struggles beyond moderate RPS, lacks built-in scaling, and is best for light or prototype workloads.

Built for Speed: ~10ms Latency, Even Under Load

Schedule your Demo Now