ما هو تنسيق الوكلاء المتعددين؟ دليل عملي لفرق المؤسسات
.webp)
Built for Speed: ~10ms Latency, Even Under Load
Blazingly fast way to build, track and deploy your models!
- Handles 350+ RPS on just 1 vCPU — no tuning needed
- Production-ready with full enterprise support
وكيل ذكاء اصطناعي واحد يجيب على الأسئلة هو أداة. أما خمسة وكلاء يقومون بالبحث واتخاذ القرارات وصياغة المسودات والمراجعة والعمل على أنظمة المؤسسات الحية، فهو نوع مختلف من أنظمة الذكاء الاصطناعي. ويحمل متطلبات حوكمة مختلفة بمجرد تشغيله في أنظمة الإنتاج.
تنسيق الوكلاء المتعددين هو الطبقة التي تحدد ما إذا كانت الحالة الثانية تظل مفيدة. فبدونه، فإن نفس التنسيق الذي ينتج عنه الفائدة يؤدي أيضًا إلى أخطاء متراكمة، ومسارات تدقيق غير واضحة، وفواتير استدلال لا يمكن لأحد إعادة بنائها لاحقًا.
يغطي هذا الدليل معنى تنسيق الوكلاء المتعددين، وكيفية عمل وقت التشغيل، والأطر التي تختارها الفرق في عام 2026، وما تتركه تلك الأطر للمشغلين للتعامل معه. ويختتم بكيفية إدارة TrueFoundry لطبقة الحوكمة التي تتطلبها الأنظمة المنسقة.
ما هو تنسيق الوكلاء المتعددين؟
تنسيق الوكلاء المتعددين هو ممارسة تنسيق وكلاء ذكاء اصطناعي متعددين نحو هدف مشترك. يمتلك كل وكيل فردي دورًا محددًا أو قدرة أو مهمة فرعية داخل سير عمل أكبر.
يختلف هذا النمط عن الذكاء الاصطناعي أحادي الوكيل بعدة طرق. يتم تقسيم العمل بين وكلاء متخصصين بدلاً من توجيهه عبر وكيل ذكاء اصطناعي واحد يتعامل مع كل شيء بالتسلسل. يمرر الوكلاء المستقلون النتائج لبعضهم البعض، ويسلمون المهام الفرعية، ويجمعون المخرجات مع تقدم سير العمل. تختار طبقة التنسيق التي تعلو الوكلاء الفرديين من يعمل ومتى، وما هو السياق الذي يتلقونه، وما الذي يمكنهم الوصول إليه، وكيف يتصرف النظام بأكمله عند الفشل.
يمثل هذا تحولًا جوهريًا في كيفية هيكلة الذكاء الاصطناعي للمؤسسات. تفسح الأداة الواحدة ذات القدرات العامة المجال لأنظمة وكيلة منسقة ذات أدوار متخصصة وهيكل واضح لتحقيق أهداف أوسع.
كيف يعمل تنسيق الوكلاء المتعددين؟
يساعد فهم الآليات الفرق على تصميم حلول للفشل قبل حدوثه. تحدد أربعة سلوكيات لوقت التشغيل كيفية عمل نظام تنسيق الوكلاء المتعددين المصمم جيدًا بالفعل.
يتلقى وكيل التنسيق الهدف عالي المستوى ويحلله إلى مهام فرعية
يقرأ وكيل التنسيق الهدف الرئيسي. يقسم الهدف إلى مهام فرعية منفصلة مناسبة للوكلاء المتخصصين. تقع مسؤولية إدارة التسلسل والتبعيات عبر تلك المهام على عاتق المنسق المركزي.
تعود المخرجات عبر نفس وكيل التنسيق. يتم تقييم مخرجات كل وكيل متخصص. يقرر وكيل التنسيق ما إذا كانت الخطوة قد نجحت أم تحتاج إلى محاولة أخرى. يحكم متى تم تحقيق الهدف بشكل كافٍ لإيقاف الحلقة وإنتاج المخرج النهائي.
الوكلاء الفرعيون المتخصصون ينفذون المهام الفرعية المخصصة باستخدام أدواتهم وصلاحياتهم المحددة
يعمل الوكيل الفرعي ضمن دور محدد. يقتصر الوصول على الأدوات الخارجية ومصادر البيانات وقدرات النموذج المحددة التي تتطلبها وظيفته. يحافظ التحديد الضيق للنطاق على قابلية إدارة الأنظمة الوكيلة عندما يحدث خطأ لا مفر منه.
تتدفق النتائج مرة أخرى إلى وكيل التنسيق، الذي يدمج تلك المخرجات في السياق للخطوات اللاحقة. تمنح حلقة التغذية الراجعة المستمرة للمعلومات هذه عبر سير العمل الأنظمة المنسقة ميزتها على وكيل ذكاء اصطناعي واحد يتعامل مع كل شيء بالتسلسل.
يتم الحفاظ على السياق والحالة عبر سلسلة التنفيذ الكاملة متعددة الخطوات
الحالة التي تستمر عبر الخطوات تفصل سير العمل المعقد المنسق عن استدعاءات الوكيل الفردي المتسلسلة. تغذي المخرجات السابقة القرارات اللاحقة. لا يحتاج المستخدم إلى إعادة توفير السياق في كل مرحلة. هذه الاستمرارية هي أحد الأسباب الرئيسية لبناء الذكاء الاصطناعي الوكيلي بهذه الطريقة.
يجلب الاستمرار نمط فشل جديدًا في المقابل. حقيقة خاطئة مكتوبة في الحالة في الخطوة الثانية يمكن أن تفسد كل خطوة لاحقة. هذا النمط يجعل تصحيح أخطاء فشل تنسيق الوكلاء المتعددين أصعب بكثير من تصحيح أخطاء فشل وكيل ذكاء اصطناعي واحد، وهذا هو السبب في أن معالجة الأخطاء المحددة مهمة منذ اليوم الأول.
تحدد معالجة الأخطاء ومنطق إعادة المحاولة ومسارات التصعيد موثوقية الإنتاج
تتطلب أنظمة الإنتاج سلوكًا محددًا لحالات الفشل التي لا يستمتع أحد بالتفكير فيها أثناء بناء النماذج الأولية. يفشل وكيل. يتجاوز وكيل فرعي المهلة. يعيد وكيل فرعي مخرجات مشوهة. يجب تحديد سياسات إعادة المحاولة ومسارات التدخل اليدوي مسبقًا.
بدون معالجة صريحة للأخطاء في طبقة التنسيق، يحدث أمران. نقطة فشل واحدة في وكيل فرعي واحد تعطل النظام بأكمله. أو يتقدم وكيل التنسيق بمعلومات غير كاملة وينتج مخرجات تبدو معقولة ولكنها خاطئة بطرق لا يكتشفها أحد إلا لاحقًا.
.webp)
أطر عمل تنسيق الوكلاء المتعددين في عام 2026
تتوفر العديد من أطر العمل لبناء أنظمة تنسيق الوكلاء المتعددين. يحل كل منها مشكلة تنسيق الأوركسترا بطريقة مختلفة. يعتمد اختيار الإطار المناسب لاحتياجات عملك على التعقيد وخبرة الفريق ومتطلبات موثوقية أنظمة الإنتاج.
LangGraph
تتخذ سير العمل في LangGraph شكل رسوم بيانية موجهة. تظل العقد والحواف الشرطية وكل انتقال تحت تحكم المطور الصريح. يأتي تصحيح الأخطاء عبر الزمن عبر خطوات الوكيل مدمجًا. وهذا يهم في أنظمة الإنتاج أكثر مما يبدو عليه الأمر أثناء العرض التوضيحي.
الأكثر ملاءمة: سير عمل معقدة تتضمن تفرعات شرطية، ونقاط تفتيش تتطلب تدخلًا بشريًا، واحتياجات تحمل الأخطاء التي تتطلب مسارات تنفيذ يمكن التنبؤ بها ومراجعتها.
إطار عمل وكيل مايكروسوفت (Microsoft Agent Framework)
عرض مايكروسوفت الرئيسي للوكلاء المتعددين هو الآن إطار عمل وكيل مايكروسوفت (Microsoft Agent Framework)، الذي صدر في معاينة عامة في 1 أكتوبر 2025. تم دمج منتجين في منتج واحد: AutoGen لأنماط تنسيق الوكلاء المتعددين، وSemantic Kernel لاهتمامات الذكاء الاصطناعي للمؤسسات مثل القياس عن بعد وتكامل Azure.
دخلت كلتا الأطر السابقة وضع الصيانة أثناء عملية الدمج. يتركز كل التطوير المستقبلي على المنصة الموحدة. أنماط تنسيق الوكلاء المتعددين التي كانت AutoGen رائدة فيها، بما في ذلك الدردشة الجماعية والمناقشة والتفكير، تعمل الآن على أساس Semantic Kernel المؤسسي.
AG2 منفصل. مشروع AG2 هو تفرع مجتمعي من AutoGen 0.2 الأصلي، ويتم صيانته خارج مايكروسوفت بواسطة بعض المبدعين الأصليين للإطار. AG2 ليس إطار عمل وكيل مايكروسوفت على الرغم من الخلط المتكرر في الوثائق القديمة.
CrewAI
طاقم من الوكلاء الذين يلعبون أدوارًا هو التجريد المركزي في CrewAI. يحمل كل وكيل ذكاء اصطناعي دورًا وهدفًا ومجموعة أدوات محددة. تتوافق استعارة الطاقم مع كيفية تفكير قادة الأعمال بالفعل في المهام المعقدة وتصميم سير العمل لدعم عملائهم وسير عمل خدمة العملاء.
تظهر القيود عند التوسع. يصبح حل النزاعات الدقيق أكثر صعوبة في سيناريوهات التفرع المعقدة. غالبًا ما تنتقل الفرق ذات أنظمة الإنتاج الصارمة ومتطلبات الموثوقية وإدارة الحالة إلى LangGraph بمجرد أن يصبح النموذج الأولي بحاجة إلى العمل باستمرار.
مجموعة تطوير وكيل جوجل (Google Agent Development Kit)
أشجار الوكلاء الهرمية هي النموذج في Google ADK. يقوم منسق مركزي بالتفويض إلى وكلاء فرعيين، والذين قد يكون لديهم بدورهم وكلاء فرعيون. يتيح الدعم الأصلي لبروتوكول A2A اتصال وكلاء الذكاء الاصطناعي عبر الأطر، وهو أمر مهم للفرق التي تبني على وكلاء جدد من مزودي الذكاء الاصطناعي التوليدي عبر أطر عمل متعددة.
.webp)
ما الذي تتركه أطر عمل تنسيق الوكلاء المتعددين دون حل لفرق المؤسسات؟
تحل أطر عمل التنسيق مشكلة التنسيق. لكنها لا تحل مشاكل الحوكمة أو التكلفة أو قابلية التدقيق التي تنشأ عندما ينتقل الذكاء الاصطناعي الوكيلي من النماذج الأولية إلى أنظمة المؤسسات التي تعمل على بيانات العملاء الحساسة لاستفسارات العملاء وسير عمل سجل العملاء.
لا يفرض أي من أطر عمل التنسيق أي من الوكلاء المستقلين أو المستخدمين يمكنه الوصول إلى أي أدوات خارجية أو نماذج لغوية كبيرة أو بيانات. يتم تفويض سياسات الأمان إلى رمز التطبيق الفردي. يتوسع هذا الرمز بشكل غير متسق عبر الفرق ويتغير بمرور الوقت، مما يخلق فجوات تتفاقم مع زيادة عدد الوكلاء.
تتراكم تكاليف الرموز بسرعة. سير عمل بخمسة وكلاء، يؤدي إلى ثلاث استدعاءات نموذجية لكل وكيل ذكاء اصطناعي في كل خطوة، يولد 15 استدعاء استدلاليًا أو أكثر لكل طلب دعم عملاء. لا يوجد سقف تكلفة أصلي على مستوى الإطار يوقف حلقة التغذية الراجعة الجامحة قبل أن تظهر في الفاتورة.
مسارات التدقيق التي تنتجها أطر التنسيق هي سجلات تنفيذ، وليست أدلة امتثال. يتطلب إنتاج دليل على ما وصل إليه كل وكيل فردي، ومتى، وبأي سلطة، إضافة بنية تحتية خارجية للتسجيل فوق ما يصدره الإطار. هذه فجوة في الميزة التنافسية: المنظمات التي تتعامل مع الحوكمة كأولوية قصوى تنجز أعمالها بشكل أسرع من تلك التي تتعامل معها كأمر ثانوي.
يظهر الارتباط بالإطار على مستوى مزود النموذج. غالبًا ما يعني تبديل نماذج اللغة الكبيرة عبر أدوار وكلاء الذكاء الاصطناعي إعادة هيكلة على مستوى الإطار بدلاً من مجرد تغيير في التكوين. وهذا يقيد استراتيجيات السحابة المتعددة والموردين المتعددين التي ترغب معظم فرق الذكاء الاصطناعي في الشركات في متابعتها من خلال بروتوكول سياق النموذج والقدرات الجديدة من المزودين.
كيف تدير TrueFoundry تنسيق الوكلاء المتعددين من طبقة البوابة؟
إن TrueFoundry بوابة الوكيل (Agent Gateway) تقع فوق أي إطار لتنسيق الوكلاء المتعددين. وهي تتحكم فيما يمكن للأنظمة المنسقة فعله، وما يمكنها الوصول إليه، وما تكلفته تشغيلها، دون تغيير منطق طبقة التنسيق نفسها.
- تغطية مستقلة عن الإطار لـ LangGraph وCrewAI وMicrosoft Agent Framework والتطبيقات المخصصة. يمر كل استدعاء نموذج واستدعاء أدوات خارجية يقوم به أي وكيل ذكاء اصطناعي عبر البوابة. تُطبق سياسات الأمان وحدود التكلفة ومسارات التدقيق بشكل موحد بغض النظر عن الإطار الذي بنى وكيل الذكاء الاصطناعي. إن بوابة الذكاء الاصطناعي الخاصة بـ TrueFoundry للذكاء الاصطناعي تتعامل أيضًا مع توجيه نماذج اللغة الكبيرة (LLM) وتجاوز الفشل عبر نماذج ومزودي اللغة الكبيرة.
- حقن الهوية لكل وكيل ولكل سير عمل. OAuth 2.0 يحدد حقن الهوية نطاق كل إجراء وكيل مستقل وفقًا لأذونات المستخدم الطالب. وهذا يسد فجوة التنسيق متعدد الوكلاء المفرط في الامتيازات، حيث يرث الوكيل الفرعي وصولاً أوسع من المستخدم الذي بدأ سير العمل، مما يعالج مباشرة حدود الثقة بين تعليمات اللغة الطبيعية والإجراءات.
- قواطع دوائر الوكيل وتطبيق الميزانية على مستوى سير العمل. تُطبق ميزانيات الرموز واكتشاف الحلقات على مستوى سير العمل المعقدة. يتم اكتشاف عمليات التنفيذ المتعددة الخطوات الجامحة قبل أن تتراكم تكاليف غير محدودة. وهذا يحمي سير عمل خدمة العملاء والدعم الفني وسلاسل التوريد من تكاليف المهام المتكررة الجامحة.
- بوابة MCP للوصول المُنظم إلى الأدوات عبر جميع سير العمل المنسقة. يمر كل استدعاء أداة لبروتوكول سياق النموذج يقوم به أي وكيل ذكاء اصطناعي عبر بوابة MCP. تظل سياسات الأمان ومسارات التدقيق الخاصة بكل أداة مرتبطة بهوية المستخدم الذي يقوم بالاستدعاء وتساهم في التحسين المستمر لسياسات الوصول بمرور الوقت.
- سجلات تدقيق جاهزة للامتثال محفوظة داخل شبكة VPC الخاصة بالعميل. يتم تسجيل كل إجراء لوكيل الذكاء الاصطناعي، والتفويض، واستدعاء الأداة، وخطوة تنسيق الوكلاء المتعددين ببيانات وصفية منظمة داخل حدود السحابة الخاصة بالعميل. تلبي النتيجة متطلبات SOC 2 و HIPAA والمتطلبات التنظيمية لأنظمة الإنتاج التي تتعامل مع البيانات الحساسة من سير عمل احتياجات الأعمال.
لاستعراض كيفية تعامل البوابة مع الهوية المستقلة عن الأطر، وتوجيه أدوات MCP، وضوابط التكلفة على مستوى سير العمل داخل شبكة VPC الخاصة بك لأعباء عمل تنسيق الوكلاء المتعددين.

TrueFoundry AI Gateway delivers ~3–4 ms latency, handles 350+ RPS on 1 vCPU, scales horizontally with ease, and is production-ready, while LiteLLM suffers from high latency, struggles beyond moderate RPS, lacks built-in scaling, and is best for light or prototype workloads.
The fastest way to build, govern and scale your AI

















.png)
.webp)










.webp)






