من الذكاء الاصطناعي التوليدي إلى الذكاء الاصطناعي الوكيل: الحلقة 3 من Tesseract Talks

Built for Speed: ~10ms Latency, Even Under Load
Blazingly fast way to build, track and deploy your models!
- Handles 350+ RPS on just 1 vCPU — no tuning needed
- Production-ready with full enterprise support
يدخل الذكاء الاصطناعي للمؤسسات مرحلة جديدة.
على مدى السنوات القليلة الماضية، قامت المؤسسات بتجارب مكثفة مع الذكاء الاصطناعي التوليدي — اختبار روبوتات الدردشة والمساعدين المشتركين والتطبيقات القائمة على النماذج. ولكن مع تحول الحماس الأولي إلى عمليات نشر واقعية، يبرز تحدٍ مختلف: كيف تنتقل من ميزات الذكاء الاصطناعي المعزولة إلى أنظمة ذكية يمكنها العمل بأمان وموثوقية وعلى نطاق واسع؟
كان هذا السؤال في صميم حلقة حديثة من Tesseract Talks، مع أنوراغ غوتغوتيا، الشريك المؤسس والرئيس التنفيذي لشركة TrueFoundry و راغو سيثورامان، نائب رئيس الهندسة في Automation Anywhere.
معًا استكشفوا التحول من الذكاء الاصطناعي التوليدي إلى الذكاء الاصطناعي الوكيل — وما يتطلبه الأمر حقًا لإنجاح هذا الانتقال داخل المؤسسات الكبيرة
شاهد الحلقة 1: تحويل فوضى الذكاء الاصطناعي إلى تحكم مع نيكوج باجاج
شاهد الحلقة 2: البنية التحتية الخفية التي تدعم الذكاء الاصطناعي للمؤسسات مع أبهيشيك شودهاري
فيما يلي بعض الأفكار الرئيسية من تلك المحادثة.
التحول الكبير: من النماذج إلى الأنظمة
على مدى السنوات القليلة الماضية، دارت معظم محادثات الذكاء الاصطناعي حول النماذج. قارنت المؤسسات المعايير، وناقشت الموردين، وجربت المطالبات. ولكن كما أشار راغو، الذكاء الاصطناعي الوكيل في المؤسسات يصبح مختلفًا جوهريًا عن عمليات نشر الذكاء الاصطناعي التوليدي السابقة.
كانت تطبيقات الذكاء الاصطناعي التوليدي التقليدية في الأساس "نماذج مغلفة كواجهات برمجة تطبيقات". على النقيض، تتضمن أنظمة الذكاء الاصطناعي الوكيلية العديد من الأجزاء المتحركة — أدوات، وذاكرة، وسير عمل، وتكاملات، وضوابط حماية. النماذج ليست سوى مكون واحد من نظام أكبر بكثير.
هذا يطرح تحديات جديدة تمامًا:
- كيف تدير المطالبات وتصدرها؟
- كيف تمنح الوكلاء إمكانية الوصول إلى الأدوات الداخلية بأمان؟
- كيف تضمن قابلية التوسع والموثوقية؟
- كيف تضع ضوابط حماية حول النماذج الخارجية القوية؟
وفقًا لـ راغو، تطورت المشكلة من اختيار النموذج الصحيح إلى تصميم البنية التحتية الصحيحة.
"ينتقل الذكاء الاصطناعي من نهج النموذج كواجهة برمجة تطبيقات إلى تحدي تصميم نظام،" أوضح. "يجب على الشركات الآن بناء منصات يمكنها تنسيق مكونات متعددة معًا بطريقة آمنة ومحكومة."
لماذا تصبح الحوكمة بالغة الأهمية
بمجرد أن تبدأ أنظمة الذكاء الاصطناعي في اتخاذ الإجراءات — بدلاً من مجرد توليد النصوص — تتوقف الحوكمة عن كونها أمرًا مستحبًا. تصبح ضرورية.
أوضح أنوراج ذلك بمثال ملموس: تخيل شركة سفر تطلق مساعدًا ذكيًا يمكنه حجز الرحلات الجوية نيابة عن المستخدمين.
ما الذي يمكن أن يحدث خطأ؟
الكثير.
- قد يخدع المستخدم النظام لإنشاء محتوى غير لائق
- يمكن للروبوتات أن تغمر النظام بملايين الاستعلامات المكلفة
- قد يتلاعب شخص ما بالوكيل للوصول إلى بيانات مستخدم آخر
- الـ تكلفة الذكاء الاصطناعي التوليدي قد تخرج عن السيطرة دون وجود قيود على الاستخدام.
يمثل كل من هذه تحديًا مختلفًا للحوكمة: السلامة، والتحكم في التكاليف، وإدارة الوصول، وتطبيق الهوية
لهذا السبب يتطلب الذكاء الاصطناعي الوكيلي حوكمة عبر طبقات متعددة:
- حوكمة البيانات – ضمان حماية المعلومات الحساسة
- ضوابط الوصول – التأكد من أن الوكلاء يصلون فقط إلى ما ينبغي لهم الوصول إليه
- تحديد المعدل وضوابط التكلفة
- قابلية التدقيق وتتبع النسب
- المراقبة التشغيلية والضوابط الوقائية
ما وراء المشاريع التجريبية: التحدي الحقيقي للذكاء الاصطناعي في المؤسسات
إذا كان هناك استنتاج واضح واحد من النقاش، فهو هذا:
لم يعد نجاح الذكاء الاصطناعي في المؤسسات يتعلق بالنماذج. بل يتعلق بإدارة دورة الحياة.
بناء عرض توضيحي ذكي أمر سهل. لكن تشغيل الوكلاء الأذكياء بأمان وموثوقية على نطاق المؤسسة هو الجزء الصعب.
مع انتقال المؤسسات إلى ما هو أبعد من إثباتات المفهوم ونحو عمليات النشر الإنتاجية الكاملة، يجب أن يتحول التركيز إلى:
- الحوكمة
- قابلية التوسع
- الأمن
- قابلية المراقبة
- التحكم
في TrueFoundry، هذا هو بالضبط ما نعمل على بنائه. يتطلب تحويل الذكاء الاصطناعي الوكيل إلى واقع مؤسسي أكثر من مجرد نماذج. إنه يتطلب منصة مصممة للتحكم والحوكمة والتوسع.
TrueFoundry AI Gateway delivers ~3–4 ms latency, handles 350+ RPS on 1 vCPU, scales horizontally with ease, and is production-ready, while LiteLLM suffers from high latency, struggles beyond moderate RPS, lacks built-in scaling, and is best for light or prototype workloads.
The fastest way to build, govern and scale your AI

















.png)
.webp)










.webp)






