تطلق تروفاوندري TrueFailover لإعادة توجيه حركة مرور الذكاء الاصطناعي للمؤسسات تلقائيًا أثناء تعطل النماذج

Built for Speed: ~10ms Latency, Even Under Load
Blazingly fast way to build, track and deploy your models!
- Handles 350+ RPS on just 1 vCPU — no tuning needed
- Production-ready with full enterprise support
عندما تعطلت OpenAI في ديسمبر، واجه أحد عملاء TrueFoundry أزمة لا علاقة لها بالروبوتات الدردشة أو توليد المحتوى. تستخدم الشركة نماذج لغوية كبيرة للمساعدة في إعادة صرف الوصفات الطبية. كل ثانية من التوقف عن العمل كانت تعني آلاف الدولارات من الإيرادات المفقودة — ومرضى لم يتمكنوا من الحصول على أدويتهم في الوقت المحدد.
أعلنت TrueFoundry، وهي شركة بنية تحتية للذكاء الاصطناعي للمؤسسات، يوم الأربعاء عن منتج جديد يسمى TrueFailover مصمم لمنع هذا السيناريو بالضبط. يكتشف النظام تلقائيًا عندما يواجه مقدمو خدمات الذكاء الاصطناعي انقطاعات أو تباطؤًا أو تدهورًا في الجودة، ثم يعيد توجيه حركة المرور بسلاسة إلى نماذج ومناطق احتياطية قبل أن يلاحظ المستخدمون أي خطأ.
"التحدي هو أنه في عالم الذكاء الاصطناعي، لم يعد تجاوز الفشل بهذه البساطة،" قال نيكونج باجاج، الشريك المؤسس والرئيس التنفيذي لشركة TrueFoundry، في مقابلة حصرية مع VentureBeat. "عندما تنتقل من نموذج إلى آخر، يجب عليك أيضًا مراعاة أشياء مثل جودة المخرجات، وزمن الاستجابة، وما إذا كان الموجه يعمل بنفس الطريقة. في كثير من الحالات، يحتاج الموجه إلى التعديل في الوقت الفعلي لمنع تدهور النتائج. وهذا ليس شيئًا معظم الفرق مستعدة لإدارته يدويًا."
يأتي هذا الإعلان في لحظة محورية لاعتماد الذكاء الاصطناعي في المؤسسات. لقد تجاوزت الشركات مرحلة التجريب بكثير. يشغل الذكاء الاصطناعي الآن عمليات إعادة صرف الوصفات الطبية في الصيدليات، ويولد مقترحات المبيعات، ويساعد مطوري البرمجيات، ويتعامل مع استفسارات دعم العملاء. وعندما تفشل هذه الأنظمة، تنتشر العواقب في جميع أنحاء المؤسسات بأكملها.
لماذا تظل أنظمة الذكاء الاصطناعي للمؤسسات تعتمد بشكل خطير على مزودين فرديين
أصبحت النماذج اللغوية الكبيرة من OpenAI وAnthropic وGoogle ومقدمي الخدمات الآخرين بنية تحتية أساسية لآلاف الشركات. ولكن على عكس الخدمات السحابية التقليدية من Amazon Web Services أو Microsoft Azure — التي تقدم ضمانات قوية لوقت التشغيل مدعومة بعقود من الخبرة التشغيلية — يدير مقدمو خدمات الذكاء الاصطناعي أنظمة معقدة وتستهلك الكثير من الموارد وتظل عرضة للفشل غير المتوقع.
"يعاني مقدمو نماذج اللغة الكبيرة الرئيسيون من انقطاعات أو تباطؤ أو ارتفاعات في زمن الاستجابة كل بضعة أسابيع أو أشهر، ونرى بانتظام التأثيرات اللاحقة على الشركات التي تعتمد على مزود واحد،" قال باجاج لـ VentureBeat.
يوضح انقطاع OpenAI في ديسمبر الذي أثر على عميل صيدلية TrueFoundry مدى خطورة الموقف. أوضح باجاج: "على نطاقهم، حتى ثوانٍ قليلة من التوقف يمكن أن تترجم إلى آلاف الدولارات من الإيرادات المفقودة". "بالإضافة إلى التأثير الاقتصادي، هناك أيضًا عواقب بشرية عندما لا يتمكن المرضى من الحصول على الوصفات الطبية في الوقت المحدد. ولأن هذا العميل كان لديه حل تجاوز الفشل الخاص بنا، فقد تمكنوا من إعادة توجيه الطلبات إلى مزود نموذج آخر في غضون دقائق من اكتشاف الانقطاع. بدون هذا الإعداد، كان من المرجح أن يستغرق التعافي ساعات."
لا تقتصر المشكلة على الانقطاعات الكاملة. فالفشل الجزئي — حيث يتباطأ النموذج أو ينتج استجابات ذات جودة أقل دون أن يتوقف عن العمل تمامًا — يمكن أن يدمر تجربة المستخدم بهدوء وينتهك اتفاقيات مستوى الخدمة. غالبًا ما تكون هذه السيناريوهات "البطيئة ولكن العاملة تقنيًا" أكثر ضررًا من الأعطال الدرامية لأنها تتجنب أنظمة المراقبة التقليدية بينما تؤدي إلى تآكل الأداء بشكل مطرد.
نظرة داخل التكنولوجيا التي تحافظ على تطبيقات الذكاء الاصطناعي متصلة بالإنترنت عند فشل المزودين
يعمل TrueFailover كطبقة مرونة فوق بوابة الذكاء الاصطناعي الخاصة بـ TrueFoundry، والتي تعالج بالفعل أكثر من 10 مليارات طلب شهريًا لشركات Fortune 1000. يجمع النظام بين العديد من القدرات المترابطة في شبكة أمان موحدة للذكاء الاصطناعي للمؤسسات.
في جوهره، يتيح المنتج تجاوز الفشل متعدد النماذج من خلال السماح للمؤسسات بتحديد نماذج أساسية واحتياطية عبر المزودين. إذا أصبح OpenAI غير متاح، تنتقل حركة المرور تلقائيًا إلى Anthropic أو Google Gemini أو Mistral أو البدائل المستضافة ذاتيًا. يحدث التوجيه بشفافية، دون الحاجة إلى فرق التطبيقات لإعادة كتابة التعليمات البرمجية أو التدخل يدويًا.
يمتد هذا النظام حمايته عبر الحدود الجغرافية من خلال مرونة متعددة المناطق ومتعددة السحابات. من خلال توزيع نقاط نهاية الذكاء الاصطناعي عبر المناطق ومقدمي الخدمات السحابية، يمكن للتوجيه القائم على الحالة الصحية اكتشاف المشكلات في مناطق محددة وتحويل حركة المرور إلى بدائل صحية. وما كان سيصبح حادثًا عالميًا يتحول إلى تعديل غير مرئي للبنية التحتية لا يدركه المستخدمون أبدًا.
ربما الأهم من ذلك، يستخدم TrueFailover توجيهًا يراعي التدهور يراقب باستمرار زمن الاستجابة ومعدلات الأخطاء وإشارات الجودة. أوضح باجاج: "نحن ننظر إلى مجموعة من الإشارات التي تشير معًا إلى متى يبدأ أداء النموذج في التدهور". "النماذج اللغوية الكبيرة هي موارد مشتركة. يدير المزودون نفس مثيل النموذج عبر العديد من العملاء، لذلك عندما ترتفع الطلبات لمستخدم أو عبء عمل واحد، يمكن أن يؤثر ذلك على جميع المستخدمين الآخرين لهذا النموذج."
يراقب النظام أوقات الاستجابة المتزايدة، ومعدلات الأخطاء المتزايدة، والأنماط التي تشير إلى عدم الاستقرار. قال باجاج: "بشكل فردي، لا تخبر أي من هذه الإشارات القصة كاملة". "ولكن عند جمعها معًا، فإنها تسمح لنا باكتشاف العلامات المبكرة لتباطؤ النموذج أو عدم موثوقيته. وتغذي هذه الإشارات نظامًا مدعومًا بالذكاء الاصطناعي يمكنه تحديد متى وكيف يتم إعادة توجيه حركة المرور قبل أن يواجه المستخدمون انخفاضًا ملحوظًا في الجودة."
يكمل التخزين المؤقت الاستراتيجي الحماية عن طريق حماية المزودين من الارتفاعات المفاجئة في حركة المرور ومنع تتابع حدود المعدل خلال فترات الطلب المرتفع. وهذا يسمح للأنظمة بامتصاص ارتفاعات الطلب وحدود المزود دون انقطاعات جزئية أو مفاجآت في التقييد.
يمثل هذا النهج تحولًا جوهريًا في كيفية تفكير المؤسسات في موثوقية الذكاء الاصطناعي. قال باجاج: "تم تصميم TrueFailover للتعامل مع هذا التعقيد تلقائيًا". "إنه يراقب باستمرار كيفية تصرف النماذج عبر العديد من العملاء وحالات الاستخدام، ويبحث عن علامات التحذير المبكرة مثل ارتفاع زمن الاستجابة، ويتخذ الإجراءات قبل حدوث الأعطال. معظم المؤسسات الفردية لا تملك هذا النوع من الرؤية لأنها لا تستطيع رؤية سوى أنظمتها الخاصة."
التحدي الهندسي لتبديل النماذج دون التضحية بجودة المخرجات
أحد أصعب التحديات في تجاوز فشل الذكاء الاصطناعي يتضمن الحفاظ على جودة مخرجات متسقة عند التبديل بين النماذج. قد ينتج موجه مُحسّن لـ GPT-5 نتائج مختلفة على Claude أو Gemini. تعالج TrueFoundry هذا من خلال عدة آليات توازن بين السرعة والدقة.
أوضح باجاج: "تعتمد بعض الفرق على حقيقة أن النماذج الكبيرة أصبحت جيدة بما يكفي بحيث لا تؤثر الاختلافات الصغيرة في الموجهات بشكل جوهري على المخرجات". "في تلك الحالات، يمكن أن يحدث التبديل من مزود إلى آخر مع بعض التأثير المرئي — وهذا ليس مثاليًا، لكن بعض الفرق تختار القيام بذلك."
تطبق التنفيذات الأكثر تطوراً موجهات خاصة بالمزود لنفس التطبيق. قال باجاج: "عندما ينتقل تدفق البيانات من نموذج إلى آخر، ينتقل الموجه معه". وأضاف: "في هذه الحالة، لا يقتصر تجاوز الفشل على تبديل النماذج فحسب، بل هو التحول إلى إعداد تم اختباره بالفعل."
يقوم TrueFailover بأتمتة هذه العملية. يقوم النظام بتوجيه الطلبات ديناميكيًا وتعديل الموجهات بناءً على النموذج الذي يتعامل مع الاستعلام، مع الحفاظ على الجودة ضمن النطاقات المقبولة دون تدخل يدوي. أكد باجاج أن المفتاح هو أن "تجاوز الفشل مخطط له، وليس رد فعل. يتم تحديد المنطق والموجهات والضوابط الوقائية مسبقًا، ولهذا السبب لا يلاحظ المستخدمون النهائيون عادةً عند حدوث التبديل."
الأهم من ذلك، أن العديد من سيناريوهات تجاوز الفشل لا تتطلب تغيير المزودين على الإطلاق. أشار باجاج إلى أنه "يمكن أن يكون توجيه حركة البيانات من نفس النموذج في منطقة إلى منطقة أخرى، مثل من الساحل الشرقي إلى الساحل الغربي، حيث لا يلزم إجراء تغييرات على الموجهات". توفر هذه المرونة الجغرافية خط دفاع أول قبل أن تصبح عمليات التبديل الأكثر تعقيدًا بين المزودين ضرورية.
كيف يمكن للصناعات الخاضعة للتنظيم استخدام تجاوز الفشل بالذكاء الاصطناعي دون المساس بالامتثال
بالنسبة للمؤسسات في قطاعات الرعاية الصحية والخدمات المالية والقطاعات المنظمة الأخرى، فإن احتمال توجيه حركة بيانات الذكاء الاصطناعي تلقائيًا إلى مزودين مختلفين يثير مخاوف فورية بشأن الامتثال. لا يمكن لبيانات المرضى أن تتدفق ببساطة إلى أي نموذج متاح. تتطلب السجلات المالية ضوابط صارمة على مكان انتقالها. قامت TrueFoundry ببناء ضوابط وقائية واضحة لمعالجة هذه القيود.
قال باجاج: "لن يقوم TrueFailover أبدًا بتوجيه البيانات إلى نموذج أو مزود لم توافق عليه المؤسسة صراحةً". وأضاف: "يتم التحكم في كل شيء من خلال طبقة تكوين إدارية حيث تحدد الفرق ضوابط وقائية واضحة مسبقًا."
تحدد المؤسسات بدقة النماذج المؤهلة لتجاوز الفشل، والمزودين الذين يمكنهم استقبال حركة البيانات، وحتى المناطق أو فئات النماذج المقبولة — مثل المصادر المغلقة مقابل المصادر المفتوحة. بمجرد تفعيل هذه القواعد، يعمل TrueFailover ضمنها فقط.
أكد باجاج: "إذا لم يكن النموذج ضمن القائمة المعتمدة، فإنه ببساطة ليس خيارًا للتوجيه". وأضاف: "لا يوجد سيناريو يتم فيه إرسال حركة البيانات تلقائيًا إلى مكان غير متوقع. الفكرة هي منح الفرق تحكمًا كاملاً في الامتثال وحدود البيانات، مع السماح للنظام بالاستجابة بسرعة عند حدوث خطأ ما. وبهذه الطريقة، تتحسن الموثوقية دون المساس بالمتطلبات الأمنية أو التنظيمية."
يعكس هذا التصميم الدروس المستفادة من عمليات نشر TrueFoundry الحالية للمؤسسات. تستخدم شركة رعاية صحية ضمن قائمة Fortune 50 المنصة بالفعل للتعامل مع أكثر من 500 مليون مكالمة IVR سنويًا من خلال نظام ذكاء اصطناعي وكيل. طلب هذا العميل القدرة على تشغيل أعباء العمل عبر البنية التحتية السحابية والمحلية مع الحفاظ على ضوابط صارمة لإقامة البيانات — وهذا هو بالضبط نوع البيئة الهجينة التي يجب فيها تحديد سياسات تجاوز الفشل بدقة.
أين لا يمكن لتجاوز الفشل التلقائي أن يساعد وما الذي يجب على المؤسسات التخطيط له
تقر TrueFoundry بأن TrueFailover لا يمكنه حل جميع مشاكل الموثوقية. يعمل النظام ضمن الضوابط الوقائية التي تحددها المؤسسات، وتحدد هذه التكوينات مستوى الحماية الممكن.
أوضح باجاج: "إذا سمح فريق بتجاوز الفشل من نموذج كبير وعالي السعة إلى نموذج أصغر بكثير دون تعديل الموجهات أو التوقعات، فلا يمكن لـ TrueFailover ضمان نفس جودة المخرجات". وأضاف: "يمكن للنظام توجيه حركة البيانات، لكنه لا يستطيع جعل نموذج أصغر يتصرف مثل نموذج أكبر دون التكوين المناسب."
تحد قيود البنية التحتية أيضًا من الحماية. إذا كانت المؤسسة تستضيف نماذجها الخاصة وجميعها تعمل على نفس مجموعة وحدات معالجة الرسوميات (GPU)، فلا يمكن لـ TrueFailover المساعدة عند فشل تلك البنية التحتية. قال باجاج: "عندما لا تتوفر بنية تحتية بديلة، لا يوجد شيء يمكن التحول إليه في حالة الفشل".
تظهر مسألة فشل المزودين المتعددين المتزامن أحيانًا في مناقشات مخاطر المؤسسات. يجادل باجاج بأن هذا السيناريو، على الرغم من أنه ممكن نظريًا، نادرًا ما يتطابق مع الواقع. أوضح قائلاً: "في الممارسة العملية، لا يعني "التعطل" عادةً أن مزودًا كاملاً غير متصل بالإنترنت عبر جميع النماذج والمناطق". وأضاف: "ما يحدث في كثير من الأحيان هو تباطؤ أو انقطاع في نموذج أو منطقة معينة بسبب ارتفاع حركة البيانات أو مشاكل في السعة."
عندما يحدث ذلك، يمكن أن يحدث تجاوز الفشل على مستويات متعددة — من البنية التحتية المحلية إلى السحابة، ومن السحابة إلى البنية التحتية المحلية، ومن منطقة إلى أخرى، ومن نموذج إلى آخر، أو حتى ضمن نفس المزود قبل التبديل إلى مزودين آخرين بالكامل. قال باجاج: "هذا وحده يجعل من غير المرجح للغاية أن يفشل كل شيء في وقت واحد". وأضاف: "النقطة الأساسية هي أن الموثوقية مبنية على طبقات من التكرار. كلما زاد عدد المزودين والمناطق والنماذج المضمنة في الضوابط الوقائية، قلت فرصة تعرض المستخدمين لانقطاع كامل."
شركة ناشئة بنت منصتها ضمن عمليات نشر الذكاء الاصطناعي لشركات Fortune 500
رسخت TrueFoundry مكانتها كبنية تحتية لبعض أكبر عمليات نشر الذكاء الاصطناعي في العالم، مما يوفر سياقًا حاسمًا لطموحاتها في تجاوز الفشل. جمعت الشركة 19 مليون دولار في تمويل السلسلة A في فبراير 2025، بقيادة Intel Capital وبمشاركة من Eniac Ventures وPeak XV Partners وJump Capital. انضم أيضًا مستثمرون ملائكيون بمن فيهم غوكول راجارام وموهيت آرون إلى الجولة، ليصل إجمالي التمويل إلى 21 مليون دولار.
تأسست الشركة التي تتخذ من سان فرانسيسكو مقرًا لها في عام 2021 على يد باجاج والمؤسسين المشاركين أبهيشيك شودري وأنوراغ غوتغوتيا، وجميعهم مهندسون سابقون في Meta التقوا كزملاء دراسة في IIT Kharagpur. ركزت TrueFoundry في البداية على تسريع عمليات نشر التعلم الآلي، ثم تحولت لدعم قدرات الذكاء الاصطناعي التوليدي مع انتشار هذه التقنية في عام 2023.
تُظهر قائمة عملاء الشركة تبنيًا على مستوى المؤسسات لا يمكن أن يضاهيه سوى عدد قليل من الشركات الناشئة في مجال البنية التحتية للذكاء الاصطناعي. توظف Nvidia شركة TrueFoundry لبناء أنظمة متعددة الوكلاء تعمل على تحسين استخدام مجموعات وحدات معالجة الرسوميات (GPU) عبر مراكز البيانات في جميع أنحاء العالم — وهي حالة استخدام تترجم فيها حتى التحسينات الصغيرة في الاستخدام إلى تأثير تجاري كبير نظرًا للطلب المتزايد على سعة وحدات معالجة الرسوميات. تقوم Adopt AI بتوجيه أكثر من 15 مليون طلب و40 مليار رمز إدخال عبر بوابة الذكاء الاصطناعي الخاصة بـ TrueFoundry لتشغيل سير عملها الوكيل للمؤسسات.
تقدم شركة الألعاب Games 24x7 نماذج التعلم الآلي لأكثر من 100 مليون مستخدم عبر المنصة بمعدلات تتجاوز 200 طلب في الثانية. قامت منصة التبني الرقمي Whatfix بالانتقال إلى بنية الخدمات المصغرة (microservices) على TrueFoundry، مما أدى إلى تقليل دورة إصدارها بمقدار ستة أضعاف وخفض وقت الاختبار بنسبة 40 بالمائة.
تفيد TrueFoundry حاليًا بأن لديها أكثر من 30 عميلًا مدفوع الأجر حول العالم، وقد أشارت إلى أنها تجاوزت 1.5 مليون دولار من الإيرادات السنوية المتكررة العام الماضي مع مضاعفة قاعدة عملائها أربع مرات. تدير الشركة أكثر من 1000 مجموعة عمل لأعباء عمل التعلم الآلي عبر قاعدة عملائها.
سيتم تقديم TrueFailover كوحدة إضافية على رأس بوابة ومنصة TrueFoundry AI الحالية، مع تسعير يعتمد على نموذج الاستخدام المرتبط بحجم حركة المرور وعدد المستخدمين والنماذج والمزودين والمناطق المعنية. سيتم إطلاق برنامج وصول مبكر للشركاء المصممين في الأسابيع القادمة.
لماذا قد لا تنطبق ضمانات وقت التشغيل السحابية التقليدية أبدًا على مزودي الذكاء الاصطناعي
لطالما طالب مشترو التكنولوجيا في الشركات بضمانات وقت التشغيل من مزودي البنية التحتية. تقدم كل من خدمات أمازون ويب (Amazon Web Services) ومايكروسوفت أزور (Microsoft Azure) وجوجل كلاود (Google Cloud) اتفاقيات مستوى الخدمة مع غرامات مالية في حال الفشل. هل سيواجه مزودو الذكاء الاصطناعي توقعات مماثلة في نهاية المطاف؟
يرى باجاج قيودًا أساسية تجعل اتفاقيات مستوى الخدمة التقليدية صعبة التحقيق في الجيل الحالي من البنية التحتية للذكاء الاصطناعي. أوضح قائلاً: "تعمل معظم نماذج اللغات الكبيرة التأسيسية اليوم كموارد مشتركة، وهذا ما يتيح التسعير القياسي الذي تراه معلنًا للعامة". وأضاف: "يقدم المزودون التزامات أعلى لوقت التشغيل، ولكن هذا يعني عادةً سعة مخصصة أو بنية تحتية محجوزة، وتزداد التكلفة بشكل كبير."
حتى مع الميزانيات الكبيرة، تواجه الشركات حصص استخدام تخلق تعرضًا غير متوقع. قال باجاج: "إذا ارتفعت حركة المرور بما يتجاوز تلك الحدود، يمكن أن تعود الطلبات إلى البنية التحتية المشتركة". وأضاف: "وهذا يجعل من الصعب تحقيق نوع الضمانات الصارمة التي اعتادت عليها الشركات مع مزودي الخدمات السحابية."
تخلق اقتصاديات تشغيل نماذج اللغات الكبيرة حواجز إضافية قد تستمر لسنوات. "لا تزال نماذج اللغات الكبيرة معقدة ومكلفة للغاية للتشغيل. تتطلب بنية تحتية وطاقة هائلة، ولا نتوقع مستقبلًا قريبًا حيث تدير معظم الشركات عدة نسخ نماذج مخصصة بالكامل فقط لضمان وقت التشغيل."
هذا الواقع يدفع الطلب على حلول مثل TrueFailover التي توفر المرونة بغض النظر عما يمكن أن يعد به المزودون الأفراد. قال باجاج: "تدرك الشركات أن الموثوقية لا يمكن أن تأتي من مزود النموذج وحده". وأضاف: "إنها تتطلب طبقات إضافية من الحماية للتعامل مع حقائق كيفية عمل هذه الأنظمة اليوم."
الحسابات الجديدة للشركات التي دمجت الذكاء الاصطناعي في عمليات الأعمال الحيوية
يعكس توقيت إعلان TrueFoundry تحولًا جوهريًا في كيفية استخدام الشركات للذكاء الاصطناعي — وما يمكن أن تخسره عند فشله. ما بدأ كتجربة داخلية تطور إلى تطبيقات موجهة للعملاء حيث تؤثر الانقطاعات بشكل مباشر على الإيرادات والسمعة.
لاحظ باجاج: "لقد جربت العديد من الشركات الذكاء الاصطناعي التوليدي والأنظمة الوكيلة في الماضي، وكانت حالات الاستخدام الإنتاجية موجهة داخليًا إلى حد كبير". وأضاف: "لم يكن هناك تأثير فوري على إيراداتها أو على التصور العام للشركة."
لقد انتهى ذلك العصر. "الآن بعد أن أطلقت هذه الشركات تطبيقات موجهة للجمهور، حيث يمكن أن تتأثر كل من الإيرادات والتصور العام في حال حدوث انقطاع، أصبحت المخاطر أعلى بكثير مما كانت عليه حتى قبل ستة أشهر. لهذا السبب نرى اهتمامًا متزايدًا بهذا الأمر الآن."
بالنسبة للشركات التي دمجت الذكاء الاصطناعي في عمليات الأعمال الحيوية — من إعادة تعبئة الوصفات الطبية إلى دعم العملاء وعمليات المبيعات — تغيرت الحسابات بالكامل. لم يعد السؤال هو أي نموذج يقدم أفضل أداء في المعايير أو أي مزود يقدم الميزات الأكثر جاذبية. السؤال الذي يؤرق قادة التكنولوجيا الآن أبسط بكثير وأكثر إلحاحًا: ماذا يحدث عندما يختفي الذكاء الاصطناعي في أسوأ لحظة ممكنة؟
في مكان ما، يقوم صيدلي بتعبئة وصفة طبية. وكيل دعم عملاء يحل شكوى. فريق مبيعات يعد عرضًا لصفقة ستُبرم غدًا. كلهم يعتمدون على أنظمة الذكاء الاصطناعي التي تعتمد على مزودين، والذين، على الرغم من حجمهم وتطورهم، لا يزالون يتعرضون للانقطاع دون سابق إنذار.
تراهن TrueFoundry على أن الشركات ستدفع بسخاء لضمان ألا تصل لحظات الانقطاع تلك أبدًا إلى الأشخاص الأكثر أهمية — عملائهم.
نشرت في الأصل على فنتشر بيت
عن TrueFoundry:
توفر TrueFoundry بوابة ذكاء اصطناعي على مستوى المؤسسات تتضمن بوابة نماذج اللغات الكبيرة (LLM Gateway)، وبوابة MCP، وبوابة الوكلاء (Agent Gateway)، مما يمكّن الشركات من الاتصال الآمن ومراقبة وإدارة الوصول إلى النماذج والأدوات والضوابط والوكلاء من لوحة تحكم واحدة. تتيح بوابة الذكاء الاصطناعي أعباء عمل وكيلة آمنة وفعالة ومستقبلية من خلال اتصالات موحدة وقابلة للتركيب عبر المزودين.
بالإضافة إلى طبقة البوابة، تمكّن TrueFoundry المؤسسات من نشر وتدريب نماذج اللغات الكبيرة المخصصة على وحدات معالجة الرسوميات (GPUs)، واستضافة خوادم MCP، وتشغيل وكلاء مخصصين — كل ذلك من خلال واجهة Kubernetes الأصلية. وهي تدعم عمليات التثبيت المحلية (on-premise) وVPC لكل من بوابة الذكاء الاصطناعي وبيئات النشر. تضمن TrueFoundry الامتثال على مستوى المؤسسات لمعايير SOC 2 وHIPAA وITAR. بفضل التحجيم التلقائي المدمج والتخزين المؤقت وتحسين الموارد، تمكّن TrueFoundry المؤسسات من بناء ونشر وإدارة أنظمة الذكاء الاصطناعي بشكل آمن وفعال وعلى بنية تحتية آمنة للمستقبل. لمعرفة المزيد، تفضل بزيارة truefoundry.com
TrueFoundry AI Gateway delivers ~3–4 ms latency, handles 350+ RPS on 1 vCPU, scales horizontally with ease, and is production-ready, while LiteLLM suffers from high latency, struggles beyond moderate RPS, lacks built-in scaling, and is best for light or prototype workloads.
The fastest way to build, govern and scale your AI












.jpeg)
.jpeg)











