بناء طبقة البنية التحتية التي كانت تفتقر إليها المؤسسات في مجال الذكاء الاصطناعي.
.png)
Built for Speed: ~10ms Latency, Even Under Load
Blazingly fast way to build, track and deploy your models!
- Handles 350+ RPS on just 1 vCPU — no tuning needed
- Production-ready with full enterprise support
في عام 2022، قبل أن يدخل ChatGPT مفرداتنا الثقافية، كان مؤسسونا نيكوج باجاج، وأبهيشيك، وأنوراغ يعملون بالفعل. لم يكونوا يتفاعلون مع اتجاه أو يلاحقون لحظة، بل يبنون انطلاقًا من قناعة بأن عالم الشركات كان على وشك الوصول إلى نقطة تحول لم يكن مستعدًا لها.
هذه القناعة نبعت من الداخل. قبل تأسيس TrueFoundry، أمضى نيكوج وقتًا في Meta، حيث غيرت تجربة العمل مع بنية تحتية للتعلم الآلي على نطاق واسع بشكل جذري طريقة تفكيره في المشكلة.
"طريقة بناء نماذج التعلم الآلي في Meta تختلف جوهريًا عن كيفية القيام بذلك باستخدام منظومة السحابة العامة في الخارج،" صرح نيكوج في بودكاست Code Story. "تعتبر Meta التعلم الآلي حالة خاصة من هندسة البرمجيات، والذكاء الاصطناعي التوليدي حالة خاصة من التعلم الآلي."
هذا النموذج الذهني – البرمجيات في الأساس، التعلم الآلي في المنتصف، الذكاء الاصطناعي التوليدي في القمة، وكلها تعمل من خلال واجهة موحدة على بنية تحتية مشتركة – ليس هو الأسلوب الذي تعمل به معظم الشركات. تدير معظم المؤسسات مكدسين، وأحيانًا ثلاثة، متوازيين: واحد للبرمجيات، وواحد للتعلم الآلي، والآن بشكل متزايد واحد منفصل للذكاء الاصطناعي التوليدي. والنتيجة هي التجزئة، والتكرار، ونظام ينهار تحت ثقله الخاص مع التوسع.
تأسست TrueFoundry لمعالجة هذه المشكلة تحديدًا.
الرهان الذي استغرق عامًا للبناء
عندما يتحدث الناس عن الحد الأدنى من المنتج القابل للتطبيق (MVPs)، فإنهم عادة ما يقصدون شيئًا بسيطًا – نموذجًا أوليًا سريعًا لاختبار فرضية. لكن نسخة TrueFoundry من ذلك بدت مختلفة تمامًا.
"قضينا أكثر من عام منكبين على تطوير المنصة،" أوضح نيكوج. "كنا نبني البنية التحتية الأساسية التي يمكن للشركات من خلالها البدء في بناء تطبيقات التعلم الآلي والذكاء الاصطناعي التوليدي الخاصة بها والبدء في إطلاقها للإنتاج."
كان الرهان التقني في صميم ذلك العمل هو Kubernetes. اعتقد الفريق أنه تمامًا كما تجمعت أعباء عمل البرمجيات على Kubernetes للتنسيق، فإن أعباء عمل التعلم الآلي ستحذو حذوها. في ذلك الوقت، كانت Kubeflow الأداة المهيمنة التي تساعد المؤسسات على تشغيل التعلم الآلي على Kubernetes، لكن مساهماتها كانت تتراجع مع تحويل Google استثماراتها نحو Vertex. رأى فريق TrueFoundry هذه الفجوة وتحرك نحوها عمدًا، ببناء مكدس التعلم الآلي والذكاء الاصطناعي التوليدي بالكامل ليعمل بشكل أصلي على Kubernetes. منحهم هذا القرار شيئًا لا يقدر بثمن: بنية تحتية يمكن تشغيلها في أي مكان – AWS، GCP، Azure، أو في الموقع – دون أن تكون مقيدة بمزود سحابة واحد.
كانت بداية صبورة ومبدئية. وقد أرست الأساس لكل ما تلاها.
التكيف مع عالم لا يتوقف عن التغير
من أكثر الأمور اللافتة للنظر في رحلة منتج TrueFoundry هو مدى استمرارية تغير العالم من حولهم ومدى تعمدهم للتكيف.
في عام 2022، أصبحت نماذج اللغة الكبيرة مفيدة حقًا للمرة الأولى. في عام 2023، اكتشفت الشركات أن الاستجابات المفيدة تتطلب ترسيخًا في بياناتها الخاصة، وأصبح RAG (التوليد المعزز بالاسترجاع) النموذج السائد. بحلول عام 2024، أصبحت الوكلاء حقيقة واقعة، وبدأت المؤسسات تفكر بجدية في دمج الذكاء الاصطناعي في سير عمل الإنتاج. في عام 2025، ظهر بروتوكول سياق النموذج (MCP) والتواصل بين الوكلاء كحدود جديدة.
في كل عام، تغير نموذج التشغيل. وكان نهج TrueFoundry هو الحفاظ على البنية الأساسية ثابتة مع تكييف الطبقة التي تعلوها – تجربة المطور، والواجهات، والنسيج الرابط بين المكونات.
"نتكيف مع طريقة العمل،" قال نيكوج. "نحن نبني طبقة تجربة المستخدم حولها، لكننا نعيد كل شيء إلى نفس المبدأ الأساسي الراسخ حول كيفية تشغيل أعباء العمل هذه على نفس البنية التحتية الأساسية."
يعكس المنتج اليوم هذه الفلسفة. تقع بوابة الذكاء الاصطناعي من TrueFoundry في منتصف كل استدعاء API تقوم به المؤسسة لنماذج اللغة الكبيرة (LLMs) والوكلاء الخاصة بها. وهي تشمل بوابة LLM، وبوابة MCP، وبوابة وكيل، وهي مستوى تحكم موحد للمراقبة، والحوكمة، وإدارة التكاليف، والامتثال عبر مكدس الوكلاء بأكمله. إلى جانب ذلك، يتيح منتج AI Deployments للشركات تشغيل نماذج مخصصة، واستضافة خوادم MCP، وتنسيق الوكلاء على حوسبتها الخاصة – كل ذلك من خلال واجهة أصلية لـ Kubernetes.
الخطأ الذي هم على استعداد للحديث عنه
لم يسر كل شيء وفقًا للخطة. في عام 2024، اعتقدت TrueFoundry، مثل معظم الصناعة، أن طبقة وكيل LLM التي كانت الشركات تبنيها داخليًا ستبقى خفيفة. كان المنطق سليمًا في ذلك الوقت: كانت واجهات برمجة تطبيقات النماذج متسقة إلى حد كبير، وكانت الطبقة خفيفة الوزن، وكانت الفرق مرتاحة لبنائها بأنفسها.
"اعتقدنا أن هذه طبقة سيتم بناؤها داخليًا بشكل أكبر،" اعترف نيكوج. "هذا الخطأ جعلنا نخسر بعض التطوير الذي كان بإمكاننا إنجازه في العام ما بين 2024 و 2025."
ما تغير هو التعقيد. بدأت توقيعات واجهات برمجة تطبيقات النماذج في التباعد. ظهرت بروتوكولات جديدة مثل MCP. دخلت التطبيقات الوكيلة حيز الإنتاج، مما يعني أن وقت التشغيل أصبح مهمًا. وما بدأ كطبقة وكيل رقيقة أصبح فجأة بحاجة إلى أن يصبح لوحة تحكم على مستوى المؤسسة مع ضوابط وقائية وقواعد امتثال وتتبع للتكاليف ومراقبة مركزية عبر كل وكيل في المؤسسة.
عندما رأت TrueFoundry هذا التحول يحدث، تحركت بسرعة. في غضون ستة أشهر، أعادت بناء وتوسيع بوابة الذكاء الاصطناعي الخاصة بها لتصبح واحدة من أكثر المنتجات قدرة في السوق. اليوم، تعمل البوابة عبر 17 منطقة عالميًا، وتحقق وقت تشغيل يتجاوز أربع تسعات، وتضيف زمن استجابة أقل من خمسة أجزاء من الألف من الثانية، وتتعامل مع عشرات الآلاف من الطلبات في الثانية لتطبيقات المؤسسات الحيوية للإنتاج.
حولت سرعة الاستجابة فرصة ضائعة إلى مكانة رائدة في السوق.
الفريق وراء كل هذا
اسأل نيكوج عما يفتخر به أكثر في TrueFoundry، ولن يذكر مقاييس المنتج أو قائمة العملاء. سيتحدث عن الفريق.
بدأت الشركة بثلاثة مؤسسين شاركوا طفولتهم معًا: نيكوج، أنوراج، وأبهيشيك، الذين منحت خلفياتهم المتكاملة في التعلم الآلي والبنية التحتية والاستراتيجية الشركة الشكل الصحيح منذ اليوم الأول. قاد أبهيشيك منظمة البنية التحتية للفيديو في Meta. استخدم أنوراج التعلم الآلي لبناء استراتيجيات تداول في WorldQuant وقاد التوسعات الجغرافية للشركة. معًا، جلبوا العمق التقني والنطاق التشغيلي الذي تتطلبه بناء البنية التحتية للمؤسسات.
الآن، ومع اقتراب عدد موظفيها من 90 إلى 100 شخص، لا تزال TrueFoundry تطلب من كل موظف جديد إجراء مقابلة مع أحد المؤسسين. لم تتغير المعايير: المهارات الفنية، نعم، ولكن الأهم من ذلك، التوافق الحقيقي مع الرسالة ونوع عقلية الملكية التي تنجح بها الشركات الناشئة.
قال نيكوج: "نعتقد أن هذه هي أعلى قيمة يمكن للمؤسس أن يخلقها في الشركة."
إلى أين يتجه كل هذا
التحدي القريب المدى الذي يراه نيكوج للصناعة هو الانتقال من مئات وكلاء الذكاء الاصطناعي الصغيرة ومنخفضة المخاطر، وأدوات الإنتاجية الشخصية، والتجارب الوظيفية، إلى وكلاء يقعون في المسار الحرج لعمليات الأعمال الحقيقية. يتطلب هذا الانتقال مستوى من التحكم والموثوقية والحوكمة لم تبنه معظم المؤسسات بعد.
طموح TrueFoundry على المدى الطويل أكبر. التشبيه الذي يستخدمه نيكوج هو Databricks أو Snowflake - شركات تطلق العنان للقيمة عن طريق مركزة بيانات المؤسسة. تريد TrueFoundry أن تفعل الشيء نفسه للحوسبة. منصة واحدة حيث يتم تطوير الوكلاء ونشرهم وتنسيقهم. لوحة تحكم مركزية لجميع عمليات الحوسبة التي تمر عبر أنظمة الذكاء الاصطناعي للمؤسسة.
إنها رؤية كبيرة. لكنها رؤية تم تحديدها بوضوح في عام 2022 ولم تزداد إلا أهمية منذ ذلك الحين.
استمع إلى المحادثة الكاملة مع نيكوج باجاج في بودكاست Code Story، الموسم 12، الحلقة 16، المتاح على Spotify و Apple Podcast.
TrueFoundry AI Gateway delivers ~3–4 ms latency, handles 350+ RPS on 1 vCPU, scales horizontally with ease, and is production-ready, while LiteLLM suffers from high latency, struggles beyond moderate RPS, lacks built-in scaling, and is best for light or prototype workloads.
The fastest way to build, govern and scale your AI

















.png)
.webp)










.webp)






