تحديثات منصة النشر

Built for Speed: ~10ms Latency, Even Under Load
Blazingly fast way to build, track and deploy your models!
- Handles 350+ RPS on just 1 vCPU — no tuning needed
- Production-ready with full enterprise support
لقد عمل فريق Truefoundry بجد كبير خلال الشهر الماضي لإضافة ميزات إلى منصة نشر التعلم الآلي (ML) الخاصة بنا. هدفنا هنا هو بناء منصة نشر تجعل نشر نماذج وخدمات التعلم الآلي سهلاً للغاية، مع تطبيق أفضل مبادئ الهندسة والأمان. لبناء منصة تعلم آلي رائعة، نحتاج إلى منصة هندسية قوية، ولهذا السبب، تركز الكثير من الاهتمام الأولي على توفير منصة قوية لنشر التعليمات البرمجية.

من بين جميع مكونات منصة التعلم الآلي المذكورة أعلاه، نحن نركز على البنية التحتية للخدمة والمراقبة وجميع عمليات الأتمتة المحيطة بذلك.
لقد بذل الكثير من الجهد في بناء منصة النشر الخاصة بنا فوق Kubernetes. كان الهدف هنا هو جعل النشر سهلاً للغاية في أقل من 5 دقائق، حيث تتولى المنصة مهمة بناء الصورة من الكود المصدري، وتخزينها في سجل Docker، ثم نشر التطبيق أخيرًا على Kubernetes. تتضمن بعض التحديثات من الشهر الماضي ما يلي:
إمكانية اختيار عائلة المثيلات أثناء النشر
يمكن أن تختلف نماذج التعلم الآلي بشكل كبير في زمن استجابة الاستدلال أو الأداء بناءً على نوع المثيل. على سبيل المثال، عند اختبار زمن استجابة الاستدلال لنموذج Hugging Face على معالجات Intel مقابل AMD، وجدنا أن معالجات Intel أسرع بنحو 30%. لهذا السبب، لدينا الآن خيار يسمح للمستخدمين باختيار نوع المثيل أثناء نشر أعباء عملهم. إذا لم يتم تحديد نوع المثيل، يمكن نشر عبء العمل على أي نوع مثيل متاح.

السجلات والمقاييس لعمليات النشر
كان لدينا سابقًا رابط Grafana لعرض السجلات والمقاييس. بينما كان Grafana قابلاً للتخصيص بدرجة كبيرة، لم يكن التحكم في الأذونات والوصول ممكنًا حقًا عليه. كما تبين أنه بطيء بعض الشيء ويصعب فهمه للمستخدمين غير المعتادين على Grafana. لهذا السبب، قمنا بتطبيق واجهة المستخدم الخاصة بنا لعرض السجلات والمقاييس، والتي ينبغي أن تكون كافية في معظم الحالات. ما زلنا نقدم تكامل Grafana في السحابة العامة للمستخدمين الأكثر تقدمًا.


التحكم في الأذونات على مجموعات الأسرار
يمكننا الآن إضافة المستخدمين كمحرر أو عارض أو مسؤول على مجموعات الأسرار.

تكامل GitHub و Bitbucket
يمكننا الآن النشر مباشرة إلى Truefoundry من أي مستودعات GitHub أو Bitbucket. يمكن للمستخدمين التكامل مع مستودعاتهم الخاصة باستخدام تدفق OAuth وتحديد المعلمات المناسبة لنشر التطبيق.

في الشهر القادم، نعمل على بعض الميزات المثيرة مثل:
- جعل المنصة أكثر سهولة في الاستخدام وبديهية.
- النشر التلقائي لمكدس Truefoundry على أي مجموعة Kubernetes
- دعم للفرق
- إمكانية التراجع عن النشر
ترقبوا المزيد وأخبرونا بآرائكم!
TrueFoundry AI Gateway delivers ~3–4 ms latency, handles 350+ RPS on 1 vCPU, scales horizontally with ease, and is production-ready, while LiteLLM suffers from high latency, struggles beyond moderate RPS, lacks built-in scaling, and is best for light or prototype workloads.
The fastest way to build, govern and scale your AI





















.png)
.webp)










.webp)






