أفيفا كريديتو هي شركة إقراض مقرها المكسيك تركز على توسيع فرص الحصول على الائتمان. للوصول إلى العملاء الذين تجد البنوك التقليدية وشركات التكنولوجيا المالية عبر الإنترنت صعوبة في خدمتهم، تدير أفيفا أكشاكًا مادية صغيرة مدعومة بتجربة إعداد عملاء مؤتمتة تعتمد على الأجهزة اللوحية أولاً - مما يبني الثقة ويقلل من مخاطر الاحتيال.
مع نمو مبادرات الذكاء الاصطناعي لدى أفيفا من نماذج رؤية الكمبيوتر إلى روبوتات الدردشة الجاهزة للإنتاج وسير عمل التحقق من المستندات، واجه الفريق تحديين متكررين: (1) نشر وتشغيل خدمات نماذج اللغة الكبيرة (LLM) دون الحاجة إلى خبرة عميقة في Kubernetes، و (2) إدارة العديد من مزودي نماذج اللغة الكبيرة (LLM) مع مراقبة متسقة وتكلفة محكمة ومرونة.
من خلال استخدام TrueFoundry’s Deployment و AI Gateway، مكنت أفيفا كل مهندس تعلم آلة/ذكاء اصطناعي من إطلاق خدمات إنتاج بشكل مستقل، مع إمكانية المراقبة عبر مزودي نماذج Azure و GCP، وأنشأت أساسًا قابلاً للتطوير للسلامة وسير العمل القائم على الوكلاء.
.webp)
مهمة أفيفا هي زيادة فرص الحصول على الائتمان للمجتمعات المحرومة في المكسيك. يجمع نموذج أفيفا بين التواجد المادي، عبر أكشاك صغيرة يعمل بها موظف واحد، مع الحفاظ على أتمتة العملية بالكامل من خلال الأجهزة اللوحية لتقديم أفضل ما في العالمين: ثقة عالية واحتيال أقل، مع سرعة الأتمتة.
جاءت نقطة التحول الرئيسية الأولى لأفيفا من حاجة عملية: نشر نموذج LLM للتعرف على بطاقات الهوية INE المكسيكية. تمكن فريق تعلم الآلة من ضبط/بناء النموذج، لكن نشره بشكل موثوق تطلب مسارًا تشغيليًا لم يكن لديهم بعد. تراوحت المحاولات المبكرة بين عمليات النشر اليدوية القائمة على الأجهزة الافتراضية (بطيئة وعرضة للأخطاء) إلى الخدمات المدارة التي إما افتقرت إلى دعم وحدات معالجة الرسوميات (GPU) أو فشلت في التسليم بسرعة.
غيرت تجربة النشر من TrueFoundry ذلك: كشفت السجلات الواضحة وsidecars المراقبة عن السبب الجذري وراء فشل حاوية، مما سمح للفريق بإصلاح الصورة والنشر بنجاح في أقل من ساعة.
.png)

.webp)
.png)
من خلال مركزية جميع حركة مرور نماذج اللغة الكبيرة (LLM) عبر بوابة الذكاء الاصطناعي من TrueFoundry، اكتسبت أفيفا رؤية وتحكمًا شاملين عبر مكدس ذكاء اصطناعي متعدد السحابات يتوسع بسرعة. على مدار 90 يومًا، أدار الفريق ما يقرب من نصف مليون طلب إنتاجي وأكثر من 1.8 مليار رمز إدخال بتكلفة يمكن التنبؤ بها، وموثوقية قابلة للقياس، وسرعة هندسية محسنة بشكل كبير. أتاحت البوابة الكشف السريع عن حالات الشذوذ في التكلفة وزمن الاستجابة، والتوجيه على مستوى النموذج والتحويل التلقائي دون تغييرات في التطبيق، وتجريدًا مشتركًا سمح للمهندسين بنشر وترقية وتشغيل الخدمات المدعومة بنماذج اللغة الكبيرة بشكل مستقل.
.avif)
موثوق به من قبل أكثر من 10 شركات من قائمة فورتشن 500