تتبع نماذج اللغة الكبيرة (LLM) الشامل: Pydantic Logfire وبوابة الذكاء الاصطناعي TrueFoundry

Built for Speed: ~10ms Latency, Even Under Load
Blazingly fast way to build, track and deploy your models!
- Handles 350+ RPS on just 1 vCPU — no tuning needed
- Production-ready with full enterprise support
قوة بوابة TrueFoundry للذكاء الاصطناعي
بوابة TrueFoundry للذكاء الاصطناعي هي طبقة تنفيذ موحدة للبنية التحتية لنموذج اللغة الكبير (LLM). تتولى المصادقة، والتوجيه عبر المزودين، وتحديد المعدل، وتطبيق السياسات، وإدارة استدعاء أدوات MCP، والأهم لهذه التكامل — التتبع المتوافق مع OpenTelemetry. كل طلب يمر عبر البوابة يولد نطاقًا يحمل معايير gen_ai.* سمات (اسم النموذج، عدد الرموز، سبب الانتهاء) جنبًا إلى جنب مع السمات الخاصة بـ TrueFoundry مثل tfy.input، tfy.output، و tfy.span_type. يتم نشر هذه النطاقات بشكل غير متزامن إلى قائمة انتظار رسائل NATS بعد اكتمال الطلب، مما يعني أن مسار التصدير لا يعيق أبدًا طلبًا قيد التنفيذ. تقرأ خدمة تصدير OTEL مخصصة من قائمة الانتظار هذه وتعيد توجيه النطاقات إلى أي نقطة نهاية OTLP مهيأة عبر HTTP أو gRPC.
Pydantic Logfire: قابلية المراقبة المصممة للذكاء الاصطناعي
Pydantic Logfire هي منصة مراقبة بناها الفريق الذي يقف وراء Pydantic — طبقة التحقق المضمنة في حزمة تطوير برامج OpenAI، وحزمة تطوير برامج Anthropic، ومعظم أطر عمل الذكاء الاصطناعي المستخدمة في الإنتاج اليوم. يستوعب Logfire بيانات OTLP القياسية ويطبق عليها عرضًا أصليًا للذكاء الاصطناعي: عندما يكتشف gen_ai.* سمات على نطاق، فإن LLM Panel تنشط تلقائيًا، وتظهر سجل المحادثة الكامل، ووسائط استدعاء الأداة، وعدد الرموز لكل طلب، والتكاليف المحسوبة — دون الحاجة إلى أي تكامل لحزمة تطوير البرامج (SDK) من جانب الإرسال. تُكتب استعلامات Logfire بلغة SQL المتوافقة مع PostgreSQL، لذا يمكن الوصول إلى آثار الإنتاج للبشر ولعملاء البرمجة على حد سواء. وهي متاحة كخدمة سحابية مُدارة بنقاط نهاية إقليمية في الولايات المتحدة والاتحاد الأوروبي.
مسار عمل واحد، رؤية كاملة: Logfire و TrueFoundry
يتصل التكامل عند نقطة واحدة: OTEL Config، والذي يقبل نقطة نهاية OTLP HTTP ورأس تخويل. انتقل إلى AI Gateway ← Controls ← Settings ← OTEL Config وانقر على زر التعديل لفتح لوحة التكوين.

قسم OTEL Config في TrueFoundry — نقطة نهاية التتبع موجهة إلى عنوان URL لاستيعاب Logfire في الاتحاد الأوروبي مع تعيين رأس التخويل (Authorization).
عيّن نقطة النهاية إلى عنوان URL الإقليمي لاستيعاب Logfire، واختر HTTP مع ترميز البروتوكول (proto encoding)، وأضف رمز الكتابة الخاص بـ Logfire كـ تخويل قيمة الرأس. يغطي رمز الكتابة نفسه كلاً من مصدّري التتبع والمقاييس.

نموذج Traces Exporter مملوء — نقطة النهاية مضبوطة على https://logfire-eu.pydantic.dev/v1/traces، ترميز Proto، ورمز الكتابة الخاص بـ Logfire في رأس التخويل.
لا يلزم إجراء أي تغييرات على التعليمات البرمجية في التطبيقات التي ترسل الطلبات عبر البوابة. تعمل مسار التتبع بالكامل على مستوى البنية التحتية. أي طلب من أي فريق، باستخدام أي نموذج، عبر أي مزود، يولد امتدادًا (span) يتدفق إلى Logfire حاملاً السياق الكامل لما حدث عند البوابة.
كيف يعمل التتبع في الوقت الفعلي
عند وصول طلب إلى البوابة، يكون التسلسل كالتالي:
- المصادقة والتوجيه: تتحقق البوابة من رمز JWT الخاص بالمتصل، وتحدد النموذج المستهدف عبر قواعد التوجيه (حسب الأولوية أو الوزن أو زمن الاستجابة)، وتعيد توجيه الطلب إلى مزود LLM المحدد.
- تدفق الاستجابة: تتدفق استجابة المزود مرة أخرى إلى العميل. تسجل البوابة محتوى الطلب والاستجابة، وعدد الرموز، وزمن الاستجابة كسمات امتداد (span attributes) بما في ذلك الحقول القياسية gen_ai.* .
- نشر الامتداد غير المتزامن: بعد اكتمال الاستجابة، تنشر البوابة امتداد OTel إلى NATS. هذا غير معيق — العميل لديه استجابته بالفعل.
- تصدير OTEL: يقوم مُصدِّر OTEL بالقراءة من NATS ويسلم الامتداد إلى نقطة نهاية الاستيعاب الخاصة بـ Logfire عبر OTLP HTTP مع ترميز البروتو، مصادق عليه عبر رمز الكتابة.
- عرض Logfire: يستقبل Logfire الامتداد ويكتشف gen_ai.* السمات. الـ لوحة LLM تنشط، وتعرض المحادثة، واستخدام الرموز، وحساب التكلفة، وأي استدعاءات لأدوات MCP حدثت ضمن نفس التتبع.
بمجرد التكوين، تبدأ الامتدادات من tfy-llm-gateway بالظهور في عرض Logfire المباشر في الوقت الفعلي. الـ tfy.span_type السمة تميز ChatCompletion، AgentResponse، و MCPGateway الامتدادات — مما يتيح للفرق التصفية حسب نوع العملية أو الاستعلام عنها في SQL.

يعرض عرض Logfire المباشر نطاقات tfy-llm-gateway — تظهر عمليات AgentResponse و ChatCompletion و MCPGateway بتوقيت كامل وحالة ونطاقات فرعية متداخلة.
بالإضافة إلى التتبعات الفردية، يعرض مصدر المقاييس بيانات الاستخدام الإجمالية عبر الموفرين والنماذج والفرق. تجمع نظرة عامة على استخدام Logfire هذه البيانات حسب النطاق واسم النطاق، مما يمنح قادة المنصة صورة شاملة عن وجهة حركة المرور وحجمها.

نظرة عامة على استخدام Logfire — مقاييس من tfy-llm-gateway مقسمة حسب نطاق الأجهزة، تُظهر حركة مرور ChatCompletion و MCPGateway عبر الموفرين.
ابدأ باستخدام التتبع الجاهز للإنتاج
ابدأ بإنشاء رمز كتابة في Logfire. انتقل إلى مشروعك، وافتح إعدادات المشروع ← رموز الكتابة، وانقر على رمز كتابة جديد. انسخ الرمز فورًا — لا يعرض Logfire القيمة الكاملة مرة أخرى.

صفحة رموز الكتابة في Logfire — أنشئ رمزًا مخصصًا لـ TrueFoundry وقم بتخزينه بأمان قبل إغلاق مربع الحوار.
ثم انتقل إلى بوابة الذكاء الاصطناعي ← عناصر التحكم ← الإعدادات ← تهيئة OTEL في TrueFoundry وقم بتهيئة مصدري التتبعات والمقاييس باستخدام نقطة نهاية Logfire الإقليمية ورمز الكتابة. يتوفر المرجع الكامل لنقطة النهاية ودليل التهيئة في وثائق TrueFoundry. يقدم Logfire طبقة مجانية دائمة، مع خيار مؤسسي مستضاف ذاتيًا للفرق التي لديها متطلبات إقامة البيانات.
الرؤية الجديرة بالاستفادة من هذا التكامل هي معمارية: لم يحتج TrueFoundry و Logfire أبدًا إلى التنسيق مباشرة. تصدر البوابة نطاقات OpenTelemetry قياسية مع سمات gen_ai.*؛ يقرأ Logfire نفس المعيار وينشط عروضه المتوافقة مع LLM تلقائيًا. OpenTelemetry هو العقد بينهما — تتحكم البوابة في التنفيذ وتولد القياس عن بعد، ويسجل Logfire السلوك ويصوره، ويربطهما المعيار دون أن يعتمد أي نظام على التفاصيل الداخلية للآخر.
TrueFoundry AI Gateway delivers ~3–4 ms latency, handles 350+ RPS on 1 vCPU, scales horizontally with ease, and is production-ready, while LiteLLM suffers from high latency, struggles beyond moderate RPS, lacks built-in scaling, and is best for light or prototype workloads.
The fastest way to build, govern and scale your AI

















.png)
.webp)










.webp)






