What is an MCP Gateway?

An MCP Gateway is a centralized control plane that securely manages access, discovery, and orchestration of MCP Servers across an enterprise. It acts as the operational backbone for agentic AI systems by enabling AI agents and applications to interface with enterprise tools via a standardized protocol. With support for authentication, RBAC, observability, and workflow execution, the MCP Gateway makes connecting and scaling intelligent systems seamless and secure.

What is an MCP Server and how does it work with the MCP Gateway?

An MCP Server (Model Context Protocol Server) is a standardized interface layer that wraps around enterprise APIs or tools, making them easily discoverable and callable by AI agents. When integrated with an MCP Gateway, each MCP Server registers itself, becomes accessible through a unified endpoint, and inherits enterprise-grade features like RBAC, federated authentication (via Okta, Azure AD), and observability—making orchestration across tools like Slack, Jira, or internal APIs effortless.

How do I build and deploy an MCP Server?

You can build an MCP Server using TrueFoundry’s SDK or your preferred backend stack. MCP Servers are containerized and typically deployed on Kubernetes or cloud-native infrastructure. Once live, they register with the MCP Gateway and are made available for secure discovery and task execution via agents or users—streamlining the AI integration pipeline.

What are the key features of an MCP Gateway?

The MCP Gateway provides unified access to all registered MCP Servers, instant discovery via a central registry, and secure access control with OAuth 2.0 and federated identity providers. It enables agentic task execution across tools, offers enterprise-grade observability with request-level tracing and audit logs, supports out-of-the-box and custom integrations (e.g., Slack, Datadog, internal APIs), and ensures high-performance operation across cloud, on-prem, and hybrid environments.

What are the benefits of using an MCP Gateway in enterprise environments?

There are various benefits of using an MCP Gateway in enterprise environments. It dramatically simplifies tool integrations, accelerates onboarding via prebuilt MCP Servers, and unifies security and compliance controls. It enables plug-and-play agentic workflows, supports distributed environments, and provides deep observability for cost and performance. The result is a scalable, secure, and maintainable AI system capable of handling real-time enterprise workloads with minimal engineering effort.

How does the MCP Gateway handle authorization and access control?

Authorization is enforced through Role-Based Access Control (RBAC) policies integrated with enterprise Identity Providers such as Okta or Azure AD. Each MCP Server, endpoint, or tool function can be governed by specific access rules, ensuring only authorized users or agents can trigger actions or retrieve sensitive data.

Can I use my existing SSO or IdP with the MCP Gateway?

Yes, the MCP Gateway and all MCP Servers fully support existing enterprise identity providers. Federated login via Okta, Azure AD, or custom SSO setups is supported out-of-the-box, enabling seamless integration into your organization's existing authentication and compliance stack.

What enterprise tools can I connect using MCP Servers?

You can integrate both standard and proprietary tools. MCP Gateway offers prebuilt MCP Servers for platforms like Slack, Confluence, Datadog, and Sentry. Additionally, you can create custom MCP Servers to connect any internal service, REST API, or data platform—extending orchestration across your unique tech stack.

How does MCP Gateway enable agentic task execution?

Through the MCP Gateway, AI agents can autonomously discover, authenticate, and call MCP Servers. This enables them to execute multi-step workflows (e.g., “create a Jira ticket from Slack messages”), generate and run code, or orchestrate tools—all governed by standardized interactions and enterprise policies.

What kind of observability does the MCP Gateway offer?

The MCP Gateway provides full visibility into every interaction with MCP Servers. It supports end-to-end tracing, metadata tagging (e.g., team, user, tool), and audit logging for compliance. Enterprises can monitor latency, usage, errors, and cost attribution in real-time—ensuring traceability and control across AI workloads.

Is the MCP Gateway secure and scalable for enterprise deployment?

Absolutely. The MCP Gateway is designed for production-grade deployments. It supports federated SSO, OAuth 2.0, dynamic discovery, multi-region failover, and role-based security—all while operating at high throughput under real-time enterprise load. It’s built to power large-scale, AI-first systems with confidence.

تعلن TrueFoundry عن استحواذها على Seldon AI، موسعة بذلك لوحة التحكم الخاصة بها للذكاء الاصطناعي للمؤسسات. البيان الصحفي الكامل →

جاهز للمؤسسات : شبكة VPC | البيئات المحلية | معزولة هوائيًا

عمليات نشر موحدة للذكاء الاصطناعي للنماذج، والوكلاء، وخدمات الذكاء الاصطناعي

نشر وتوسيع وتشغيل نماذج اللغة الكبيرة (LLMs)، والوكلاء، وخوادم MCP، وسير العمل، والمهام، ونماذج التعلم الآلي (ML) عبر السحابة، وشبكة VPC، والبيئات المحلية (on-prem) من لوحة تحكم واحدة.

تحدث إلى خبير

احجز عرضًا توضيحيًا

نماذج اللغة الكبيرة (LLMs)

نشر وتقديم نماذج اللغة الكبيرة (LLMs) مفتوحة المصدر أو الاحتكارية مع تسريع وحدات معالجة الرسوميات (GPU) وموثوقية على مستوى الإنتاج.

الوكلاء

تشغيل وكلاء الذكاء الاصطناعي طويلة الأمد مع الذاكرة وتنفيذ الأدوات وتكامل سلس مع بوابة الذكاء الاصطناعي (AI Gateway) وخوادم MCP.

خوادم MCP

نشر خوادم MCP لكشف الأدوات وواجهات برمجة التطبيقات (APIs) وأنظمة المؤسسات بأمان لوكلاء الذكاء الاصطناعي.

سير العمل

تنسيق سير عمل الذكاء الاصطناعي متعدد الخطوات عبر النماذج والوكلاء والخدمات من لوحة تحكم واحدة.

المهام

تشغيل المهام الدفعية وأعباء عمل التدريب والمهام المجدولة للذكاء الاصطناعي عند الطلب.

نماذج التعلم الآلي التقليدية

نشر وتقديم نماذج التعلم الآلي التقليدية جنبًا إلى جنب مع نماذج اللغة الكبيرة (LLMs) باستخدام نفس المنصة.

Purple gradient square with white background, shiny surface, and rounded corners in rhombus shape.

نشر أي عبء عمل للذكاء الاصطناعي

نشر كل أعباء عمل الذكاء الاصطناعي عبر طبقة نشر واحدة ومتسقة.

نشر نماذج اللغة الكبيرة (LLMs) وأعباء عمل الاستدلال المعتمدة على وحدات معالجة الرسوميات (GPU) باستخدام أطر عمل مثل vLLM، Triton، KServe، أو الحاويات المخصصة.
نشر وكلاء الذكاء الاصطناعي وخدمات الوكلاء بوقت تشغيل وشبكة متسقين
نشر خوادم MCP لكشف الأدوات والأنظمة الداخلية بشكل آمن
تشغيل المهام الدفعية وواجهات برمجة التطبيقات وخدمات الذكاء الاصطناعي طويلة الأمد على نفس المنصة

اقرأ المزيد

التوسع التلقائي لأعباء عمل الذكاء الاصطناعي

توسيع نطاق أعباء عمل الذكاء الاصطناعي تلقائيًا بناءً على الطلب الفعلي.

توسيع نطاق نقاط نهاية الاستدلال وخدمات الوكلاء تلقائيًا بناءً على حجم الطلبات
زيادة حجم أعباء عمل وحدات معالجة الرسوميات (GPU) خلال ذروة الطلب وتقليلها عند انخفاض حركة المرور
دعم أعباء العمل المتقطعة مثل الدردشة، RAG، وسير العمل المدفوع بالوكلاء
الحفاظ على أداء يمكن التنبؤ به أثناء ذروة حركة المرور

اقرأ المزيد

الإيقاف التلقائي للتحكم في التكاليف

منع البنية التحتية للذكاء الاصطناعي الخاملة من استنزاف الميزانية.

إيقاف تشغيل نقاط النهاية أو الوكلاء أو الخدمات تلقائيًا بعد فترات خمول قابلة للتكوين
تقليل هدر وحدات معالجة الرسوميات (GPU) خلال ساعات الذروة المنخفضة أو التجارب
إعادة تشغيل أعباء العمل عند الطلب دون تدخل يدوي
فرض الانضباط في التكاليف عبر الفرق والبيئات

اقرأ المزيد

تجربة نشر موحدة عبر السحابة/البيئات المحلية

تجربة مطور واحدة عبر AWS وAzure وGCP والبيئات المحلية - لا تتطلب أدوات خاصة بالسحابة.

ربط وإدارة مجموعات AWS وAzure وGCP والمحلية من لوحة تحكم واحدة
انشر نفس عبء العمل في بيئات مختلفة باستخدام سير عمل وواجهات برمجة تطبيقات متطابقة
تجريد التعقيد الخاص بالسحابة مع الاحتفاظ بالتحكم الكامل والعزل
استخدم نفس تجربة النشر عبر بيئات التطوير والتجريب والإنتاج، بغض النظر عن البنية التحتية

اقرأ المزيد

مصمم لتجربة مطور من الدرجة الأولى

قم ببناء ونشر وتصحيح أخطاء أعباء عمل الذكاء الاصطناعي بسرعة وثقة.

سجلات ومقاييس وأحداث متكاملة لكل عملية نشر
مراقبة وتنبيه مدمجان لاكتشاف المشكلات وحلها بسرعة
ميزات نشر جاهزة للإنتاج مثل فحوصات السلامة واستراتيجيات الطرح
إدارة آمنة للأسرار وتكاملات CI/CD سلسة

اقرأ المزيد

يعمل بسلاسة مع بوابة الذكاء الاصطناعي وبوابة الوكيل

النشر هو طبقة التنفيذ؛ والحوكمة تعلوها.

بوابة الذكاء الاصطناعي تتحكم في الوصول إلى النماذج والتوجيه وضوابط التكلفة
تحكم بوابة MCP الوصول إلى الأدوات وتنفيذها
تنسق بوابة الوكيل وتحكم سير عمل الوكيل
تدعم عمليات نشر الذكاء الاصطناعي الموحدة التنفيذ الفعلي والبنية التحتية

اقرأ المزيد

مصمم للذكاء الاصطناعي الواقعي على نطاق واسع

99.99%

وقت التشغيل

يضمن تجاوز الأعطال المركزي والتوجيه وضوابط الحماية بقاء تطبيقات الذكاء الاصطناعي الخاصة بك متصلة بالإنترنت، حتى عندما لا يكون موفرو النماذج كذلك.

10 مليار+

الطلبات المعالجة/الشهر

استدلال قابل للتوسع وعالي الإنتاجية للذكاء الاصطناعي في بيئات الإنتاج.

30%

تحسين متوسط التكلفة

يقلل التوجيه الذكي والتجميع وضوابط الميزانية من هدر الرموز.

جاهز للمؤسسات

انشر بوابة ذكاء اصطناعي آمنة تحافظ على بياناتك ونماذجك ضمن بنيتك التحتية السحابية / المحلية.

HIPAA, GDPR, and AICPA SOC compliance badges for data security and privacy regulations standards.

الامتثال والأمان
معايير SOC 2 و HIPAA و GDPR لضمان حماية قوية للبيانات
الحوكمة والتحكم في الوصول
تسجيل الدخول الموحد (SSO) + التحكم في الوصول المستند إلى الأدوار (RBAC) وتسجيل التدقيق
دعم وموثوقية للمؤسسات
دعم على مدار الساعة طوال أيام الأسبوع مع اتفاقيات مستوى خدمة للاستجابة مدعومة بضمانات

انشر TrueFoundry في أي بيئة

VPC، محليًا، معزولة هوائيًا، أو عبر سحابات متعددة.

لا تغادر أي بيانات نطاقك. تمتع بالسيادة الكاملة والعزل والامتثال على مستوى المؤسسات أينما يعمل TrueFoundry.

ابدأ الآن

نتائج حقيقية في TrueFoundry

لماذا تختار الشركات TrueFoundry

3 أضعاف

وقت أسرع لتحقيق القيمة باستخدام وكلاء LLM المستقلين

80%

استخدام أعلى لمجموعات وحدات معالجة الرسوميات (GPU) بعد التحسين التلقائي للوكلاء

آرون إريكسون

مؤسس، مختبر الذكاء الاصطناعي التطبيقي

حوّلت TrueFoundry أسطول وحدات معالجة الرسوميات (GPU) لدينا إلى محرك مستقل ذاتي التحسين، مما أدى إلى زيادة الاستخدام بنسبة 80% ووفر علينا ملايين الدولارات من الحوسبة الخاملة.

5 أضعاف

وقت أسرع لإدخال منصة الذكاء الاصطناعي/تعلم الآلة الداخلية حيز الإنتاج

50%

انخفاض الإنفاق السحابي بعد ترحيل أعباء العمل إلى TrueFoundry

براتيك أغراوال

مدير أول، علوم البيانات وابتكار الذكاء الاصطناعي

ساعدتنا TrueFoundry على الانتقال من مرحلة التجريب إلى الإنتاج في وقت قياسي. ما كان سيستغرق أكثر من عام أُنجز في غضون أشهر - مع تبني أفضل من قبل المطورين.

80%

خفض الوقت اللازم لإنتاج النماذج

35%

وفورات في تكاليف السحابة مقارنة بإعداد SageMaker السابق

Vibhas Gejji

مهندس تعلم آلة (ML) أول

قللنا عبء DevOps وبسطنا عمليات طرح الإنتاج عبر الفرق. سرّعت TrueFoundry تسليم تعلم الآلة ببنية تحتية تتوسع من التجارب إلى الخدمات القوية.

50%

نشر أسرع لحزمة RAG/الوكيل

60%

انخفاض في النفقات العامة للصيانة لخطوط أنابيب RAG/الوكيل

Indroneel G.

قائد العمليات الذكية

ساعدتنا TrueFoundry في نشر حزمة RAG كاملة - بما في ذلك خطوط الأنابيب، وقواعد بيانات المتجهات، وواجهات برمجة التطبيقات، وواجهة المستخدم - بسرعة مضاعفة مع تحكم كامل في البنية التحتية المستضافة ذاتيًا.

60%

نشر أسرع للذكاء الاصطناعي

~40-50%

خفض فعال للتكاليف عبر بيئات التطوير

Nilav Ghosh

مدير أول، للذكاء الاصطناعي

باستخدام TrueFoundry، قللنا أوقات النشر بأكثر من النصف وخفضنا النفقات العامة للبنية التحتية من خلال واجهة MLOps موحدة، مما سرّع تقديم القيمة.

<2

أسابيع لترحيل جميع نماذج الإنتاج

75%

تقليل وقت تنسيق علوم البيانات، وتسريع تحديثات النماذج وإطلاق الميزات

راجات بانسال

المدير التقني

لقد وفرنا الكثير في تكاليف البنية التحتية وقللنا وقت تنسيق علوم البيانات بنسبة 75%. عززت TrueFoundry سرعة نشر نماذجنا عبر الفرق.

الأسئلة الشائعة

ما أنواع أعباء عمل الذكاء الاصطناعي التي يمكنني نشرها باستخدام عمليات نشر الذكاء الاصطناعي الموحدة؟

تدعم عمليات نشر الذكاء الاصطناعي الموحدة مجموعة واسعة من أعباء عمل الذكاء الاصطناعي، بما في ذلك خدمات استدلال نماذج اللغة الكبيرة (LLM) المدعومة بوحدات معالجة الرسوميات (GPU)، ووكلاء الذكاء الاصطناعي طويلة الأمد، وخوادم MCP، والمهام المجمعة والمجدولة، وسير العمل، ونماذج التعلم الآلي التقليدية. يتم نشر جميع أنواع أعباء العمل وإدارتها باستخدام نفس المنصة الأساسية، مما يسمح للفرق بتوحيد كيفية بناء أنظمة الذكاء الاصطناعي وتوسيع نطاقها وتشغيلها عبر البيئات المختلفة.

هل تدعم عمليات نشر الذكاء الاصطناعي الموحدة التوسع التلقائي؟

نعم. توفر عمليات نشر الذكاء الاصطناعي الموحدة ميزة التوسع التلقائي المضمنة لخدمات الاستدلال والوكلاء وأعباء عمل الذكاء الاصطناعي الأخرى بناءً على حركة المرور في الوقت الفعلي وحجم الطلبات واستخدام الموارد. وهذا يتيح لأعباء العمل التوسع تلقائيًا أثناء ذروة الطلب والتقليص عند انخفاض الاستخدام، مما يضمن أداءً يمكن التنبؤ به دون الإفراط في توفير البنية التحتية.

كيف يعمل الإيقاف التلقائي لأعباء عمل الذكاء الاصطناعي؟

يتيح الإيقاف التلقائي لأعباء عمل الذكاء الاصطناعي التوقف تلقائيًا عندما تظل خاملة لفترة تتجاوز المدة المحددة. وهذا مفيد بشكل خاص للخدمات التي تعتمد بكثافة على وحدات معالجة الرسوميات (GPU)، والأدوات الداخلية، وبيئات التطوير، وأعباء العمل التجريبية. من خلال إيقاف تشغيل الموارد غير المستخدمة تلقائيًا، يمكن للفرق تقليل تكاليف البنية التحتية بشكل كبير مع الحفاظ على القدرة على إعادة تشغيل أعباء العمل بسرعة عند الحاجة.

هل يمكنني نشر أعباء عمل الذكاء الاصطناعي في بيئتي الخاصة؟

نعم. تم تصميم عمليات نشر الذكاء الاصطناعي الموحدة للعمل في البيئات التي تتحكم فيها، بما في ذلك حسابات السحابة العامة، وشبكات VPC الخاصة، ومجموعات Kubernetes المحلية، والإعدادات المعزولة تمامًا. بغض النظر عن مكان تشغيل أعباء العمل، تستخدم الفرق نفس سير عمل النشر وأنماط التكوين وعناصر التحكم التشغيلية من خلال منصة TrueFoundry.

كيف تتكامل عمليات نشر الذكاء الاصطناعي الموحدة مع بوابة الذكاء الاصطناعي؟

تركز عمليات نشر الذكاء الاصطناعي الموحدة على كيفية بناء أعباء عمل الذكاء الاصطناعي ونشرها وتوسيع نطاقها، بينما تتحكم بوابة الذكاء الاصطناعي في كيفية الوصول إلى أعباء العمل هذه واستخدامها. يمكن عرض الخدمات المنشورة بأمان عبر بوابة الذكاء الاصطناعي، التي توفر التوجيه والمصادقة والترخيص والمراقبة وعناصر التحكم المدركة للوكيل. معًا، يشكلان حزمة ذكاء اصطناعي إنتاجية كاملة - من تنفيذ البنية التحتية إلى الوصول والحوكمة.