Blank white background with no objects or features visible.

تعلن TrueFoundry عن استحواذها على Seldon AI، موسعة بذلك لوحة التحكم الخاصة بها للذكاء الاصطناعي للمؤسسات. البيان الصحفي الكامل →

Kimi K2.7 Code يقلل تكاليف الاستدلال بنسبة 30% ويتفوق على Claude Opus 4.8 في استخدام أدوات MCP

By أمروثا بوتلوري

Published: July 4, 2026

أطلقت Moonshot AI Kimi K2.7 Code في 12 يونيو 2026: وهو الأحدث في عائلة K2 مفتوحة الوزن، والمصمم للبرمجة الوكيلة طويلة الأمد، مع ادعاءين رئيسيين: رموز استدلال أقل بنسبة 30% تقريبًا من K2.6 في المهام المماثلة، ودرجة استدعاء أداة MCP تتجاوز Claude Opus 4.8. تظل الأسعار دون تغيير عند 0.95 دولار / 4.00 دولارات لكل مليون رمز إدخال/إخراج.

ما أعلنته Moonshot AI

Kimi K2.7 Code هو تدريب لاحق يركز على البرمجة، مبني على نفس أساس MoE مثل K2.5 و K2.6: تريليون معلمة إجمالية، 32 مليار معلمة نشطة لكل رمز عبر 384 خبيرًا، نافذة سياق بحجم 256 ألف، ومُشفّر الرؤية MoonViT ذو 400 مليون معلمة لإدخال النصوص والصور والفيديو. تحول تركيز التدريب اللاحق نحو كفاءة الرموز، اتباع التعليمات في السياقات الطويلة، و موثوقية استخدام أداة MCP، مع كون تقليل رموز الاستدلال بنسبة 30% هو الإنجاز الرئيسي.

هناك قيدان يستحقان الإشارة إليهما قبل النشر: وضع التفكير إلزامي ولا يمكن تعطيله، ومعلمات أخذ العينات مقفلة (درجة الحرارة 1.0، top_p 0.95). هذا يحد من حتمية المخرجات - وهي مقايضة متعمدة من أجل موثوقية الوكيل التي تهم مسارات العمل الحساسة للكمون. لا يوجد أيضًا إصدار "Instruct" عام الغرض عند الإطلاق؛ توصي Moonshot صراحةً بـ K2.6 للكتابة والتحليل والمحادثة.

Kimi K2.7 Code مقابل Claude Opus 4.8 و GPT-5.5

Benchmark Kimi K2.7 Code Claude Opus 4.8 GPT-5.5
Kimi Code Bench v2 (in-house) 62.0 67.4 69.0
Program Bench 53.6 63.8 69.1
MLS Bench Lite (multi-language) 35.1 42.8 35.5
MCP Atlas (tool-use navigation) 76.0 81.3 79.4
MCP Mark Verified (tool invocation) 81.1 76.4 92.9
Kimi Claw 24/7 Bench (sustained agentic) 46.9 50.4 52.8
SWE-Bench Verified 60.4%*

SWE-Bench Verified (60.4%) is not in the official model card — it is Moonshot-reported via third-party launch coverage.

المجالات التي يتفوق فيها K2.7. يُعد MCP Mark Verified، وهو استدعاء أداة تم التحقق منه بشريًا عبر Notion و GitHub ونظام الملفات و Postgres و Playwright، أوضح فوز لـ K2.7: 81.1 مقابل 76.4 لـ Opus 4.8. بالنسبة للفرق التي تبني وكلاء يعتمدون على MCP، هذا هو الرقم الأكثر أهمية عمليًا في الجدول.

المجالات التي تتفوق فيها النماذج الاحتكارية. MCP Atlas و MCP Mark Verified هما معياران منفصلان. في MCP Atlas، يتصدر Claude Opus 4.8 بنتيجة 81.3 مقابل 76.0 لـ K2.7. فيما يتعلق بجودة البرمجة الخام، يسجل كلا النموذجين الاحتكاريين درجات أعلى عبر Kimi Code Bench v2 و Program Bench. يتصدر GPT-5.5 بشكل عام في MCP Mark Verified بنتيجة 92.9. K2.7 ليس أفضل نموذج في أي معيار واحد — إنه الخيار الأفضل قيمة مفتوح الوزن للبرمجة الوكيلة التي تعتمد بشكل كبير على MCP وحساسة للتكلفة.

متعدد اللغات. يُظهر MLS Bench Lite أكبر مكسب لـ K2.7: 35.1، بزيادة 31.5% عن 26.7 لـ K2.6، ويقترب من مطابقة 35.5 لـ GPT-5.5. يتصدر Claude Opus 4.8 بنتيجة 42.8.

ماذا يعني هذا عمليًا

تتضاعف كفاءة التكلفة. بسعر 0.95 دولار / 4.00 دولارات لكل مليون رمز — وهو أرخص بنحو 5 مرات بالفعل من Claude Opus 4.8 — يقلص تخفيض رموز الاستدلال بنسبة 30% الفجوة أكثر في كل تشغيل متعدد الأدوار. كما تخفض عمليات الوصول إلى ذاكرة التخزين المؤقت بسعر 0.19 دولار/مليون التكاليف مرة أخرى لسير العمل الذي يعيد استخدام السياق.

مكاسب MCP محددة النطاق. يتمتع K2.7 بأقوى دقة لاستدعاء أدوات MCP بين جميع النماذج مفتوحة الوزن، لكن هذه الميزة خاصة بـ MCP Mark Verified. في MCP Atlas، يتصدر Opus 4.8. ويتفوق GPT-5.5 على كليهما في MCP Mark Verified بنسبة 92.9.

اختبر قبل التبديل. كل رقم مذكور أعلاه هو من بيانات Moonshot الخاصة. ذكرت VentureBeat أن الممارسين الأوائل أشاروا إلى وجود فجوات بين الأرقام المعلنة عند الإطلاق والنتائج الواقعية. قم بتشغيل K2.7 على مستودعاتك الخاصة قبل توجيه حركة المرور الإنتاجية إليه.

متى تستخدمه

K2.7 مقابل K2.6. أفضل لأعباء عمل الترميز الوكيلية البحتة حيث تكون كفاءة الرموز هي القيد: مثل جلسات التصحيح الطويلة، وإعادة هيكلة الملفات المتعددة، وعوامل التكامل المستمر (CI). التزم بـ K2.6 لأعباء العمل العامة أو المختلطة حتى تتوفر معايير مستقلة.

K2.7 مقابل Opus 4.8 أو GPT-5.5. إذا كانت جودة الترميز هي الأولوية وليست التكلفة هي القيد، فلا تزال النماذج الاحتكارية هي المتصدرة. أما إذا كنت بحاجة إلى أفضل استدعاء لأدوات MCP مفتوحة الوزن مع مرونة التحكم في البيانات، فإن K2.7 هو الخيار.

وضع التفكير الإلزامي. مفيد لمهام الوكيل المعقدة؛ مكلف للاستعلامات البسيطة. قم بتعيين حدود الميزانية في نظام الوكيل الخاص بك قبل التمكين في الإنتاج.

الخلاصة

K2.7 Code هو ترقية مركزة للكفاءة للفرق التي تدير مسارات ترميز وكيلية كثيفة MCP وحساسة للتكلفة. يعد تخفيض الرموز بنسبة 30% وريادة استدعاء MCP مفتوح الوزن من الأسباب لتقييمه. إن غياب المعايير المستقلة وقيد التفكير الإلزامي هما السببان للاختبار بعناية أولاً - والاختبار بعناية هو بالضبط ما يجعل TrueFoundry AI Gateway يثبت جدارته.

مع حوالي 3-4 مللي ثانية من الحمل الزائد وأكثر من 350 طلبًا في الثانية (RPS) على وحدة معالجة مركزية افتراضية واحدة (vCPU)، يقوم Gateway بتوجيه الطلبات عبر أكثر من 1000 نموذج من خلال نقطة نهاية واحدة متوافقة مع OpenAI. يتوفر Kimi K2.7 Code مباشرة عبر TrueFoundry AI Gateway: بنفس عنوان URL، ونفس بيانات الاعتماد لإعدادك الحالي، مع تتبع التكلفة وزمن الاستجابة لكل طلب لكل فريق. بالنسبة للفرق التي لديها متطلبات إقامة البيانات، تدعم الأوزان المفتوحة لـ K2.7 الاستضافة الذاتية الكاملة، مع قيام TrueFoundry بمعالجة التنسيق بحيث لا تتطلب الحوكمة عمليات يدوية.

الوصول إلى Kimi K2.7 Code عبر TrueFoundry AI Gateway →

قراءات ذات صلة

The fastest way to build, govern and scale your AI

Sign Up
Table of Contents

One Gateway for Every LLM, Agent and MCP Server

Book a 30-min with our AI expert

Book a Demo

The fastest way to build, govern and scale your AI

Book Demo
Summarize with
ChatGPT logo by OpenAI
Perplexity AI logo
Blurry red snowflake on white background, symmetrical frosty design with soft edges and abstract shape.

Discover More

May 8, 2024
|
5 min read

استكشاف بدائل Vertex AI لعام 2026

March 25, 2025
|
5 min read

أفضل 6 بدائل لـ AWS SageMaker في عام 2026

April 17, 2025
|
5 min read

أفضل 5 بدائل لـ Azure ML لعام 2025

July 4, 2026
|
5 min read

تكاملات منصة التعلم الآلي #1: Weights & Biases

Use Cases
Engineering and Product
July 4, 2026
|
5 min read

تكامل Pillar Security مع TrueFoundry

No items found.
July 4, 2026
|
5 min read

التخزين المؤقت الدلالي لنماذج اللغة الكبيرة (LLMs): تقليل التكلفة وزمن الاستجابة بما يتجاوز التخزين المؤقت للبادئات

No items found.
July 4, 2026
|
5 min read

تكاملات أدوات التعلم الآلي #2 DVC لإدارة إصدارات بياناتك

Engineering and Product
Use Cases
No items found.

Recent Blogs

Black left pointing arrow symbol on white background, directional indicator.
Black left pointing arrow symbol on white background, directional indicator.
Take a quick product tour
Start Product Tour
Product Tour