هندسة الموجهات: تعلم التفاعل مع النماذج اللغوية الكبيرة (LLMs)

Published: July 4, 2026

Built for Speed: ~10ms Latency, Even Under Load

Blazingly fast way to build, track and deploy your models!

Handles 350+ RPS on just 1 vCPU — no tuning needed
Production-ready with full enterprise support

Get Started with Truefoundry Now Talk to the Expert

لقد أحدث ظهور ChatGPT / OpenAI ونماذج اللغة الكبيرة (LLMs) الأخرى ثورة في العالم ويُعدّ أحد أهم التطورات التكنولوجية في العقد الماضي. بمساعدة الذكاء الاصطناعي، يمكننا الآن أتمتة العديد من المهام اليومية التي كانت في السابق روتينية وتستغرق وقتًا طويلاً. ومع ذلك، للاستفادة الكاملة من إمكانات هذه التكنولوجيا، من الضروري فهم كيفية استخدامها بفعالية.

قبل ظهور الذكاء الاصطناعي، كانت لغات البرمجة هي الوسيلة الوحيدة لإعطاء التعليمات للآلات. ومع ذلك، مع ظهور نماذج اللغة الكبيرة (LLMs)، أصبح من الممكن الآن إنجاز الكثير باستخدام اللغة الإنجليزية البسيطة والواضحة. تم تجميع هذه المقالة من مصادر مختلفة بينما كنت أتعلم المزيد عن هذا المجال المثير. أملي من خلال هذه المدونة هو أن تساعد في تقصير الوقت الذي تستغرقه لفهم هندسة الأوامر.

لنقل أنك تكتب هذا في ساحة لعب OpenAI:

ما هو 965*590؟

الإجابة غير صحيحة وتختلف قليلاً في كل مرة. ولكن إذا قمت بتعديل التعليمات على النحو التالي وضبطت درجة الحرارة على 0، فمن المرجح أن تحصل على الإجابة الصحيحة:

ما هو 965*590؟ تأكد أن إجابتك صحيحة تمامًا:

يُطلق على فن القدرة على تعديل الأوامر لجعل الذكاء الاصطناعي يفعل ما نريده هندسة الأوامر. ليس من الممكن فقط الحصول على إجابات من OpenAI، بل يمكن أيضًا استخدامه لتنفيذ إجراءات لنا - مما يفتح الباب أمام أتمتة الكثير من الإجراءات في الحياة الواقعية.

إليك بعض الطرق لإنجاز المهام بواسطة الذكاء الاصطناعي:

قدم أمثلة للنموذج توضح ما تريد فعله (التوجيه بأمثلة قليلة)

قدم تعليمات واضحة للنموذج مع مثال. بناءً على عدد الأمثلة التي تقدمها، يُطلق عليه التوجيه بدون أمثلة (0-shot prompting)، أو التوجيه بمثال واحد (1-shot prompting)، أو التوجيه بأمثلة قليلة (few-shot prompting). كلما زاد عدد الأمثلة، كانت مخرجات النموذج أفضل. كما يمكنك استخدام التوجيه بأمثلة قليلة لإخبار النموذج بالشكل الذي يجب أن يعيد به المخرجات.

التوجيه بدون أمثلة
2+2=

مطالبة بلقطة واحدة
2+2=4
3+3=

مطالبة بضع لقطات
2+3=5
10+30=40
3+1=4
1+11=

إليك مثال على كيفية استخدام مطالبات بضع لقطات لتصنيف تغريدة على أنها إيجابية أو سلبية:

تويتر هو منصة تواصل اجتماعي حيث يمكن للمستخدمين نشر رسائل قصيرة تسمى "تغريدات". يمكن أن تكون التغريدات إيجابية أو سلبية، ونود أن نكون قادرين على تصنيف التغريدات على أنها إيجابية أو سلبية. إليك بعض الأمثلة على التغريدات الإيجابية والسلبية. تأكد من تصنيف التغريدة الأخيرة بشكل صحيح.

س: تغريدة: "يا له من يوم جميل!" هل هذه التغريدة إيجابية أم سلبية؟
ج: إيجابية

س: تغريدة: "أكره هذا الصف" هل هذه التغريدة إيجابية أم سلبية؟
ج: سلبية

س: تغريدة: "أحب الجيوب في الجينز"
ج:

اشرح منطقك للنموذج في الأمثلة (مطالبة سلسلة التفكير)

لنفترض أننا نقدم المطالبة التالية:

المطالبة:
ما هي الطريقة الأسرع للوصول إلى العمل؟
الخيار الأول: استقل حافلة لمدة 1000 دقيقة، ثم قطارًا لمدة نصف ساعة، وأخيرًا رحلة دراجة لمدة 10 دقائق.
الخيار الثاني: استقل حافلة لمدة 800 دقيقة، ثم قطارًا لمدة ساعة، وأخيرًا رحلة دراجة لمدة 30 دقيقة.

المخرجات:
الخيار الأول هو طريقة أسرع للوصول إلى العمل.

كما ترون، المخرجات خاطئة بوضوح. ومع ذلك، إذا شرحنا المنطق للذكاء الاصطناعي، يمكننا بالفعل جعله يجيب بشكل صحيح.

ما هي الطريقة الأسرع للوصول إلى المنزل؟
الخيار الأول: استقل حافلة لمدة 10 دقائق، ثم حافلة لمدة 40 دقيقة، وأخيرًا قطارًا لمدة 10 دقائق.
الخيار الثاني: استقل قطارًا لمدة 90 دقيقة، ثم رحلة دراجة لمدة 45 دقيقة، وأخيرًا حافلة لمدة 10 دقائق.
سيستغرق الخيار الأول 10+40+10 = 60 دقيقة.
سيستغرق الخيار الثاني 90+45+10=145 دقيقة.
بما أن الخيار الأول يستغرق 60 دقيقة والخيار الثاني يستغرق 145 دقيقة، فإن الخيار الأول أسرع.

ما هي الطريقة الأسرع للوصول إلى العمل؟
الخيار الأول: استقل حافلة لمدة 1000 دقيقة، ثم قطارًا لمدة نصف ساعة، وأخيرًا رحلة دراجة لمدة 10 دقائق.
الخيار الثاني: استقل حافلة لمدة 800 دقيقة، ثم قطارًا لمدة ساعة، وأخيرًا رحلة دراجة لمدة 30 دقيقة.

المخرجات:
سيستغرق الخيار الأول 1000+30+10 = 1040 دقيقة. سيستغرق الخيار الثاني 800+60+30 = 890 دقيقة. بما أن الخيار الأول يستغرق 1040 دقيقة والخيار الثاني يستغرق 890 دقيقة، فإن الخيار الثاني أسرع.

قدم قاعدة معارفك الخاصة إلى ChatGPT

يمكنك تزويد ChatGPT بمعلومات حول قاعدة معارفك الخاصة حتى يتمكن من الإجابة على الأسئلة المتعلقة بتلك المعرفة. هذا مفيد بشكل خاص إذا كنت تخطط لبناء روبوتات الدردشة الخاصة بك بالاعتماد على بياناتك الخاصة. يمكنك تمرير المعلومات في السياق. ومع ذلك، هناك قيود حيث أن نماذج اللغات الكبيرة (LLMs) مثل GPT-3 لديها حجم إدخال (prompt) أقصى يبلغ حوالي 4 آلاف رمزًا، وبالتالي لا يمكنك إدخال الكثير من المعلومات مباشرة إلى ChatGPT في السياق.

يمكن أن يكون أحد الحلول لذلك هو فهرسة المستندات في قاعدة المعرفة أولاً. ثم استجابة للمطالبة، نقوم أولاً بجلب المستندات ذات الصلة من الفهرس ثم نسمح لـ ChatGPT بالإجابة على السؤال بناءً على المجموعة الفرعية من المعلومات المسترجعة من البحث. هذا في الأساس يستخدم البحث الدلالي ثم توجيه النموذج بالمعلومات ذات الصلة في السياق. يمكن للعديد من المكتبات تمكين ذلك لك مثل Haystack و Langchain، والتي غالبًا ما تُعتبر من بين أفضل أدوات هندسة المطالبات لسير عمل نماذج اللغة الكبيرة (LLM) القائمة على الاسترجاع.

دمج الأدوات في نماذج اللغة الكبيرة (LLMs) لجعلها تنفذ الإجراءات (ReAct)

يمكنك تزويد نماذج اللغة الكبيرة (LLMs) بأدوات متعددة لتنفيذ الإجراءات، ثم السماح لنموذج اللغة الكبير (LLM) بتحديد الطريقة الصحيحة للتفاعل مع هذه الأدوات لتحقيق الهدف المنشود.

يُطلق على هذا اسم نموذج التفكير والتصرف (ReAct) وهو نوع من الإصدارات الأكثر تقدمًا لأنظمة MRKL (الاستدلال المعياري والمعرفة واللغة، ويُنطق "ميراكل").

دعنا نشرح أولاً MRKL بمثال. لنفترض أن لدينا واجهة برمجة تطبيقات (API) لاستدعاء حاسبة جوجل لإجراء العمليات الحسابية. نعلم الآن أن التعبيرات الصحيحة رياضيًا هي شيء يمكن لجوجل الإجابة عليه، ولكن ليس الاستفسارات باللغة الطبيعية. لذا إذا كانت المطالبة كما هو مذكور أدناه:

ما هو 20 ضرب 5^6؟

يمكننا توجيه نموذج اللغة الكبير (LLM) لإخراج التعبير بصيغة يمكن لحاسبة جوجل فهمها. لذا ستكون المطالبة، في هذه الحالة، كالتالي:

ترجم المسألة الرياضية أدناه إلى صيغة يمكن لحاسبة جوجل فهمها.

ما هو 20 ضرب 5^6

وبالمثل، يمكننا استخدام نماذج اللغة الكبيرة (LLMs) لتحويل إجراء موصوف باستخدام اللغة الطبيعية إلى تعبير تفهمه واجهة برمجة تطبيقات (API) موجودة. لقد أصبح دمج واجهات برمجة التطبيقات (APIs) التابعة لجهات خارجية والتفاعل معها من واجهة الدردشة أمرًا بسيطًا داخل ChatGPT من خلال نظام المكونات الإضافية الخاص بهم، والذي يمكنك قراءة المزيد هنا.

بعض الأمثلة على تجربة لا مثيل لها

"اطلب مكونات لتحضير بيتزا بيبروني." يمكن لـ ChatGPT تحديد المكونات الضرورية تلقائيًا وتقديم طلب إلى متجر بقالة عبر الإنترنت.
"أضف حدثًا إلى تقويمي في الساعة 8 مساءً." يمكن تحويل هذا الأمر إلى طلب CURL لتطبيق التقويم الخاص بك ثم تنفيذه (إما عبر إضافة أو يدويًا) لإنشاء حدث فعلي في تطبيق التقويم الخاص بك.
"أحتاج إلى تدريب نموذج يعمل على ملف CSV هذا ويخرج السعر المتوقع للنموذج." يمكن لهذا الأمر أن يولد تلقائيًا رمز تدريب لنموذج تعلم آلي (ML) ثم يمكن تنفيذه لتدريب النموذج فعليًا إما عن طريق النسخ واللصق في بيئة البرمجة الخاصة بك أو باستخدام إضافة مناسبة.

نشر أي نموذج لغوي كبير متاح تجارياً

المراجع:

https://learnprompting.org/docs (هذا مصدر ممتاز في حال رغبت في التعمق في هندسة الموجهات). جميع الأمثلة في المقال مأخوذة من هنا.
https://til.simonwillison.net/llms/python-react-pattern

تحدث معنا

إذا كنت تتطلع إلى تعظيم العوائد من مشاريع النماذج اللغوية الكبيرة (LLM) وتمكين عملك من الاستفادة من الذكاء الاصطناعي بالطريقة الصحيحة، يسعدنا التحدث وتبادل الأفكار.

احتسِ ☕️ معنا

تعرف على كيفية مساعدة TrueFoundry لك في نشر النماذج اللغوية الكبيرة (LLMs) في 5 دقائق:

‍

Deploy and Fine-tune Open Source LLMs With a Few Clicks!

TrueFoundry offers an intuitive solution for LLM deployment and fine-tuning. With our Model Catalogue, companies can self-host LLMs on Kubernetes, reducing inference costs by 10x in just one click. Discover how to deploy a Dolly-v2-3b model and fine-tune a Pythia-70m using TrueFoundry in our blog.

TrueFoundry Blog TrueFoundry

TrueFoundry AI Gateway delivers ~3–4 ms latency, handles 350+ RPS on 1 vCPU, scales horizontally with ease, and is production-ready, while LiteLLM suffers from high latency, struggles beyond moderate RPS, lacks built-in scaling, and is best for light or prototype workloads.

Built for Speed: ~10ms Latency, Even Under Load

Schedule your Demo Now