ازاي الـ AI بيتعلم؟ — شرح تدريب النماذج ببساطة

مارس 8, 2026 شروحات التعليقات على ازاي الـ AI بيتعلم؟ — شرح تدريب النماذج ببساطة مغلقة 138 زيارة

كلنا بنستخدم ChatGPT وبنتبهر بردوده — بس ازاي فعلاً «اتعلم» يكتب كده؟ الإجابة أبسط مما تتخيل، لكنها بتكشف عظمة الهندسة ورا الأدوات دي.

الخطوة الأولى — التدريب المسبق

الخطوة الأولى في بناء نموذج زي GPT اسمها التدريب المسبق (Pre-training). الفكرة بسيطة جداً:

1. نجمع كمية ضخمة من النصوص — كتب، مواقع، مقالات، ويكيبيديا، أكواد

2. نحجب الكلمة الأخيرة من كل جملة

3. نطلب من النموذج يتوقع الكلمة المحجوبة

4. لو أخطأ، نصححه ونكرر

ده بيتعمل مليارات المرات. بالتدريج، النموذج بيتعلم أنماط اللغة والمعرفة العامة — مش بالحفظ، لكن بفهم العلاقات بين الكلمات.

تشبيه: زي طفل بيسمع ملايين الجمل وبيبدأ يكمل الجمل لوحده — «أنا رايح ال…» → «مدرسة».

الخطوة التانية — التعلم بإشراف

بعد التدريب المسبق، النموذج بيعرف يكمّل نصوص — لكنه مش بيعرف يجاوب على أسئلة أو يكون مساعد مفيد. هنا بييجي التعلم بإشراف (Supervised Fine-tuning).

بشر حقيقيين بيكتبوا آلاف الأمثلة: سؤال وإجابة مثالية. النموذج بيتدرب على الأمثلة دي ويتعلم إنه لما حد يسأل سؤال، لازم يرد بإجابة مفيدة ومنظمة.

مثال: «إيه عاصمة فرنسا؟» → «عاصمة فرنسا هي باريس. باريس مدينة…» — بدل ما يكمل الجملة بأي حاجة عشوائية.

الخطوة التالتة — RLHF

آخر خطوة هي التعلم المعزز من ردود الفعل البشرية (Reinforcement Learning from Human Feedback أو RLHF).

ازاي بيشتغل:

1. النموذج بيولد عدة إجابات لنفس السؤال

2. بشر بيقيّموا الإجابات — أي واحدة أحسن

3. النموذج بيتعلم يولد إجابات شبه اللي البشر فضّلوها

ده اللي بيخلي ChatGPT «مهذب» و«آمن»: البشر علّموه يتجنب الإجابات الضارة أو المسيئة.

ليه التدريب مكلف؟

تدريب نموذج كبير بيحتاج:

أجهزة: آلاف من معالجات الرسوميات (GPUs) بتشتغل مع بعض لأسابيع أو أشهر.

كهرباء: تدريب نموذج واحد بيستهلك كهرباء تكفي مدينة صغيرة لأيام.

بيانات: جمع وتنظيف تريليونات الكلمات محتاج فرق كاملة.

بشر: فريق المقيّمين اللي بيعلموا النموذج في خطوة RLHF.

التكلفة: تدريب نموذج حديث بيكلّف من 10 لـ 100 مليون دولار. عشان كده شركات قليلة بس بتقدر تبني نماذج من الصفر.

الضبط الدقيق — Fine-tuning

بعد ما النموذج يخلص تدريب، الشركات والأفراد بيقدروا يعملوا ضبط دقيق (Fine-tuning) عشان يخصصوه لمهمة معينة.

مثال: نموذج عام بتاخده وتدربه على بيانات طبية — بيبقى أحسن في الإجابات الطبية. أو تدربه على بيانات قانونية — بيبقى مستشار قانوني أحسن.

ده أرخص بكتير: الضبط الدقيق بيكلّف مئات أو آلاف الدولارات — مش ملايين.

جرّب بنفسك

اسأل ChatGPT: «اشرحلي خطوات تدريبك الثلاثة بالترتيب كأنك بتشرح لحد مش تقني. استخدم تشبيهات من الحياة اليومية.» بعدها اسأله: «إيه أكتر حاجة كانت صعبة في تدريبك؟» — حتلاقي إجابات مفيدة ومثيرة.