ChatGPT وClaude وGemini كلهم مبنيين على حاجة اسمها النماذج اللغوية الكبيرة (LLMs). خلينا نفهم إيه هي وازاي بتشتغل — بدون رياضيات.
إيه هي النماذج اللغوية الكبيرة؟
نموذج لغوي كبير (Large Language Model أو LLM) هو برنامج كمبيوتر اتدرّب على كمية ضخمة من النصوص عشان يفهم ويولّد لغة بشرية.
تشبيه: تخيل شخص قرأ كل الكتب والمقالات والمواقع الموجودة على الإنترنت. بعد ما قرأ كل ده، بقى يقدر يكتب عن أي موضوع بأسلوب مقنع. النموذج اللغوي الكبير كده — بس بدل شخص، هو برنامج.
ازاي بيتعلم من النصوص؟
فكرة التعلم بسيطة: النموذج بيشوف جملة ناقصة وبيحاول يكمّلها. مثلاً:
«القاهرة هي عاصمة ___» → الإجابة: «مصر»
بيعمل كده مليارات المرات مع كل أنواع الجمل. بالتدريج، بيتعلم أنماط اللغة — القواعد، المعاني، السياق، وحتى الثقافة.
مهم: هو مش بيحفظ — بيتعلم أنماط. لو سألته سؤال ما شافوش قبل كده، بيقدر يجاوب بناءً على الأنماط اللي اتعلمها.
الرموز — Tokens
النموذج مش بيقرأ حروف أو كلمات — بيقرأ رموز (Tokens). الرمز ممكن يكون كلمة كاملة أو جزء من كلمة.
مثال بالإنجليزي: «artificial» ممكن تتقسم لـ «artific» + «ial» — ده رمزين.
بالعربي: التقسيم بيختلف — الكلمة العربية ممكن تتقسم لرموز أكتر من الإنجليزية. عشان كده الأدوات بتستهلك رموز أكتر مع النصوص العربية.
ليه ده مهم: كل أداة عندها حد لعدد الرموز في المحادثة (نافذة السياق — Context Window). لما تتجاوز الحد، الأداة بتبدأ «تنسى» أول المحادثة.
ليه «كبيرة»؟
كلمة «كبيرة» في LLM بتشير لحاجتين:
حجم البيانات: النماذج الحديثة اتدربت على تريليونات الكلمات — أغلب محتوى الإنترنت المتاح.
حجم النموذج: النماذج فيها مليارات المعاملات (Parameters). كل ما المعاملات أكتر، كل ما النموذج «أذكى». GPT-4 عنده مئات المليارات من المعاملات.
الكبر ده بيكلّف: تدريب نموذج كبير بيكلّف ملايين الدولارات في الكهرباء وأجهزة الكمبيوتر.
إيه اللي بيقدروا يعملوه — وإيه لا
بيقدروا: كتابة نصوص، ترجمة، تلخيص، كتابة أكواد، تحليل بيانات، إجابة أسئلة، شرح مفاهيم، عصف ذهني.
ما بيقدروش: البحث في الإنترنت بشكل مباشر (إلا لو مربوطين بمحرك بحث)، التعلم من محادثتك (كل محادثة مستقلة)، فهم العالم الحقيقي فعلاً.
مشكلة الهلوسة (Hallucination): أحياناً النموذج بيولد معلومات تبان مقنعة لكنها غلط تماماً. ده أكبر تحدي — ولازم دايماً تتحقق من المعلومات المهمة.
أمثلة على نماذج لغوية كبيرة
GPT-4o: من OpenAI — يشغّل ChatGPT.
Claude Opus: من Anthropic — معروف بالدقة والأمان.
Gemini Ultra: من Google — بيفهم نصوص وصور وصوت.
Llama 3: من Meta — مفتوح المصدر ومجاني.
جرّب بنفسك
افتح ChatGPT واسأله «اشرحلي ازاي أنت بتشتغل كنموذج لغوي كبير — كأنك بتشرح لطفل عمره 10 سنين». بعدها اسأله «إيه اللي بتعرفش تعمله؟» — حيكون صريح معاك وده أحسن طريقة تفهم حدود الأداة.
قرمصيص للأخبار أخبار الذكاء الاصطناعي بالعربي