آخر المقالات

إيه هو الـ GRPO؟ | تحسين السياسة النسبية الجماعية

باختصار الـ GRPO هو تقنية تدريب طوّرها فريق DeepSeek، بتقيّم مجموعة إجابات مع بعض وتختار الأفضل نسبيًا من غير ما تحتاج نموذج مكافأة منفصل. الطريقة دي أكفأ وأوفر من الـ RLHF التقليدي. بالتفصيل تخيّل إنك مدرّس وعندك فصل طلاب وكل واحد حل نفس السؤال بطريقة مختلفة. بدل ما تجيب مصحح خارجي (نموذج المكافأة) يقيّم كل إجابة لوحدها، أنت بتقارن إجابات …

أكمل القراءة »

GitHub Copilot — ازاي الـ AI بيكتب كود بدالك

تخيل إنك بتكتب كود والبرنامج بيكمّل السطر بدالك — ومش بس كلمة، لا أسطر كاملة. ده GitHub Copilot — المبرمج الذكي اللي بيشتغل جنبك. إيه هو GitHub Copilot؟ GitHub Copilot هو مساعد برمجة بالذكاء الاصطناعي من GitHub (مملوكة لـ Microsoft). بيشتغل داخل محرر الأكواد بتاعك وبيقترح أكواد كاملة وأنت بتكتب. الفكرة: اكتب تعليق يوصف إيه اللي عايز تعمله، وCopilot بيكتب …

أكمل القراءة »

إيه هو الـ Clustering؟ | التجميع

باختصار الـ Clustering هو أسلوب في التعلم الآلي بيقسم البيانات لمجموعات متشابهة من غير ما يكون عارف التصنيفات مسبقاً. تخيل إنك عندك كومة ملابس كبيرة ومحتاج تفرزها حسب اللون من غير ما حد يقولك إيه الألوان اللي موجودة — ده بالظبط اللي بيعمله الـ Clustering. بالتفصيل تخيل إنك دخلت أوضة فيها ١٠٠ كتاب متبعترين على الأرض، ومحدش قالك تفرزهم إزاي. …

أكمل القراءة »