باختصار الـ Leaderboard (AI) (لوحة المتصدّرين) — جدول ترتيب بيقارن نماذج الذكاء الاصطناعي حسب أدائها في اختبارات معيّنة — زي جدول ترتيب الدوري بس للنماذج. بالتفصيل زي ما الطالب بياخد امتحان عشان نعرف مستواه — نماذج الـ AI كمان بتتختبر. من غير معايير تقييم موضوعية، كل شركة هتقول إن نموذجها الأحسن. الـ Leaderboard بيساعد المجتمع يقارن بين النماذج بشكل عادل …
أكمل القراءة »مصطلحات
إيه هو الـ ELO Rating (AI)؟ | تقييم إيلو (للذكاء الاصطناعي)
باختصار الـ ELO Rating (AI) (تقييم إيلو (للذكاء الاصطناعي)) — نظام تقييم مستوحى من الشطرنج — كل نموذج له رقم، ولما يكسب في مقارنة رقمه بيزيد ورقم اللي خسر بيقل. بيُستخدم في Chatbot Arena. بالتفصيل زي ما الطالب بياخد امتحان عشان نعرف مستواه — نماذج الـ AI كمان بتتختبر. من غير معايير تقييم موضوعية، كل شركة هتقول إن نموذجها الأحسن. …
أكمل القراءة »إيه هي الـ Chatbot Arena؟ | ساحة مقارنة روبوتات المحادثة
باختصار الـ Chatbot Arena (ساحة مقارنة روبوتات المحادثة) — منصة بتخلّي الناس تقارن بين نموذجين في محادثة عمياء (من غير ما يعرفوا مين مين) وتختار الأفضل — من أعدل طرق تقييم النماذج اللغوية. بالتفصيل من غير تقييم ومقارنة، مش هنعرف إذا كان النموذج الجديد أحسن فعلاً من القديم. من غير معايير تقييم موضوعية، كل شركة هتقول إن نموذجها الأحسن. الـ …
أكمل القراءة »إيه هو الـ ARC (AI2 Reasoning Challenge)؟ | تحدّي الاستدلال من AI2
باختصار الـ ARC (AI2 Reasoning Challenge) (تحدّي الاستدلال من AI2) — اختبار أسئلة علوم من مستوى المدرسة — لكنه صعب على النماذج لأنه محتاج تفكير واستنتاج مش مجرد حفظ معلومات. بالتفصيل من غير تقييم ومقارنة، مش هنعرف إذا كان النموذج الجديد أحسن فعلاً من القديم. من غير معايير تقييم موضوعية، كل شركة هتقول إن نموذجها الأحسن. الـ ARC بيساعد المجتمع …
أكمل القراءة »إيه هي الـ GSM8K؟ | اختبار مسائل الرياضيات المدرسية
باختصار الـ GSM8K (اختبار مسائل الرياضيات المدرسية) — مجموعة 8500 مسألة حسابية من مستوى المدرسة الابتدائية والإعدادية — بيختبر قدرة النموذج على التفكير الرياضي خطوة بخطوة. بالتفصيل زي ما الطالب بياخد امتحان عشان نعرف مستواه — نماذج الـ AI كمان بتتختبر. من غير معايير تقييم موضوعية، كل شركة هتقول إن نموذجها الأحسن. الـ GSM8K بيساعد المجتمع يقارن بين النماذج بشكل …
أكمل القراءة »إيه هي الـ HumanEval؟ | اختبار تقييم البرمجة
باختصار الـ HumanEval (اختبار تقييم البرمجة) — مجموعة مسائل برمجية بتختبر قدرة النموذج على كتابة كود صحيح — بيديله وصف الدالة والنموذج لازم يكتب الكود وينجح في حالات الاختبار. بالتفصيل إزاي نعرف إن نموذج AI كويس ولا لأ؟ لازم نختبره — وهنا بييجي دور التقييم والمعايير. من غير معايير تقييم موضوعية، كل شركة هتقول إن نموذجها الأحسن. الـ HumanEval بيساعد …
أكمل القراءة »إيه هو الـ MMLU؟ | اختبار الفهم اللغوي متعدّد المهام
باختصار الـ MMLU (اختبار الفهم اللغوي متعدّد المهام) — اختبار ضخم بيقيس معرفة النموذج في 57 موضوع مختلف من الرياضيات للتاريخ للقانون — من أشهر المعايير اللي بتتقارن بيها النماذج اللغوية. بالتفصيل إزاي نعرف إن نموذج AI كويس ولا لأ؟ لازم نختبره — وهنا بييجي دور التقييم والمعايير. من غير معايير تقييم موضوعية، كل شركة هتقول إن نموذجها الأحسن. الـ …
أكمل القراءة »إيه هو الـ Gradient؟ | المُشتقّة / التدرّج
باختصار الـ Gradient (المُشتقّة / التدرّج) — الاتجاه والمقدار اللي لازم تعدّل فيه أوزان النموذج عشان الخسارة تقل — زي بوصلة بتقولك “روح في الاتجاه ده عشان تحسّن”. كل التدريب مبني على حساب التدرّجات. بالتفصيل ممكن تستخدم الـ AI من غير ما تفهم الرياضيات — بس لو فهمتها، هتبقى أقوى بكتير. مش لازم تكون عالم رياضيات عشان تستخدم الـ AI …
أكمل القراءة »إيه هو الـ Normalization (Batch/Layer)؟ | التطبيع (على مستوى الدفعة/الطبقة)
باختصار الـ Normalization (Batch/Layer) (التطبيع (على مستوى الدفعة/الطبقة)) — تقنية بتعيد توزيع البيانات عشان تكون حول الصفر بتشتّت موحّد — بتخلّي التدريب أسرع وأكثر استقراراً وبتمنع الأرقام من إنها تكبر أو تصغر أوي. بالتفصيل ورا كل نموذج ذكاء اصطناعي فيه رياضيات — والرياضيات هي اللغة السرية اللي بيتكلم بيها الـ AI. مش لازم تكون عالم رياضيات عشان تستخدم الـ AI …
أكمل القراءة »إيه هو الـ Attention Score؟ | درجة الانتباه
باختصار الـ Attention Score (درجة الانتباه) — رقم بيحدّد قد إيه كلمة معيّنة لازم “تنتبه” لكلمة تانية في الجملة — ده جوهر آلية الانتباه اللي خلّت نماذج المحوّلات (Transformers) ناجحة. بالتفصيل ممكن تستخدم الـ AI من غير ما تفهم الرياضيات — بس لو فهمتها، هتبقى أقوى بكتير. مش لازم تكون عالم رياضيات عشان تستخدم الـ AI — بس فهم الأساسيات …
أكمل القراءة »
قرمصيص للأخبار أخبار الذكاء الاصطناعي بالعربي