🔴 خبر عاجل Anthropic أعلنت عن إطلاق نموذجها الجديد Claude Sonnet 4.6، واللي بيقدّم أداء …
أكمل القراءة »إيه هو الـ TruthfulQA؟ | اختبار صدق الإجابات
باختصار الـ TruthfulQA (اختبار صدق الإجابات) — اختبار بيقيس مدى صدق إجابات النموذج — بيسأل أسئلة الناس عادةً بتغلط فيها عشان يشوف هل النموذج هيرد بالصح ولا هيكرّر المعلومات الغلط الشائعة. بالتفصيل إزاي نعرف إن نموذج AI كويس ولا لأ؟ لازم نختبره — وهنا بييجي دور التقييم والمعايير. من غير معايير تقييم موضوعية، كل شركة هتقول إن نموذجها الأحسن. الـ …
أكمل القراءة »
قرمصيص للأخبار أخبار الذكاء الاصطناعي بالعربي



