باختصار
الـ Open Weights (أوزان مفتوحة) — لما شركة تنشر أوزان النموذج (اللي اتعلّمها من التدريب) بس من غير الكود أو البيانات — تقدر تستخدم النموذج بس مش بالضرورة تعرف إزاي اتعمل بالظبط.
بالتفصيل
زي ما الطالب بياخد امتحان عشان نعرف مستواه — نماذج الـ AI كمان بتتختبر.
من غير معايير تقييم موضوعية، كل شركة هتقول إن نموذجها الأحسن. الـ Open Weights بيساعد المجتمع يقارن بين النماذج بشكل عادل ومبني على بيانات حقيقية. ده مهم للمطوّرين والشركات والباحثين على حد سواء — لأن اختيار النموذج الصح ممكن يفرق كتير في النتايج.
مثال عملي
لما OpenAI أو Google بتطلق نموذج جديد، أول حاجة الباحثين والمطوّرين بيبصوا عليها هي نتايجه على المعايير القياسية. الـ Open Weights بيساعد كل الناس — من الشركات الكبيرة للمطوّرين المستقلين — إنهم يقرروا أي نموذج يستخدموا لمهمة معينة. من غير أدوات تقييم موضوعية، كان هيبقى كله كلام تسويقي.
مصطلحات مرتبطة
- اختبار الفهم اللغوي متعدّد المهام (MMLU)
- اختبار تقييم البرمجة (HumanEval)
- اختبار مسائل الرياضيات المدرسية (GSM8K)
- تحدّي الاستدلال من AI2 (ARC (AI2 Reasoning Challenge))
- ساحة مقارنة روبوتات المحادثة (Chatbot Arena)
قرمصيص للأخبار أخبار الذكاء الاصطناعي بالعربي