باختصار
الـ Semi-supervised Learning هو أسلوب تدريب بيستخدم كمية صغيرة من بيانات مصنفة مع كمية كبيرة من بيانات مش مصنفة. الفكرة إنك توفر وقت ومجهود التصنيف اليدوي وفي نفس الوقت تطلع بنموذج دقيق.
بالتفصيل
تخيل إنك مدرس جديد في مدرسة فيها ٥٠٠ طالب ومحتاج تعرف مستوى كل واحد فيهم. مش هتقدر تقعد مع كل طالب لوحده — ده هياخد وقت كتير. فبدل كده، بتقعد مع ٢٠ طالب بس وتقيّمهم كويس، وبعدين بتستخدم اللي فهمته عنهم عشان تقدر تقدّر مستوى الباقي بناءً على أداءهم العام. ده بالظبط فكرة الـ Semi-supervised Learning.
في عالم الذكاء الاصطناعي، تصنيف البيانات يدوياً (إنك تقول للنموذج “الصورة دي قطة” و”الصورة دي كلب”) بياخد وقت ومجهود وفلوس كتير. تخيل إنك عندك مليون صورة ومحتاج تصنفهم كلهم — ده شغل مئات الناس لأسابيع. الـ Semi-supervised Learning بيحل المشكلة دي إنه بيطلب منك تصنف بس جزء صغير (يمكن ١٪ بس) والباقي بيتعامل معاه لوحده.
إزاي بيشتغل؟ النموذج بيتعلم الأول من البيانات المصنفة القليلة، وبعدين بيبص على البيانات الكتير اللي مش مصنفة وبيحاول يلاقي أنماط وتشابهات. لو عرف إن مجموعة صور شبه بعض وشبه الصور اللي اتصنفت كـ “قطة”، بيفترض إنهم قطط هم كمان. العملية دي بتتكرر وبيتحسن النموذج مع كل مرة.
الـ Semi-supervised Learning بيقع في النص بين:
- الـ Supervised Learning اللي محتاج كل البيانات تكون مصنفة
- الـ Unsupervised Learning اللي مش بيحتاج أي تصنيف خالص
وده بيخليه حل عملي جداً في الواقع لأن في أغلب الحالات بيكون عندنا بيانات كتير بس قليل منها مصنف.
مثال عملي
شركة بتعمل تطبيق لتصنيف تعليقات العملاء (إيجابي / سلبي / محايد). عندهم مليون تعليق بس مقدروش يصنفوا غير ٥٠٠٠ تعليق يدوياً. باستخدام الـ Semi-supervised Learning، النموذج بيتعلم من الـ ٥٠٠٠ المصنفين وبيستخدم الأنماط اللي اكتشفها عشان يصنف الـ ٩٩٥,٠٠٠ الباقيين بدقة عالية.
مصطلحات مرتبطة
- التعلم الموجّه (Supervised Learning)
- التعلم غير الموجّه (Unsupervised Learning)
- التعلم الذاتي الإشراف (Self-supervised Learning)
- التعلم النشط (Active Learning)
قرمصيص للأخبار أخبار الذكاء الاصطناعي بالعربي