باختصار
التعلّم الفيدرالي أو الـ Federated Learning هو أسلوب تدريب بيخلّي أجهزة متعددة تدرّب النموذج محليًا وتشارك التحديثات بس — من غير ما البيانات الأصلية تطلع من الجهاز. كده بتدرّب نموذج قوي وفي نفس الوقت بتحافظ على خصوصية المستخدمين.
بالتفصيل
تخيّل إن مجموعة مستشفيات عايزين يبنوا نموذج ذكاء اصطناعي يشخّص مرض معين. المشكلة إن كل مستشفى عندها بيانات مرضى حسّاسة مش ممكن تبعتها لمكان تاني — ده غير القوانين اللي بتمنع ده. الحل؟ بدل ما البيانات تروح للنموذج، النموذج هو اللي بيروح للبيانات! ده بالظبط فكرة الـ Federated Learning.
الطريقة بتشتغل في خطوات:
- سيرفر مركزي بيبعت نسخة من النموذج لكل جهاز أو مؤسسة
- كل جهاز بيدرّب النموذج على بياناته المحلية
- كل جهاز بيبعت التحديثات بس (التعديلات على المعاملات) للسيرفر المركزي
- السيرفر بيجمّع التحديثات من كل الأجهزة ويدمجهم في نموذج واحد محسّن
- العملية بتتكرر لحد ما النموذج يوصل لمستوى كويس
الميزة الأساسية هنا إن البيانات الحقيقية مبتسيبش الجهاز أبدًا. اللي بيتنقل هو تعديلات رياضية على النموذج مش البيانات نفسها. ده مهم جدًا في مجالات زي الصحة والبنوك والتأمين اللي فيها بيانات حسّاسة.
Google كانت من أوائل الشركات اللي استخدمت الـ Federated Learning على نطاق واسع في كيبورد Gboard على الموبايلات. بدل ما يجمعوا كل اللي الناس بتكتبه على سيرفراتهم، كل موبايل بيتعلم محليًا من طريقة كتابة صاحبه وبيبعت التحديثات بس. كده الكيبورد بيتحسن للكل من غير ما حد يعرف إنت بتكتب إيه.
التحديات بتاعة الـ Federated Learning إن التواصل بين الأجهزة بياخد وقت، والأجهزة المختلفة ممكن يكون عندها بيانات مختلفة جدًا في النوع والحجم، وده بيأثر على جودة التدريب.
مثال عملي
لو مجموعة بنوك في مصر عايزين يبنوا نظام كشف احتيال (fraud detection) بالذكاء الاصطناعي، مش ممكن يشاركوا بيانات عملاءهم مع بعض. بالـ Federated Learning، كل بنك بيدرّب النموذج على بياناته لوحده وبيبعت التحديثات بس. النتيجة نموذج اتعلم من بيانات كل البنوك من غير ما أي بنك يشوف بيانات التاني.
مصطلحات مرتبطة
- بيانات التدريب (Training Data)
- تراكم التدرجات (Gradient Accumulation)
- بيانات اصطناعية (Synthetic Data)
- تعلّم الآلة (Machine Learning)
قرمصيص للأخبار أخبار الذكاء الاصطناعي بالعربي