باختصار
الـ Synthetic Data بيانات تولّدها نماذج AI بدل جمعها من العالم الحقيقي — حل ذكي لشُح البيانات وحماية الخصوصية.
بالتفصيل
تدريب نماذج AI محتاج ملايين أو مليارات نقطة بيانات. المشكلة: البيانات الحقيقية أحياناً شحيحة أو حساسة أو مكلفة التجميع.
Synthetic Data الحل: تستخدم نموذج AI (أو محاكاة) لتوليد بيانات اصطناعية تشبه البيانات الحقيقية في خصائصها. مستشفى عنده 1000 حالة طبية نادرة؟ يقدر يولّد 100,000 حالة اصطناعية للتدريب من غير انتهاك خصوصية المرضى.
من أهم استخدامات Synthetic Data في اللغة العربية: إنتاج حوارات وجمل عربية بلهجات متعددة لتدريب نماذج عربية أفضل.
مثال عملي
Waymo لتطوير سيارات ذاتية القيادة تولّد مليارات الكيلومترات من القيادة الافتراضية في محاكاة — بدل ما تضع سيارات حقيقية على الطريق لسنوات.
مصطلحات مرتبطة
Data Augmentation، GAN، Privacy-Preserving AI، Simulation
قرمصيص للأخبار أخبار الذكاء الاصطناعي بالعربي