إيه هي الـ Visual Question Answering (VQA)؟ | الإجابة البصرية على الأسئلة

باختصار

الـ Visual Question Answering (VQA) (الإجابة البصرية على الأسئلة) — نظام بيشوف صورة ويجاوب على أسئلة عنها بالكلام، زي ما تسأله “كام شخص في الصورة؟” أو “إيه لون العربية؟” ويجاوبك.

بالتفصيل

عينيك بتاخد معلومات من العالم حواليك كل ثانية — الـ Computer Vision بيحاول يدّي الآلات نفس القدرة.

الرؤية الحاسوبية من المجالات اللي حققت تقدم مذهل في السنوات الأخيرة. الـ Visual Question Answering تقنية بتخلّي الآلات تفهم المحتوى البصري — صور وفيديوهات ومستندات. التطبيقات بتتراوح من الطب (تحليل صور الأشعة) للأمن (كاميرات المراقبة الذكية) للترفيه (فلاتر السوشيال ميديا).

مثال عملي

افتح تطبيق Google Lens على موبايلك ووجّه الكاميرا على أي حاجة — نبتة، مبنى، نص بلغة ما تعرفهاش — والتطبيق هيتعرف عليها ويديك معلومات. في المستشفيات كمان، الأطباء بيستخدموا أنظمة رؤية حاسوبية بتحلّل صور الأشعة وبتكتشف أورام صغيرة ممكن العين البشرية ما تشوفهاش. الـ Visual Question Answering تقنية أساسية ورا كل ده.

مصطلحات مرتبطة

شاهد أيضاً

إيه هو الـ TruthfulQA؟ | اختبار صدق الإجابات

باختصار الـ TruthfulQA (اختبار صدق الإجابات) — اختبار بيقيس مدى صدق إجابات النموذج — بيسأل …

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *