آخر المقالات

إيه هي الـ Visual Question Answering (VQA)؟ | الإجابة البصرية على الأسئلة

باختصار الـ Visual Question Answering (VQA) (الإجابة البصرية على الأسئلة) — نظام بيشوف صورة ويجاوب على أسئلة عنها بالكلام، زي ما تسأله “كام شخص في الصورة؟” أو “إيه لون العربية؟” ويجاوبك. بالتفصيل عينيك بتاخد معلومات من العالم حواليك كل ثانية — الـ Computer Vision بيحاول يدّي الآلات نفس القدرة. الرؤية الحاسوبية من المجالات اللي حققت تقدم مذهل في السنوات الأخيرة. …

أكمل القراءة »

إيه هو الـ Image Captioning؟ | وصف الصور

باختصار الـ Image Captioning (وصف الصور) — مهمة إن النموذج يبص على صورة ويكتب وصف نصي ليها بلغة طبيعية، يعني يحوّل الصورة لجملة بتوصف اللي فيها. بالتفصيل تخيّل إن الكمبيوتر يقدر يشوف ويفهم الصور والفيديوهات زي ما الإنسان بيعمل — بل أحيانًا أحسن. الرؤية الحاسوبية من المجالات اللي حققت تقدم مذهل في السنوات الأخيرة. الـ Image Captioning تقنية بتخلّي الآلات …

أكمل القراءة »

إيه هو الـ Action Recognition؟ | التعرف على الأفعال

باختصار الـ Action Recognition (التعرف على الأفعال) — قدرة نظام الرؤية الحاسوبية إنه يفهم إيه الفعل اللي بيحصل في فيديو، زي إنه يعرف إن الشخص بيجري أو بيأكل أو بيلعب كورة. بالتفصيل من كاميرات المراقبة للسيارات ذاتية القيادة — إن الآلة تشوف وتفهم بقى ضروري. الرؤية الحاسوبية من المجالات اللي حققت تقدم مذهل في السنوات الأخيرة. الـ Action Recognition تقنية …

أكمل القراءة »