مصطلحات

إيه هو الـ Action Recognition؟ | التعرف على الأفعال

باختصار الـ Action Recognition (التعرف على الأفعال) — قدرة نظام الرؤية الحاسوبية إنه يفهم إيه الفعل اللي بيحصل في فيديو، زي إنه يعرف إن الشخص بيجري أو بيأكل أو بيلعب كورة. بالتفصيل من كاميرات المراقبة للسيارات ذاتية القيادة — إن الآلة تشوف وتفهم بقى ضروري. الرؤية الحاسوبية من المجالات اللي حققت تقدم مذهل في السنوات الأخيرة. الـ Action Recognition تقنية …

أكمل القراءة »

إيه هو الـ LiDAR؟ | ليدار

باختصار الـ LiDAR (ليدار) — تقنية استشعار بتستخدم أشعة ليزر عشان تقيس المسافات وتبني خريطة ثلاثية الأبعاد دقيقة جداً للمحيط، وبتُستخدم كتير في السيارات ذاتية القيادة. بالتفصيل من كاميرات المراقبة للسيارات ذاتية القيادة — إن الآلة تشوف وتفهم بقى ضروري. الرؤية الحاسوبية من المجالات اللي حققت تقدم مذهل في السنوات الأخيرة. الـ LiDAR تقنية بتخلّي الآلات تفهم المحتوى البصري — …

أكمل القراءة »

إيه هو الـ 3D Reconstruction؟ | إعادة البناء ثلاثي الأبعاد

باختصار الـ 3D Reconstruction (إعادة البناء ثلاثي الأبعاد) — تقنية بتاخد صور أو فيديوهات عادية وتبني منها نموذج ثلاثي الأبعاد كامل للمشهد أو الجسم اللي في الصور. بالتفصيل تخيّل إن الكمبيوتر يقدر يشوف ويفهم الصور والفيديوهات زي ما الإنسان بيعمل — بل أحيانًا أحسن. الرؤية الحاسوبية من المجالات اللي حققت تقدم مذهل في السنوات الأخيرة. الـ 3D Reconstruction تقنية بتخلّي …

أكمل القراءة »

إيه هو الـ Depth Estimation؟ | تقدير العمق

باختصار الـ Depth Estimation (تقدير العمق) — قدرة النموذج إنه يفهم بُعد كل عنصر في الصورة عن الكاميرا، يعني يحوّل صورة عادية ثنائية الأبعاد لخريطة عمق ثلاثية الأبعاد. بالتفصيل من كاميرات المراقبة للسيارات ذاتية القيادة — إن الآلة تشوف وتفهم بقى ضروري. الرؤية الحاسوبية من المجالات اللي حققت تقدم مذهل في السنوات الأخيرة. الـ Depth Estimation تقنية بتخلّي الآلات تفهم …

أكمل القراءة »

إيه هي الـ Pose Estimation؟ | تقدير الوضعية

باختصار الـ Pose Estimation (تقدير الوضعية) — تقنية رؤية حاسوبية بتحدد موقع مفاصل الجسم البشري في صورة أو فيديو، يعني بتفهم إزاي الشخص واقف أو بيتحرك. بالتفصيل تخيّل إن الكمبيوتر يقدر يشوف ويفهم الصور والفيديوهات زي ما الإنسان بيعمل — بل أحيانًا أحسن. الرؤية الحاسوبية من المجالات اللي حققت تقدم مذهل في السنوات الأخيرة. الـ Pose Estimation تقنية بتخلّي الآلات …

أكمل القراءة »

إيه هي الـ SLAM (Simultaneous Localization and Mapping)؟ | التوطين والخرائط المتزامنة

باختصار الـ SLAM (Simultaneous Localization and Mapping) (التوطين والخرائط المتزامنة) — تقنية بتخلّي الروبوت أو الجهاز يبني خريطة لبيئة مجهولة وفي نفس الوقت يحدّد موقعه فيها. بالتفصيل من كاميرات المراقبة للسيارات ذاتية القيادة — إن الآلة تشوف وتفهم بقى ضروري. الرؤية الحاسوبية من المجالات اللي حققت تقدم مذهل في السنوات الأخيرة. الـ SLAM تقنية بتخلّي الآلات تفهم المحتوى البصري — …

أكمل القراءة »

إيه هو الـ Sensor Fusion؟ | دمج المستشعرات

باختصار الـ Sensor Fusion (دمج المستشعرات) — تقنية بتجمع بيانات من مستشعرات مختلفة (كاميرا، ليدار، رادار) عشان تكوّن فهم أشمل للبيئة المحيطة — أساسية في السيارات ذاتية القيادة. بالتفصيل من كاميرات المراقبة للسيارات ذاتية القيادة — إن الآلة تشوف وتفهم بقى ضروري. الرؤية الحاسوبية من المجالات اللي حققت تقدم مذهل في السنوات الأخيرة. الـ Sensor Fusion تقنية بتخلّي الآلات تفهم …

أكمل القراءة »

إيه هي الـ Vision-Language Model (VLM)؟ | نموذج رؤية-لغة

باختصار الـ Vision-Language Model (VLM) (نموذج رؤية-لغة) — نموذج AI بيجمع بين فهم الصور وفهم اللغة — يقدر يوصف صور ويجاوب على أسئلة عنها ويحلّل محتواها البصري. بالتفصيل تخيّل إن الكمبيوتر يقدر يشوف ويفهم الصور والفيديوهات زي ما الإنسان بيعمل — بل أحيانًا أحسن. الرؤية الحاسوبية من المجالات اللي حققت تقدم مذهل في السنوات الأخيرة. الـ Vision-Language Model تقنية بتخلّي …

أكمل القراءة »

إيه هو الـ Multimodal AI؟ | الذكاء الاصطناعي متعدد الوسائط

باختصار الـ Multimodal AI (الذكاء الاصطناعي متعدد الوسائط) — نماذج AI بتقدر تفهم وتتعامل مع أنواع مختلفة من البيانات (نص + صورة + صوت + فيديو) في نفس الوقت — زي GPT-4o وGemini. بالتفصيل من كاميرات المراقبة للسيارات ذاتية القيادة — إن الآلة تشوف وتفهم بقى ضروري. الرؤية الحاسوبية من المجالات اللي حققت تقدم مذهل في السنوات الأخيرة. الـ Multimodal …

أكمل القراءة »

إيه هو الـ OCR (Optical Character Recognition)؟ | التعرف الضوئي على الحروف

باختصار الـ OCR (Optical Character Recognition) (التعرف الضوئي على الحروف) — تقنية بتحوّل النص المطبوع أو المكتوب بخط اليد في الصور لنص رقمي قابل للتعديل والبحث. بالتفصيل عينيك بتاخد معلومات من العالم حواليك كل ثانية — الـ Computer Vision بيحاول يدّي الآلات نفس القدرة. الرؤية الحاسوبية من المجالات اللي حققت تقدم مذهل في السنوات الأخيرة. الـ OCR تقنية بتخلّي الآلات …

أكمل القراءة »