مصطلحات

إيه هو الـ Mixture of Experts (MoE)؟ | مزيج الخبراء

باختصار الـ Mixture of Experts (MoE) (مزيج الخبراء) — بنية نموذج فيها عدة شبكات “خبيرة” متخصّصة، وموجّه (router) بيختار أي خبراء يشتغلوا على كل مدخل. بيدّي أداء نموذج كبير بتكلفة حسابية أقل. بالتفصيل المعمارية الصح بتفرق زي ما التصميم الهندسي الصح بيخلّي المبنى يستحمل الزلازل — المعمارية بتحدد قوة النموذج. اختيار المعمارية الصح بيفرق كتير في أداء النموذج. الـ Mixture …

أكمل القراءة »

إيه هي الـ Hybrid Architecture؟ | بنية هجينة

باختصار الـ Hybrid Architecture (بنية هجينة) — تصميم نموذج بيجمع بين بنيتين أو أكتر (مثلًا Transformer + Mamba) عشان يستفيد من مميزات كل واحدة. بالتفصيل تخيّل إنك بتبني مصنع — كل قسم فيه وظيفة معينة وبيتعاون مع الأقسام التانية. الشبكات العصبية بتشتغل بنفس المبدأ. اختيار المعمارية الصح بيفرق كتير في أداء النموذج. الـ Hybrid Architecture معمارية أو مكوّن بيأثر على …

أكمل القراءة »

إيه هو الـ LSTM (Long Short-Term Memory)؟ | الذاكرة الطويلة قصيرة المدى

باختصار الـ LSTM (Long Short-Term Memory) (الذاكرة الطويلة قصيرة المدى) — نوع من الشبكات العصبية المتكرّرة متصمّم إنه يفتكر المعلومات لفترات طويلة — فيه بوابات بتتحكّم إيه اللي يتحفظ وإيه اللي يتنسى، وده بيخلّيه شاطر في تحليل النصوص والسلاسل الزمنية. بالتفصيل زي ما المعماري بيصمّم مبنى بطبقات وغرف مختلفة — مهندسين الـ AI بيصمّموا شبكات عصبية بمعماريات مختلفة. اختيار المعمارية …

أكمل القراءة »

إيه هي الـ RNN (Recurrent Neural Network)؟ | شبكة عصبية تكرارية

باختصار الـ RNN (Recurrent Neural Network) (شبكة عصبية تكرارية) — شبكة عصبية مصمّمة للبيانات المتسلسلة (زي النصوص والأصوات)، عندها “ذاكرة” بتسمح لها تفتكر معلومات سابقة. حلّ مكانها الـ Transformer في معظم التطبيقات. بالتفصيل المعمارية الصح بتفرق زي ما التصميم الهندسي الصح بيخلّي المبنى يستحمل الزلازل — المعمارية بتحدد قوة النموذج. اختيار المعمارية الصح بيفرق كتير في أداء النموذج. الـ RNN …

أكمل القراءة »

إيه هو الـ Small Language Model (SLM)؟ | نموذج لغوي صغير

باختصار الـ Small Language Model (SLM) (نموذج لغوي صغير) — نموذج لغوي بمعاملات أقل (عادةً أقل من 10 مليار) مصمّم يشتغل على أجهزة محلية أو حالات استخدام محدّدة بكفاءة عالية — زي Phi وGemma. بالتفصيل تخيّل إنك بتبني مصنع — كل قسم فيه وظيفة معينة وبيتعاون مع الأقسام التانية. الشبكات العصبية بتشتغل بنفس المبدأ. اختيار المعمارية الصح بيفرق كتير في …

أكمل القراءة »

إيه هو الـ Point Cloud؟ | سحابة النقاط

باختصار الـ Point Cloud (سحابة النقاط) — مجموعة نقاط في الفضاء ثلاثي الأبعاد كل نقطة ليها إحداثيات، وبتمثّل شكل سطح جسم أو مشهد كامل، وبتُستخدم كتير مع LiDAR والمسح ثلاثي الأبعاد. بالتفصيل تخيّل إن الكمبيوتر يقدر يشوف ويفهم الصور والفيديوهات زي ما الإنسان بيعمل — بل أحيانًا أحسن. الرؤية الحاسوبية من المجالات اللي حققت تقدم مذهل في السنوات الأخيرة. الـ …

أكمل القراءة »

إيه هو الـ Optical Flow؟ | التدفق البصري

باختصار الـ Optical Flow (التدفق البصري) — تقنية بتحسب حركة كل بكسل بين إطارين متتاليين في فيديو، عشان تفهم اتجاه وسرعة الحركة في المشهد. بالتفصيل من كاميرات المراقبة للسيارات ذاتية القيادة — إن الآلة تشوف وتفهم بقى ضروري. الرؤية الحاسوبية من المجالات اللي حققت تقدم مذهل في السنوات الأخيرة. الـ Optical Flow تقنية بتخلّي الآلات تفهم المحتوى البصري — صور …

أكمل القراءة »

إيه هو الـ SAM (Segment Anything Model)؟ | نموذج تقسيم أي شيء

باختصار الـ SAM (Segment Anything Model) (نموذج تقسيم أي شيء) — نموذج من Meta بيقدر يقطّع أي صورة ويفصل كل عنصر فيها لوحده بدقة عالية، من غير ما يكون متدرب على النوع ده من الصور قبل كده. بالتفصيل عينيك بتاخد معلومات من العالم حواليك كل ثانية — الـ Computer Vision بيحاول يدّي الآلات نفس القدرة. الرؤية الحاسوبية من المجالات اللي …

أكمل القراءة »

إيه هي الـ Visual Question Answering (VQA)؟ | الإجابة البصرية على الأسئلة

باختصار الـ Visual Question Answering (VQA) (الإجابة البصرية على الأسئلة) — نظام بيشوف صورة ويجاوب على أسئلة عنها بالكلام، زي ما تسأله “كام شخص في الصورة؟” أو “إيه لون العربية؟” ويجاوبك. بالتفصيل عينيك بتاخد معلومات من العالم حواليك كل ثانية — الـ Computer Vision بيحاول يدّي الآلات نفس القدرة. الرؤية الحاسوبية من المجالات اللي حققت تقدم مذهل في السنوات الأخيرة. …

أكمل القراءة »

إيه هو الـ Action Recognition؟ | التعرف على الأفعال

باختصار الـ Action Recognition (التعرف على الأفعال) — قدرة نظام الرؤية الحاسوبية إنه يفهم إيه الفعل اللي بيحصل في فيديو، زي إنه يعرف إن الشخص بيجري أو بيأكل أو بيلعب كورة. بالتفصيل من كاميرات المراقبة للسيارات ذاتية القيادة — إن الآلة تشوف وتفهم بقى ضروري. الرؤية الحاسوبية من المجالات اللي حققت تقدم مذهل في السنوات الأخيرة. الـ Action Recognition تقنية …

أكمل القراءة »