آخر المقالات

إيه هو الـ Diffusion Transformer (DiT)؟ | محوّل الانتشار

باختصار الـ Diffusion Transformer (DiT) (محوّل الانتشار) — دمج بين تقنية الـ Diffusion والـ Transformer — بدل ما نستخدم U-Net لتوليد الصور، بنستخدم Transformer وده بيدّي نتايج أحسن وبيتوسّع أسهل، وهو الأساس ورا نماذج زي SORA. بالتفصيل تخيّل إنك بتبني مصنع — كل قسم فيه وظيفة معينة وبيتعاون مع الأقسام التانية. الشبكات العصبية بتشتغل بنفس المبدأ. اختيار المعمارية الصح بيفرق …

أكمل القراءة »

إيه هو الـ Perceiver؟ | المُدرِك

باختصار الـ Perceiver (المُدرِك) — معمارية من DeepMind بتقدر تتعامل مع أي نوع بيانات — صور، صوت، نصوص، فيديو — كلّه بنفس البنية، من غير ما تحتاج تصميم مخصوص لكل نوع. بالتفصيل تخيّل إنك بتبني مصنع — كل قسم فيه وظيفة معينة وبيتعاون مع الأقسام التانية. الشبكات العصبية بتشتغل بنفس المبدأ. اختيار المعمارية الصح بيفرق كتير في أداء النموذج. الـ …

أكمل القراءة »

إيه هو الـ Flow Matching؟ | مطابقة التدفّق

باختصار الـ Flow Matching (مطابقة التدفّق) — تقنية لتوليد الصور بتشتغل عن طريق إنها تتعلّم “مسار” بيحوّل التشويش العشوائي لصورة واضحة — أبسط رياضيًا من الـ Diffusion وبتدّي نتايج بنفس الجودة. بالتفصيل تخيّل إنك بتبني مصنع — كل قسم فيه وظيفة معينة وبيتعاون مع الأقسام التانية. الشبكات العصبية بتشتغل بنفس المبدأ. اختيار المعمارية الصح بيفرق كتير في أداء النموذج. الـ …

أكمل القراءة »