إيه هو الـ Token؟ | رمز (توكن)

باختصار

الـ Token (رمز (توكن)) — أصغر وحدة نصّية بيتعامل معاها النموذج اللغوي — ممكن تكون كلمة كاملة أو جزء من كلمة أو علامة ترقيم.

بالتفصيل

زي ما المترجم الشاطر بيفهم المعنى مش بس الكلمات — النماذج اللغوية بتحاول تعمل نفس الحاجة.

معالجة اللغة الطبيعية من أقدم وأهم مجالات الذكاء الاصطناعي — والـ Token تقنية أساسية فيه. مع ظهور النماذج اللغوية الكبيرة (LLMs), المجال ده اتطور بشكل غير مسبوق. دلوقتي الآلات بتفهم السياق والنية والمشاعر ورا الكلام — مش بس الكلمات الحرفية.

مثال عملي

لما Google Translate بيترجملك مقال كامل من الإنجليزي للعربي في ثانية، أو لما ChatGPT بيفهم سؤالك ويرد بشكل منطقي — ورا الكواليس فيه تقنيات معالجة لغة زي الـ Token بتشتغل. من غير التقنيات دي، الآلات ما كانتش هتقدر تتعامل مع اللغة البشرية المعقّدة.

مصطلحات مرتبطة

شاهد أيضاً

إيه هو الـ TruthfulQA؟ | اختبار صدق الإجابات

باختصار الـ TruthfulQA (اختبار صدق الإجابات) — اختبار بيقيس مدى صدق إجابات النموذج — بيسأل …

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *