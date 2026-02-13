قالت شركة "فليتو" المتخصصة في بيانات الذكاء الاصطناعي والحلول مؤخرا إنها أطلقت مشروعا جديدا لجمع البيانات الصوتية عالية الجودة باللغة العربية من أجل تعزيز معدل دقة التعرف على اللغات المتعددة في نماذج الذكاء الاصطناعي.

خاصة، يستهدف هذا المشروع رفع معدل التعرف المتدني على اللغة العربية التي تُعد واحدة من أصعب التحديات التي تواجه نماذج التعرف الآلي على الكلام واستيعاب الاختلافات بين اللهجات.

يشار إلى أن اللغة العربية تضم أكثر من 30 لهجة محلية منتشرة إلى جانب اللغة العربية الفصحى المعاصرة. كما أنها تتميز بظاهرة "التبديل اللغوي" المتكررة في المحادثات اليومية بحيث يمزج المتحدثون بين اللغة الفصحى واللهجات العامية بشكل مستمر. لهذا تُعد العربية من أصعب اللغات في بناء بيانات تدريب الذكاء الاصطناعي في الأوساط التقنية.

وتستغل شركة فليتو وظيفة "أركيد" وهي أداة لجمع البيانات الصوتية عبر تطبيقها الذكي لإطلاق مبادرات تهدف إلى جمع عينات صوتية باللغة العربية. وتقوم آلية العمل على قراءة المستخدمين لنصوص محددة وتسجيلها، ليقوم نظام الذكاء الاصطناعي بعد ذلك بتحليلها آليا وتصنيف نوع اللهجة التي يتحدث بها المستخدم.

وتتطلع الشركة من خلال عملية جمع البيانات الصوتية باللغة العربية هذه إلى بناء قواعد بيانات تدريبية دقيقة لا تقتصر على المعلومات الصوتية المجردة فحسب بل تعكس أيضا التنوع اللغوي المتمثل في أنماط التحدث والنبرات واختيار المفردات الخاصة بكل متحدث.

وتهدف هذه الخطوة إلى الحد من انحياز الذكاء الاصطناعي الناتج عن التفاوت في الموارد اللغوية المتاحة، وتطوير مجموعات بيانات قادرة على تحقيق معدلات تعرف عالية في بيئات الاستخدام الفعلي والواقعي.

وبهذه المناسبة أعربت الشركة عن أملها في أن تسهم في رفع جودة التعرف على اللغة العربية في نماذج الذكاء الاصطناعي العالمية إلى مستويات أعلى عبر بناء قاعدة بيانات تعكس الخصائص الفريدة للغة العربية وسياقات استخدامها الفعلي.