تمكّن علماء في جامعة أوكسفورد البريطانية من تطوير جهاز يمكنه قراءة لغة الشفاه أفضل من البشر. ويعمل نظام الذكاء الاصطناعي «ليب نت» من خلال متابعة مقطع مصور لحديث أشخاص، ويقارن النص بحركة أفواههم بدقة تصل إلى 93 في المئة. وأشار الباحثون إلى أن الاستعانة بهذا الجهاز يمكن أن تساعد ملايين الأشخاص، لكنهم أوضحوا أنه ما زال في حاجة إلى الاختبار في مواقف الحياة الحقيقية، وفق تقرير نشره موقع «بي بي سي». وتمثل قراءة الشفاه عملية معقدة، إذ يتمكن المتخصصون في هذا المجال فقط من فك شيفرة ما يقوله الشخص بواسطتها بنسبة دقة تصل إلى 60 في المئة. وقال الباحثون إن «قارئ لغة الشفاه الآلي يتمتع بفرص نجاح كبيرة مع وجود التطبيقات التي تتعلق بأجهزة المساعدة في تحسين السمع والإملاء الصامت في الأماكن العامة والمحادثات السرية وفهم الكلام في البيئات الصاخبة وتحديد الهوية بأجهزة القياس الحيوية ومعالجة الأفلام الصامتة». وأشاروا إلى أن نظام الذكاء الاصطناعي زوِّد جملاً كاملة حتى يتسنى له التعرف إلى الأحرف التي تتناغم مع حركة الشفتين. وفي إطار الاختبار، زود فريق البحث من معمل الذكاء الاصطناعي التابع لجامعة أوكسفورد نظام الذكاء الاصطناعي 29 ألف مقطع فيديو، وأضاف إليها النص الصحيح. وكانت مدة كل مقطع ثلاث ثوان يتبعها نمط قواعد نحوية متماثل. وفي حين أن الباحثين توصلوا إلى أن نسبة الخطأ في الاختبارات التي أجريت على أشخاص زوّدوا مقاطع الفيديو نفسها بلغت 47.7 في المئة، فإن نظام الذكاء الاصطناعي سجل خطأ واحداً فقط. وأثارت حقيقة أن هذا النظام الآلي يستند إلى مقاطع فيديو متخصصة للتدريب، انتقادات لهذا البحث. وقال البروفيسور نيل لورانس أستاذ «التعلم الآلي وعلم الأحياء الحسابي» في مقال له على موقع مؤسسة «أوبن ريفيو» العلمية، إن مقاطع الفيديو تتمتع «بمفردات محدودة وقواعد تركيب نحوية وحيدة». وأضاف: «رغم أنه أمر واعد أن تأتي هذه الاختبارات بنتائج جيدة، فإن هذا النظام لا يمثل اختراقاً في واقع الأمر. ورغم أن هذا النموذج يمكنه قراءة لغة الشفاه أفضل من البشر، فإنه يستطيع أن يفعل ذلك فقط حين أقول قائمة من الكلمات ليس لها معنى من مفردات مقيدة للغاية وبترتيب محدد».
مشاركة :