لعبة إلكترونية تكشف قدرة الذكاء الاصطناعي على هزيمة البشر

  • 6/2/2019
  • 00:00
  • 9
  • 0
  • 0
news-picture

صمم فريق من المبرمجين في شركة بريطانية للذكاء الاصطناعي لاعبين آليين في لعبة “كويك 3 أرينا” تمكنوا من الانتصار بانتظام على مجموعة لاعبين من البشر. وتشكل نتيجة عمل الباحثين في شركة “ديب مايند” التي تملكها مجموعة “ألفابت” الشركة الأم لغوغل، سابقة في هذا المجال. وأثبتت الكمبيوترات حتى الآن مرارا وتكرارا تفوقها على البشر في ألعاب فردية مثل الشطرنج منذ تغلب كمبيوتر “ديب بلو” من شركة “آي.بي.أم” على بطل العالم السابق غاري كاسباروف في 1997. وفي العام 2017، تغلب لاعب آلي يتحلى بذكاء اصطناعي من غوغل على اللاعب المصنف أولا في العالم في لعبة “غو”. لكن القدرة على المواجهة في لعبة يشارك فيها لاعبون عدة وتقوم على العمل الجماعي والتفاعل في بيئات معقدة، كانت حتى الآن مهمة مستحيلة. وفي إطار هذه الدراسة، عمل الفريق بقيادة ماك جادربرغ على نسخة معدلة من لعبة “كويك 3 أرينا” التي أطلقت للمرة الأولى العام 1999 لكنها لا تزال تلقى رواجا في مسابقات الألعاب الإلكترونية. واختار الفريق فئة “كابتشر ذي فلاغ” (الاستيلاء على العلم) في اللعبة التي تقوم على العمل ضمن فريق لانتزاع علم الفريق الخصم مع المحافظة على علمه الخاص ما يرغم اللاعبين على وضع استراتيجيات معقدة تمزج بين الدفاع والهجوم. وبعد تلقي العناصر الآلية التدريبات اللازمة، تواجهت مع مجربي ألعاب محترفين. وكتب الفريق “حتى بعد 12 ساعة من الممارسة، لم يتمكن الفريق البشري من الفوز إلا بـ25 بالمئة من المواجهات مع الفريق الآلي”. وبقي ميزان الربح والخسارة لصالح فريق الذكاء الاصطناعي حتى عندما تم إبطاء سرعة تفاعله وخفض قدرته على التصويب. واستند المبرمجون إلى ما يعرف “بالتعليم المعزز” لإضفاء الذكاء على اللاعبين الآليين. وأوضح جادربرغ “في البداية، لم يكن اللاعبون الآليون يعرفون شيئا وكانوا يتحركون بشكل عشوائي في كل الاتجاهات”. ومنح اللاعبون الآليون مكافأة لأنفسهم عند استيلائهم على العلم، لكن الفريق استحدث أيضا سلسلة من الوسائل الجديدة والابتكارية لتوسيع حدود ما هو ممكن من خلال التعليم المعزز. وأضاف جادربرغ “لقد ساهمت هذه الدراسة خصوصا في إظهار أن كل لاعب يستحدث نظامه الخاص للمكافأة الداخلية”، أي أن اللاعبين المجهزين بالذكاء الاصطناعي حددوا بأنفسهم قيمة المهمات المنجزة مثل الاستيلاء على العلم أو إصابة الخصم. وبعد ذلك، تبين للمبرمجين أن تدريب مجموعة من اللاعبين الآليين معا بدلا من التدريب الانفرادي يجعل هذه المجموعة تتعلم بسرعة أكبر. واستحدث المبرمجون كذلك هندسة جديدة لما يعرف بالتعلم “بسرعتين مختلفتين”. وأوضح جادربرغ “لدينا جزء من اللاعب يتفاعل بسرعة كبيرة ويحدّث بياناته بسرعة، ولدينا جزء آخر من اللاعب يحدّث بياناته بسرعة أقل. نوعا البيانات يؤثران على بعضهما بعضا ويحددان نظرة اللاعب إلى العالم”. وقال “نحن نستخدم الألعاب كبيئة فيها تحديات للغوص في مفاهيم عامة مثل التخطيط والاستراتيجية والذاكرة التي نعتبرها أساسية في تطوير برامج حسابية تساعدنا على حل مشكلات في العالم الفعلي”.

مشاركة :