فشل في حل المسائل المعقدة.. شات جي بي تي ضعيف في الرياضيات

5/3/2023
13:15
4
0
0

نقل من موقع

على الرغم من القلق المتزايد بشأن قدرة الذكاء الاصطناعي التوليدية على إحداث الفوضى في أسواق العمل العالمية، قد يكون المحاسبون وفئات أخرى قادرين على تنفس الصعداء، بسبب قلة فعالية الروبوت في مواجهة العقل البشري بشكله الاعتيادي، وعدم استجابته بشكل كفؤ لحل المسائل المعقدة، وفق ما ذكرت شبكة "فوكس نيوز" الأمريكية، في الموضوع الذي ترجمت "اليوم" أبرز ما جاء فيه. وقالت الشبكة: "أثار نموذج الذكاء الاصطناعي شات جي بي تي ChatGPT، وهو روبوت دردشة مدعوم بالذكاء الاصطناعي أصبح الأسرع نموًا والأكثر شهرة حتى الآن، مخاوف بشأن قدرته على مساعدة الطلاب على الغش في الدورات الدراسية ومواد الاختبار وخاصة الرياضيات". واجتاز الروبوت امتحانات دراسية بنسبة بلغت 90 %، واجتاز 13 من 15 اختبار. ولهذا، فقد تم إيقافه للطلاب في بعض المناطق الأمريكية، حتى لايؤثر سلبًا على قدرات الطلاب. وأشار ديفيد وود، أستاذ المحاسبة بجامعة بريجهام يونج، إلى أنه "عندما ظهرت هذه التكنولوجيا لأول مرة، كان الجميع قلقًا من أن الطلاب يمكنهم الآن استخدامها للغش. لكن فرص الغش كانت موجودة دائمًا. لذلك بالنسبة لنا، نحاول التركيز على ما يمكننا فعله بهذه التكنولوجيا". ومع ذلك ، وجدت دراسة قادها وود لاحقًا، أن الذكاء الاصطناعي يعاني لفهم العمليات الرياضية. وسعت دراسة وود إلى اختبار كفاءة "شات جي بي تي" في إكمال اختبارات المحاسبة مقارنة بطلاب المحاسبة الفعليين. وتم تقديم 25181 سؤالاً حول نظم المعلومات، والتدقيق، والمحاسبة المالية، والمحاسبة الإدارية، والضرائب من 186 مؤسسة تعليمية في 14 دولة. تم أيضًا إدخال 2268 سؤالًا بنكيًا، وكلها لم يبلي فيها الروبوت بلاءً حسنًا. وتم تقديم الأسئلة في أشكال مختلفة مع مستويات متفاوتة من الصعوبة، وباستخدام مزيج من الاختيار بين الصواب والخطأ، والاجابات المقالية. وجدت الدراسة أن الطلاب سجلوا درجات أعلى من "شات جي بي تي"، متجاوزين روبوت المحادثة بأكثر من 30٪، حيث سجلوا متوسط 76.7٪ مقابل 47.4٪ للربوت. وتفوق التطبيق على الطلاب في 11.3٪ من الأسئلة، لا سيما تلك المتعلقة بالمراجعة ونظم المعلومات المحاسبية. لكن روبوت الدردشة كان أكثر مهارة في الإجابة على أسئلة الاختيار من متعدد والأسئلة الصحيحة والخاطئة، حيث سجل 59.5٪ و68.7٪ في كل منهما على التوالي. ومع ذلك، كان أداؤه أقل بكثير في الأسئلة ذات الإجابات القصيرة الكتابية، حيث سجل فقط معدلاً بين 28.7٪ و39.1٪.