شهد يوم 13 مايو 2024 حدثًا مفاجئًا في مدينة واشنطن هز عالم الذكاء الاصطناعي، حيث كشفت شركة OpenAI في مؤتمر كبير النقاب عن أحدث إبداعاتها علي الإطلاق نموذج GPT-4o، تم عرض الكثير من الميزات الرائعة في التحديث الجديد لهذا النموذج لم تكن متوقعة علي الإطلاق، يمتلك هذا النموذج المحدث قدرات متطورة اكثر من النموذج السابق GPT-4 في معالجة النصوص والملفات الصوتية والمرئيات كذلك، كما أعلنت مديرة شركة OpenAI عن اتاحة نموذج GPT-4O مجانًا للجميع عبر تطبيق ChatGPT ولن يكون محصورًا فقط للمستخدمين المشتركين بمقابل مادي. يعتبر نموذج GPT-4o خطوة هامة جدًا من أجل تعزيز التفاعل بين البشر والذكاء الصناعي، حيث يستطيع فهم النصوص والصوت والصور بشكل رائع وكذلك لديه المقدرة علي إنتاج تركيبات مختلفة من النصوص والصوت والصور، تبلغ سرعة استجابته لمدخلات الصوت حوالي 232 ملي ثانية! وهو ما يقرب من وقت استجابة الإنسان في المحادثة العادية، يتفوق هذا النموذج علي النماذج السابقة في فهم اللغة الإنجليزية بالإضافة إلي التحسن الكبير في قهم نصوص اللغات الأخرى. سيتمكن المستخدمين من الحصول مباشرة علي اجابات من مختلف مواقع الإنترنت، وكذلك رفع صور وطرح الأسئلة بخصوص تلك الصور حيث اصبح النموذج يفهم محتوي الصور بدقة تفوق الخيال! يتمكن للنموذج أيضًا إنشاء الرسوم البيانية وإجراء تحليل للبيانات، سيتم توفير نموذج GPT-4o أولًا للمستخدمين المشتركين بالخطة الشهرية بطبيعة الحال ثم بعد ذلك سيتم اتاحته للمستخدمين المجانين، سيتاح عدد محدد من المحادثات للمستخدمين المجانين، وبعد نفاذ المحادثات سيتم العودة تلقائيًا إلي نموذج GPT-3.5 العادي. الوصول سريعاً لـ : في الواقع قد تصدم القدرات الجديدة لنموذج GPT-4o الكثير من الأشخاص، حيث يمكنك التحدث مع هذا النموذج وكأنك تتحدث مع صديقك الذي يعرفك منذ أعوام! لا يقتصر التحديثات علي فهم المحادثة فقط بل أيضًا تم تحسين القدرة علي التحليل للوصول إلي اجابات دقيقة للغاية. في الفيديو بالأسفل بدأ هذا الشاب محادثة بسيطة مع GPT-4o وفهمه النموذج بدون مشاكل كانه يتحدث مع صديقه العزيز، تبدأ المحادثة بسؤال النموذج للشاب عن مكان تواجده وماذا يفعل، فيقوم الشاب بعرض المكان للنموذج سريعًا عن طريق الكاميرا الأمامية للهاتف، في نفس اللحظة يفهم النموذج البيئة التي يتواجد بها الشاب ويخبره بأنه في مكان ما من أجل الاستعداد لصناعة فيديو او القيام ببث مباشر او التجهيز لمؤتمر، يتبادل الطرفان المزيد من الكلام ويتوصل النموذج إلي ان الشاب سيقوم بالتجهيز من أجل إطلاق مؤتمر GPT-4o! ما ستقرأه في السطور القادمة ربما لن تصدقه، بل في الواقع اذا اتي لك شخص قبل عام من الان وأخبرك بان هناك برنامج محادثة قادر علي فعل الاتي قد تصفه بالجنون! ولكن بالفعل اصبح نموذج GPT-4o قادر بالفعل علي ذلك وسيتطور اكثر وتصبح قدراته غير محدودة، أهلًا بك في المستقبل! في هذا الفيديو تم تجربة قدرة النموذج علي التفاعل والتحدث مع نموذج ذكاء صناعي اخر علي هاتف مختلف، تم اعتبار النموذج الأول بانه شخص يرغب في استكشاف العالم من خلال عيون النموذج الثاني، يبدأ الرجل بشرح التجربة لكل نموذج بشكل منفرد علي حدة، يوافق النموذجان علي إجراء التجربة وتبدأ المحادثة بينهم، يسأل النموذج الأول عن ماذا يري النموذج الثاني بالضبط، يجيب النموذج الثاني بكل دقة ويصف له بالضبط ما يراه من خلال الكاميرا مثل ملابس الرجل والبيئة المحيطة في الغرفة التي يتم إجراء التجربة بها. يتم استكمال المحادثة بالسؤال عن معلومات اكثر عن الشخص الذي يقوم بالتجربة ويقوم النموذج الثاني بالإجابة بشكل دقيق يفوق التوقعات، تم تبادل المعلومات بشكل دقيق للغاية واصفًا ما يحدث وبدون ادني نسبة من الخطأ، لم تقتصر التجربة علي ذلك فقط، بل طلب الشخص من النموذج ان يقوم بغناء اغنية عن التجربة نفسها، ثم يتفاعل النموذج الثاني مع النموذج الأول ويقومان بالغناء عن التجربة! تخيل كل ذلك يحدث باستجابة فورية وبشكل دقيق لا يصدق، تخيل كم سيستغرق الوقت اذا طلبت ان يتم تأليف اغنية وتلحينها عن موقف ما من شخص عادي؟! ربما حقًا يجب علينا الخوف قليلًا من تلك القدرات. هذه التجربة فريدة للغاية حيث قام شاب يتحدث الإنجليزية بعمل محادثة سريعة مع شاب اخر يتحدث الاسبانية، قام النموذج بترجمة صوتية فورية بعد سماع كل جملة حتي يفهمها الطرف الأخر. في هذا الفيديو قام الشابان بأخبار النموذج بترجمة الجملة التي سيقولها الشخص الأول من الانجليزية إلي الاسبانية، وترجمة الجملة التي سيقولها الشخص الثاني من الاسبانية الي الانجليزية، وبدأت المحادثة وترجم النموذج الكلام بدقة بالغة وبسرعة مدهشة بين الطرفين، تخيل ان وظيفة مثل وظيفة المترجم قد تختفي في لمح البصر ويتم استبدالها ببديل ادق واسرع وافضل! في هذا الفيديو يطلب الأب من النموذج ان يقوم بتعليم ابنه الرياضيات عن طريق سؤاله بعض الأسئلة بخصوص درس معين ولكن دون إعطاء الإجابات له، يبدأ النموذج بسؤال الابن عن بعض الأسئلة عن الدرس الموجود ويقوم الطالب بالإجابة عن الطريق التفاعل علي الشاشة، يجيب الطالب عن إحدى الاسئلة بشكل خاطئ فيقوم النموذج بتصحيح الخطأ له بطريقة اكثر من رائعة، بعد ذلك يسأل نموذج GPT-4o الطالب عن بعض القواعد الرياضية، فيقوم الطالب بكتابتها علي شاشة التابلت ويتفاعل معه النموذج بشكل سلس وممتع للغاية! في هذا الفيديو طلب شخص من GPT-4o ان يقوم بوصف الأشياء التي سيعرضها له من خلال الكاميرا ولكن باللغة الإسبانية، قام النموذج بوصف دقيق وسريع للغاية لكل شيء فقد اراه الشاب تفاحة وموزة وكذلك بضع أقلام ورد عليه النموذج علي الفور بوصف ما رأه باللغة الإسبانية، يوجد بجانب الشاب فتاة تتحدث اللغة الاسبانية لتتأكد من ان الإجابات صحيحة، وبالفعل تم تأكيد صحة كل الكلمات. في مقطع الفيديو بالأسفل قام شخص بسؤال نموذج GPT-4o عن اقتراح لعبة يمكن ان يلعبها مع صديقته، اقترح النموذج لعبة حجرة ورقة مقص، بالتأكيد لم يتوقف الأمر هنا، طلب الشخص من النموذج ان يقوم بالتحكيم بينهم وإعلان الفائز، في المحاولتين الأولي والثانية تمكن النموذج من معرفة انهما متعادلان، وفي المحاولة الثالثة قام النموذج بالتعرف علي الطرف الفائز بالاسم، كل ذلك تم بطريقة حماسية وكأن هناك معلق بالفعل يقوم بالتعليق علي الأحداث. تخيل مثلًا انك في المستقبل القريب يمكنك ان تشاهد مباراة فريقك المفضل وأن تختار نموذج الذكاء الصناعي للتعليق علي تلك المباراة، وتختار نوع التعليق والصوت واللهجة، بالتأكيد سيكون الأمر غاية في المتعة. تخيل ان لديك مقابلة عمل لوظيفة احلامك ولديك بعض الأسئلة عن افضل طريقة لتقديم نفسك، سواء كنت تريد معرفة افضل الملابس التي يمكنك ارتدائها او حتي الأسئلة المحتملة وأفضل الأجوبة عليها، في هذا الفيديو يقوم شاب بسؤال النموذج عن ما إذا كانت ملابسه مناسبة لمقابلة عمل لوظيفة مهندس برمجيات في شركة OpenAI ويرد عليه النموذج باقتراحات رائعة. في هذا الفيديو يقوم شخص كفيف باستخدام GPT-4o ليصف له البيئة من حوله، في المشهد الأول يظهر الشخص أمام القصر الملكي ويوجه الكاميرا نحو القصر، ثم يسأل نموذج GPT-4o عن ما إذا كان الملك موجود بالقصر أم لا، يجيبه النموذج انه بما أن العلم مرفوع فوق القصر فذلك يعني ان الملك بالفعل داخل القصر الان، في المشهد الثاني يتجول الشخص فيما يشبه الحديقة ويطلب ان يصف النموذج له ماذا يوجد أمامه، فيخبره النموذج بحركة البجع في البحيرة امامه. اما في المشهد التالي يحدث شيء اقرب للخيال، بعد انتهاء الرجل من رحلته قرر ان يذهب إلي منزله عن طريق سيارة اجرة، وقف الرجل علي الرصيف وقام بتشغيل الكاميرا وتوجيهها للطريق، التقطت الكاميرا سيارة أجرة تأتي باتجاه الرجل فأخبرته بان يشير لها حتي تتوقف، وبالفعل تتوقف السيارة أمامه مباشرة ليركب هو وكلبه بكل سهولة بداخلها ليذهب لبيته. تأتي هذه الخاصية بالتعاون بين نموذج GPT-4o المحدث وتطبيق Be My Eyes الذي كان يتيح خاصية مشابهة ولكن عن طريق الاستعانة بأشخاص حقيقيين كانوا يتطوعوا لمساعدة المكفوفين علي أداء بعض المهمات والتعرف علي البيئة المحيطة بهم. في هذا الفيديو يوضح الشاب ان النموذج تطور بشكل هائل وأصبح التحدث معه سلس ورائع للغاية، حيث يرد النموذج عليه مباشرة بدون توقف، كما يمكن مقاطعة النموذج في وسط المحادثة لشرح او توضيح شيء ما، كما ان النموذج أيضًا تعرف علي الفور علي مشاعر الشخص وتفاعل معه بناء علي تلك المعلومات، وهذا الشيء مستحيل مع برامج المحادثة الأخرى. في هذه التجربة طلب الشاب من النموذج ان يروي قصة لصديقة بطريقة حماسية، بدأ نموذج GPT-4o بإلقاء قصة، ثم طلب منه الشاب ان يرويها بطريقة درامية أكثر، فاستجاب النموذج، بعد ذلك قاطعته الشابة وطلبت منه ان يروي القصة ولكن بصوت روبوت فاستجاب النموذج في الحال واكمل القصة بصوت روبوت، بعد ذلك قاطعه الشاب وطلب منه ان ينهي القصة في الحال ولكن بشكل غنائي وبالطبع تمت الاستجابة الفورية مما اذهل جميع الحاضرين. في هذا الفيديو يقوم الشاب بطلب المساعدة من نموذج GPT-4o لحل معادلة رياضية، قام الشاب بكتابة المعادلة علي ورقة أمامه ثم وجه الكاميرا نحو المعادلة ليتمكن النموذج من رؤيتها، بعد ذلك بدأ الشاب في حل المعادلة وسؤال النموذج عن رأيه في كل خطوة، قام النموذج بشرح الحل ومساعدة الشاب بطريقة رائعة علي حل المعادلة بالكامل. ليس ذلك فقط فقد قام صديق الشاب بسؤاله عن أهمية حل هذا النوع من المعادلات في الأساس، فقام النموذج بتوضيح اهمية المعادلات الرياضية واستخداماتها في حياتنا اليومية في مختلف المجالات وانها ليست من أجل النجاح في اختبار الرياضيات فقط. يمكن لنموذج GPT-4o مساعدة المبرمجين في كتابة الأكواد وحل المشكلات التي قد تواجههم، في هذا الفيديو قام الشاب بسؤال النموذج عن رأيه في الكود الذي أمامه، اخبره الشاب عن وظيفة الكود بالتفصيل، قام الشاب أيضًا بأخذ صورة بها بعض المعلومات علي شكل رسوم بيانية واعطاها للنموذج ليصف ما بها، قام النموذج بشرح ما بالصورة بشكل واضح ومرتب مما يدل علي ان النموذج قادر علي فهم الأكواد وفهم الرسوم البيانية بشكل تام وكأنه شخصًا حقيقيًا! بالتأكيد نموذج خارق مثل GPT-4o بكل ما يمتلكه من خصائص وذكاء يجب وضع حدود له للتأكد من انه أمن تمامًا، تم إنشاء وتدريب نموذج GPT-4o عن طريق الكثير من التقنيات الخاصة بتحسين السلوك وتحليل البيانات، تم أيضًا الوضع في الاعتبار احتياطات السلامة لضبط المخرجات الصوتية، تم إخضاع النموذج لاختبارات كثيرة من قبل أكثر من 70 خبيرًا في الكثير من المجالات الهامة مثل علم النفس حتي يتم ضمان تجربة رائعة وأمنة للمستخدمين. في النهاية يمكن القول بأن هذا الإصدار الجديد من شركة OpenAI يمثل طفرة في عالم الذكاء الصناعي، إمكانيات وخصائص كهذه لم نكن نحلم بوجودها علي أرض الواقع، كان أقصي شيء هو رؤية تلك الإمكانيات في أفلام الخيال العلمي فقط، كنا نتخيل ان ذلك لربما يحدث بعد مئات من السنين في العام 3000! ولكن ها نحن هنا وصلنا إلي المستقبل الذي يبدو شيقًا ورائعًا ولكنه مخيف في نفس الوقت، تذكر يا صديقي انها البداية فقط في عالم الذكاء الصناعي ومازال هناك الكثير من التحديثات والتطورات التي سنراها في المستقبل القريب التي ربما ستقلب كل شيء رأسًا علي عقب! المصدر الأصلي : عرفني
مشاركة :