لحظة فارقة.. ChatGPT يجتاز اختبار الترخيص الطبي الأمريكي 

  • 2/11/2023
  • 18:10
  • 4
  • 0
  • 0
news-picture

يمر برنامج AI للمحادثة ChatGPT بلحظة فارقة، حيث يعد بتحويل جذري في الطرق التي ننتج بها نصًا مكتوبًا، ونبحث في الويب، ونثقف أنفسنا، إذ أوشك على اجتياز الترخيص الطبي الأمريكي (USMLE). ويتطلب هذا الترخيص عادةً حوالي 300 إلى 400 ساعة من التحضير لإكماله ويغطي كل شيء من مفاهيم العلوم الأساسية إلى أخلاقيات البيولوجيا. USMLE هو في الواقع 3 اختبارات في واحد، والكفاءة التي يستطيع بها ChatGPT الإجابة على أسئلته تظهر أن روبوتات الذكاء الاصطناعي هذه يمكن أن تكون ذات يوم مفيدة للتدريب الطبي وحتى لإجراء أنواع معينة من التشخيصات. وكتب الباحثون في ورقتهم المنشورة: "أجرى ChatGPT الاختبار عند أو بالقرب من عتبة النجاح في جميع الاختبارات الثلاثة دون أي تدريب أو تعزيز متخصص"، في دارسة نشرت في PLOS Digital Health. وتابعوا: "بالإضافة إلى ذلك، أظهر ChatGPT مستوى عالٍ من التوافق والبصيرة في تفسيراته". ChatGPT هو نوع من الذكاء الاصطناعي يُعرف باسم نموذج اللغة الكبير أو LLM. تم تصميم LLMs بشكل خاص نحو الردود المكتوبة، ومن خلال كميات هائلة من عينات النص وبعض الخوارزميات الذكية، يمكنها عمل تنبؤات حول الكلمات التي يجب أن تتجمع معًا في جملة. ولا يعرف ChatGPT أي شيء في الواقع، ولكن من خلال تحليل كمية هائلة من المواد عبر الإنترنت، يمكنه بناء جمل تبدو معقولة حول أي موضوع تقريبًا. ومع ذلك، فإن "الإجابة المعقولة" هي المفتاح لقياس مستوى قدرات التطبيق الظاهرة. فاعتمادًا على احتمالية الصياغة المختلفة، يمكن أن يبدو الذكاء الاصطناعي ذكيًا بشكل غير معقول أو يتوصل إلى أكثر الاستنتاجات سخافة. اختبره باحثون من شركة Ansible Health الناشئة باستخدام عينة من الأسئلة من USMLE، بعد أن تحققوا من أن الإجابات لم تكن متاحة على Google؛ لذلك عرفوا أن ChatGPT سيولد ردودًا جديدة بناءً على البيانات التي تم التدريب عليها. عند الاختبار، سجل ChatGPT بين 52.4% و 75% عبر الاختبارات الثلاثة (عادة ما تكون علامة النجاح حوالي 60%). في 88.9% من ردوده، أنتج على الأقل فكرة مهمة واحدة - وصفها الباحثون بأنها "جديدة وغير واضحة وصالحة إكلينيكيًا". قال مؤلفو الدراسة في بيان صحفي: "الوصول إلى درجة النجاح في هذا الاختبار المعروف بالصعوبة، والقيام بذلك دون أي تعزيز بشري، يمثل علامة بارزة في النضج السريري للذكاء الاصطناعي". وأثبت ChatGPT أيضًا أنه متسق بشكل مثير للإعجاب في إجاباته وكان قادرًا على تقديم المنطق وراء كل استجابة. كما أنه تفوق على معدل الدقة البالغ 50.3% لـ PubMedGPT، وهو روبوت مدرب خصيصًا على الأدبيات الطبية. من الجدير بالذكر أن المعلومات التي تم تدريب ChatGPT عليها ستتضمن معلومات غير دقيقة: إذا سألت الروبوت نفسه، فسوف يعترف بالحاجة إلى مزيد من العمل لتحسين موثوقية LLMs. يشير المختصون إلى أنه لن يحل محل المهنيين الطبيين في أي وقت في المستقبل المنظور. مع ذلك، من الواضح أن إمكانية تحليل المعرفة عبر الإنترنت ضخمة، خاصة وأن روبوتات الذكاء الاصطناعي هذه تستمر في التحسن في السنوات القادمة. وبدلاً من استبدال البشر في مهنة الطب، يمكن أن يصبحوا مساعدين حيويين لهم. وكتب الباحثون: "تشير هذه النتائج إلى أن النماذج اللغوية الكبيرة قد يكون لديها القدرة على المساعدة في التعليم الطبي، وربما اتخاذ القرارات السريرية".

مشاركة :