الأخبار

GPT-4 يختبر حدود الذكاء الاصطناعي في طب العيون

في إطار استكشاف إمكانيات تطبيقات الذكاء الاصطناعي في المجال الطبي، أظهرت دراسة حديثة أن نماذج اللغة الكبيرة مثل GPT-4 قد تكون لها مستقبل واعد في مجال طب العيون، غير أن هناك بعض القيود والمخاطر التي ما زالت تُثير القلق.

فقد قام باحثون في جامعة كامبريدج باختبار أداء GPT-4 وبعض نماذج اللغة الكبيرة الأخرى في اختبار افتراضي لأطباء العيون، وقد أجاب الذكاء الاصطناعي GPT-4 على 60 سؤال من أصل 87 بشكل صحيح، متفوقًا على مُعدل أداء الأطباء المتدربين (59.7) والأطباء الصغار (37)، إلا أنّه لم يصل بعد إلى مستوى الأطباء الاختصاصيين (66.4). أما النماذج الأخرى مثل PaLM 2 و GPT-3.5 فقد أظهرت أداءً أقل إقناعًا.

وعلى الرغم من هذه النتائج المشجعة، فإن الباحثين سلطوا الضوء على مخاطر كبيرة. على سبيل المثال، فإن محدودية عدد الأسئلة في الاختبار تُثير تساؤلات حول قابلية تعميم هذه النتائج.

والأهم من ذلك، أن نماذج اللغة الكبيرة عرضة لما يُعرف بـ «الهلوسة»، أي ابتكار معلومات مزيفة قد تؤدي إلى أخطاء في تشخيص حالات خطيرة مثل المياه البيضاء أو السرطان. إضافةً إلى أن غياب الدقة والحس الإنساني في هذه النماذج قد يؤدي إلى تفاقم دقة التشخيص.

وبالتالي، فإن هذه الدراسة تؤكد بقوة على الحاجة إلى مزيد من البحث والتطوير قبل أن تُعتبر نماذج اللغة الكبيرة أدوات موثوقة للتشخيص الطبي.

وبالنظر إلى المخاطر الكبيرة المرتبطة بأي شيء يتعلق بالتشخيص الطبي، من المتوقع أن يستغرق الأمر وقتًا طويلاً قبل أن يبدأ دمج هذه النماذج في الممارسات الطبية المعتادة.

اقتراح المُحرر


المصدر

زر الذهاب إلى الأعلى