آیا هوش مصنوعی میتواند پزشکان را از خطاهای تشخیصی نجات دهد؟
پژوهشگران در یک مطالعه جدید، به بررسی این موضوع پرداختهاند که آیا مدلهای زبانی بزرگ (LLMs) میتوانند مواردی که پزشک دچار خطای تشخیصی شده را شناسایی کنند یا خیر؟
محققان اطلاعات بیماران (۲۸۸ پرونده) را به چندین مدل هوش مصنوعی از جمله نسخه ۴ کلود سونت (Claude Sonnet)، جمینای ۳ پرو و نسخههای مختلف جیپیتی ۵ دادند. نتایج نشان داد که مدل کلود سونت ۴ بهترین عملکرد و جیپیتی ۵ مینی ضعیفترین عملکرد را داشتند.
اما در اینجا با یک شمشیر دولبه روبهرو بودیم:
- تقابل حساسیت و ویژگی (specificity): مدلهایی که حساسیت بالاتری دارند، تشخیصهای جاافتاده بیشتری را پیدا میکنند، اما همزمان هشدارهای اشتباه (مثبت کاذب) بیشتری هم میدهند.
- احتمال از بین رفتن اعتماد: اگر هوش مصنوعی مدام هشدارهای اشتباه بدهد، پزشکان خیلی زود به آن بیتوجه میشوند (شبیه چوپان دروغگویی که دیگر کسی حرفش را باور نمیکند!).
یک شیفت کاری فرضی با دستیار هوشمند
تصور کنید در یک شیفت اورژانس میخواهید ۱۰۰ بیمار را ویزیت کنید. بر اساس مدلهای هوش مصنوعی استفاده شده در این پژوهش، وضعیت اینگونه خواهد بود:
- برای حدود ۴۸ بیمار، سیستم به شما هشدار میدهد که دوباره پرونده را بررسی کنید.
- از این تعداد، فقط ۹ هشدار واقعاً درست است و شما از سیستم بابت کمک به تشخیص تشکر میکنید.
- حدود ۳۹ هشدار هم اشتباه خواهد بود و فقط وقت شما را میگیرد.
- حدود ۲ بیمار هم با وجود تایید هوش مصنوعی، دوباره به اورژانس برمیگردند (چون تشخیص شما و هوش مصنوعی با هم صحیح نبوده).
با وجود تمام این چالشها، سرعت پیشرفت این مدلها به قدری بالاست که احتمالاً در آیندهای نهچندان دور، نظارت هوش مصنوعی بر روند درمان به یک استاندارد تبدیل خواهد شد؛ تا جایی که شاید استفاده نکردن از آن، نوعی قصور پزشکی تلقی شود!
منبع: JAMA Network Open
