張貼日期
2024-12-30 00:00:00
主旨
探索GPT模型在醫療中的表現
公告內容
大型語言模型(Large Language Models),又稱為LLMs,能藉由大量的分析文章、書籍及網頁等文字資料來學習如何模擬基本對話、表達和回答問題,目前較廣為人知的LLMs為OpenAI的GPT系列。
今年10月在《Nature Communications》發表了一篇研究-Evaluating the use of large language models to provide clinical recommendations in the Emergency Department。
該研究主要目的在於評估大型語言模型(LLMs)在醫療應用中的潛力,藉由使用GPT模型(GPT-3.5-turbo、GPT-4-turbo)來評估急診病人『是否需要住院』、『是否需要醫學影像檢查』及『是否需要使用抗生素』,研究結果指出GPT-3.5-turbo的準確度較低,而GPT-4-turbo雖準確度較高但仍無法超越醫師的判斷,尤其是LLMs過於謹慎,經常建議過多的檢查及治療,致使醫療資源的浪費與醫療干預;雖然使用LLMs未來有潛力能成為醫療輔助工具,但目前仍需改進,未來才能更可靠的運用於臨床環境中。
參考文獻
Evaluating the use of large language models to provide clinical recommendations in the Emergency Department. Nature Communications volume 15, Article number: 8236 (2024)
附加檔案