探索GPT模型在醫療中的表現 | 生物資源保存及研究中心

張貼日期

2024-12-30 00:00:00

主旨

探索GPT模型在醫療中的表現

公告內容

大型語言模型(Large Language Models)，又稱為LLMs，能藉由大量的分析文章、書籍及網頁等文字資料來學習如何模擬基本對話、表達和回答問題，目前較廣為人知的LLMs為OpenAI的GPT系列。
今年10月在《Nature Communications》發表了一篇研究-Evaluating the use of large language models to provide clinical recommendations in the Emergency Department。
該研究主要目的在於評估大型語言模型(LLMs)在醫療應用中的潛力，藉由使用GPT模型（GPT-3.5-turbo、GPT-4-turbo）來評估急診病人『是否需要住院』、『是否需要醫學影像檢查』及『是否需要使用抗生素』，研究結果指出GPT-3.5-turbo的準確度較低，而GPT-4-turbo雖準確度較高但仍無法超越醫師的判斷，尤其是LLMs過於謹慎，經常建議過多的檢查及治療，致使醫療資源的浪費與醫療干預；雖然使用LLMs未來有潛力能成為醫療輔助工具，但目前仍需改進，未來才能更可靠的運用於臨床環境中。

參考文獻
Evaluating the use of large language models to provide clinical recommendations in the Emergency Department. Nature Communications volume 15, Article number: 8236 (2024)

附加檔案