現在的聊天機器人多半只為人們提供娛樂、或提升工作效率,如果有一天我們能透過它獲得專業醫療建議,你覺得如何?
Google 日前發布一篇研究文章,分享他們正訓練一款 AI 醫療型聊天機器人 AMIE(Articulate Medical Intelligence Explorer),它在診斷心血管疾病與呼吸道疾病等的準確度勝過初級保健醫生,而且還更具同理心!
此研究的共同作者、Google Health 的臨床試驗科學家 Alan Karthikesalingam 表示:「這是首次針對診斷和病史設計的聊天機器人。」AMIE 使用 Google 開發的大型語言模型(Large Language Model, LLM),研究人員預計未來將用它來促進醫療保健的普及。
AMIE 還有哪些優勢?它有可能在近期問世嗎?
AMIE VS. 醫生——聊天機器人在這些面向表現更佳!
在醫療產業,幾乎沒有人研究如何使用 LLM 模擬醫生收集病史與診斷,因為研究員必須耗費大量時間取得訓練數據。在研究 AMIE 的過程中,團隊的確面臨缺乏真實醫學對話訓練數據的困境,為此,他們設計能讓聊天機器人自行模擬對話的訓練方式。
首先,他們使用如電子健康紀錄和轉錄的醫學對話等現有真實數據微調基礎 LLM;接著,他們讓 LLM 同時扮演患有特定疾病的患者、一位有同理心的臨床醫生,以及一名負責檢視如何優化整個流程的評論者,讓他們自行對話、並改進診斷內容與互動方式。
為了進一步測試系統,研究員找來 20 名受過培訓的「患者演員」,在不知道對談者是 AMIE 或是臨床醫生的前提下,模擬 149 個臨床場景、向他們進行線上文字諮詢。還有專家組負責評估 AMIE 和醫生的表現、並為雙方評分。
最後結果顯示,在 6 個醫學專業中,AMIE 的診斷準確性優於醫生;在 26 個對話品質標準中(包括禮貌、解釋病情與治療方案、表達關心、誠實、承諾等),AMIE 在 24 項標準中表現得比醫生好。
掌握 AI 趨勢 & 活動資訊一點都不難!訂閱電子報,每週四一起《AI TOgether》

感謝訂閱!隨時注意信箱的最新資訊
AMIE 的下一步——確保無偏差、進入臨床試驗
不過 AMIE 要真的落地還需要一些時間。除了它目前尚未進入臨床、實際進行診斷外,研究團隊也表示他們還要進行更深入的研究,確保它沒有潛在偏差或道德問題。新加坡杜克大學醫學院臨床 AI 科學家 Daniel Ting 補充:
「用戶隱私問題也至關重要,因為我們目前仍難以掌握 LLM 的數據會存在哪裡、且如何進行分析。」
雖然 AMIE 經過多次優化後,在各方面的表現都能在水準之上,但研究團隊和其他專家皆認為它無法完全取代醫生。Karthikesalingam 解釋,參與研究的醫生可能因為不習慣透過文字與患者互動而影響研究結果,但不代表醫生的能力真的比 AMIE 差。
哈佛醫學院內科醫生 Adam Rodman 認為這款聊天機器人或許真能為患者帶來助益,「但它不應該取代患者與醫生的互動,因為醫學不僅是收集資訊,它還與人際互動有關。」
【推薦閱讀】
*本文開放夥伴轉載,參考資料:《Nature Journal》、Google Research,首圖來源:Pexels
(責任編輯:鄒家彥)



