Search
Close this search box.

研究人員表示 OpenAI 的 轉錄工具會自行編造內容,但醫院在使用

OpenAI 聲稱人工智慧語音轉錄工具 Whisper 具備「接近人類水準的穩定性和準確度」。然而,根據超過十位軟體工程師、開發者和學術研究人員指出,Whisper 經常產生虛構文字或完整句子,這種現象在業界被稱為「幻想」(hallucinations)。這些幻想內容可能包含種族評論、暴力言論,甚至虛構的醫療處方。 

應用範圍與隱憂

Whisper 目前廣泛應用於全球各產業,用於翻譯和轉錄訪談、生成文字內容,以及製作影片字幕。更令人擔憂的是,許多醫療中心急於使用 Whisper 相關工具來轉錄醫病諮詢內容,儘管 OpenAI 已警告不應在「高風險領域」使用該工具。 

問題普遍性與實例

研究顯示問題相當普遍。密西根大學一位研究員在檢查公開會議的音訊轉錄時,發現每 10 份轉錄中就有 8 份出現幻想內容。康乃爾大學和維吉尼亞大學教授比對了他們的原本素材,出現以下是幻想內容的實例: 

  • 原音:「他,那個男孩,打算,我不太確定,拿雨傘。」 轉錄卻添加:「他拿了一大塊十字架,一小塊…我確定他沒有恐怖刀具,所以他殺了許多人。」 
  • 一段描述「兩個女孩和一位女士」的錄音,Whisper 自行加上種族評論:「兩個女孩和一位女士,嗯,她們是黑人。」 

未來發展與建議

專家呼籲聯邦政府考慮制定 AI 監管規範,並要求 OpenAI 解決這個問題。前 OpenAI 工程師 William Saunders 表示,只要公司願意優先處理,這個問題是可以解決的。目前 Whisper 已整合到 ChatGPT 部分版本中,也是 Oracle 和 Microsoft 雲端運算平台的內建功能,影響範圍廣大。 

醫療應用的風險特別受到關注,錯誤轉錄可能影響診斷判斷。前白宮科技政策辦公室主任Alondra Nelson 提醒,醫療轉錄需要更嚴格的標準把關。對聽障族群來說風險更高,因為難以分辨隱藏在文字中的錯誤內容。 

*本文開放合作夥伴轉載,資料來源:《The Associated Press 》首圖來源:《Unsplash》