自從大型語言模型誕生至今,AI 的「幻覺」問題始終困擾著科學家與普通使用者;即便開發人員已經投入了大量時間和金錢,嘗試改善 AI 模型的精準度與正確率,但如影隨形的幻覺卻依然沒有獲得解決。
事實上,即便是最為先進的尖端 AI 模型,比方說 OpenAI 最近推出的 o3 和 o4-mini,它們都比起過往的模型更容易產生幻覺;此外,AI 運算背後的思考邏輯與思維模式,至今也還是個無法被人類深度理解的「黑盒子」,其輸出結果在某種程度上,甚至可以被視為「隨機產生」。
尤其對於非特定領域的專家來說,AI 因幻覺所給出的錯誤答案,通常很難獲得一般使用者主動察覺與識別;這些錯誤答案看起來似乎很有道理,但仍需要人類大量的監督與校正,才能確保 AI 輸出的結果足夠令人信任。
「沒有幻覺就不可能成為 LLM」
人工智慧的幻覺與黑盒子問題,成為了當前 AI 產業發展與應用的最大障礙,特別是在法律和醫療保健等,準確性和可解釋性至關重要,但是受到各國政府嚴格監管的領域;然而更加諷刺之處,在於前述產業卻是最有可能受益於 AI 與自動化轉型的地方。
倫敦深度科技新創公司 UnlikelyAI 工程部門主管 Elliot Burke Perrin 認為,若我們重新回頭探究 LLM 的本質,其實就會發現它仍然是一種「文字預測」模型,即透過統計學理論進行運算,猜測下一個詞會是什麼,最終產生出一篇連貫且可能剛好滿足使用者要求的回答。
Elliot Burke Perrin 說,當今 LLM 的運算原理,就跟人類進行賽馬、賭馬沒什麼不同;即便 AI 有能力將所有變數納入考量,它們所預測下一個詞的結果偶爾還是會出錯,而當錯誤答案出現時,該結果就會被人類歸納為幻覺。
特別值得釐清之處,在於幻覺是 LLM 與生俱來的問題,或者可以說「沒有幻覺就不可能成為 LLM」,因為該類 AI 模型的背後原理就是統計學。
透過「符號推理」強制 AI 遵守規則
換句話說,LLM 天生無法「理解」它們所接收與產生的資訊,即 AI只是單純推測並輸出可能性最高的結果,因此當 LLM 產生幻覺時,自然也無法主動告知使用者,剛剛給出的答案其實不夠精確。
即便是走在人工智慧產業最前沿的 OpenAI,他們也承認目前仍然缺少任何有效方法,單純透過生成式 AI 模型的進步以根除幻覺問題,除非科學家們將眼光放到最為傳統的「符號推理」(symbolic reasoning)技術上。
Elliot Burke Perrin 解釋,符號推理是一種古老但十分有效的方法,它透過清晰的邏輯規則,將 AI 所能理解的知識符號化,任何人類已知的「事實」都會成為靜態知識片段,這代表電腦軟體不可能對其進行錯誤的操作或解讀。
若以更通俗的方法理解,所謂符號推理就是讓 AI 遵守清晰的邏輯規則,比方「若 a 則 b」、「若下雨,則外面的一切通常都會變得潮濕」,還有數學規則「a = b 且 b = c,則 a = c」等,向 AI 表明各種事物,包含詞語、圖案及符號在現實世界中約定俗成的含義。
讓 AI 懂得主動報錯、永遠不會產生幻覺
當 AI 能夠像人類操作 Excel 公式一樣,藉由確定性(determinism)來證明輸出答案的可信度,並用遠對相同的輸入產生相同的結果時,即可被視為「符號人工智慧」。
這種 AI 模型原則上永遠不會產生幻覺,甚至還能夠藉由將知識組織成清晰、可重複使用的部分,讓 AI 未來可以學得更快、變得更聰明。
不僅如此,相較於當代的 LLM,符號人工智慧亦可以讓使用者清晰看見,它是如何一步步做出決定,而非輸出一堆看似有道理,卻難以令人理解的思考過程,並在符號系統的幫助下,讓 AI 運算真正變得透明且允許追蹤。
此外,當符號人工智慧無法理解輸入內容,或者無法計算出正確答案時,它也會主動告訴使用者「無法解答」,這就像人類在 Excel 軟體中輸入錯誤公式後,肯定會收到錯誤訊息一樣;符號人工智慧亦被外界視為更加負責任的 AI,因為使用者可以輕鬆控制它如何輸出特定結論。
理論上,符號人工智慧相較傳統 LLM 也會更加節能,因為 AI 可以藉由固定的規則、邏輯去運算資料,而無需處理太多的變數,例如規定下雨時外面的東西會變得潮濕,那麼 AI 就沒有必要記住所有可能會變潮濕的物體,甚至還會將邏輯主動拓展到任何新東西上,即使某個物體 AI 於訓練資料庫中從來未曾見過。
「混合式神經-符號人工智慧」結合兩者優點
然而,符號人工智慧卻也有著天生限制,那就是這類 AI 在處理自然語言方面不夠出色,更缺乏 LLM 的創意性、靈活性與彈性。因此,最佳解決方案就是結合兩者的優點,並且創造出全新的 AI 類別「混合式神經-符號人工智慧」(Neuro-symbolic AI)。
這種新型 AI 受惠於符號規則的特性,同時兼具 LLM 神經網路的思考彈性,讓使用者能夠在應用模型時,處理文件中非結構化的資訊,再遵循公式獲得可解釋的結構化解答。
Elliot Burke Perrin 認為,混合式神經-符號人工智慧的未來發展,對於企業內部如何部署高效率 AI 至關重要,特別是在那些遭到高度監管的產業。
Elliot Burke Perrin 進一步指出,對於選擇大舉採用 AI 技術的企業,光是擁有人工智慧應用所給出的答案依然不夠,他們還必須了解電腦是如何做出決定,此時混合式神經-符號人工智慧就擁有極大優勢。
若以金融保險業為例,傳統 LLM 在處理客戶的理賠需求時,可能會胡謅許多理由和原因,導致給出錯誤的回應及最終決策,此時企業若採用混合式神經-符號人工智慧,AI 就有能力在給予令人信服的答案後,自動處理後續任務,並把有疑慮、無法判斷的案件,主動轉交給人類接手。
為人工智慧產業帶來下一步突破
UnlikelyAI 工程部門主管 Elliot Burke Perrin 直言,隨著 AI 技術發展至今,產業界已經面臨了難以跨越的巨大障礙,人類必須要從過往的進展中汲取教訓,並尋求更為深入的全新解決方案,試著從不同角度切入以改善問題。
在眾多解決方案中,Elliot Burke Perrin 認為最有前途的技術,就是混合式神經-符號人工智慧,即便這項科技目前仍無法獲得普遍信任,但如 UnlikelyAI 之類的新創團隊,將會試著逐步培養外界對於新型 AI 技術的信任,為人工智慧產業帶來下一步突破。
*立即報名 8/15 【AI Agent 知識工作革命論壇】,解析企業如何在各工作場景導入 AI Agent 完成任務

【推薦閱讀】
◆ 所有保險任務都可交給 AI!新創 Sure 用 MCP 蓋了金融保險的高速公路
◆ 將 AI 胡說八道機率降到 1%!Vectara 利用 AI 代理打造「幻覺矯正守護者」
◆ 該用哪家 AI 讓你很苦惱?新創 Token Monster 自動幫選最強 AI 完成任務
*本文開放合作夥伴轉載,參考資料:《TechRadar》、《The Conversation》,首圖來源:Bing AI
(責任編輯:鄒家彥)



