為了減少 AI 幻覺而誕生的 RAG 技術,其表現最為出色的地方,即在於能有效找出「語義相關」的文件。
只不過,RAG 的優勢卻也被語義相關所限制,面對 AI 代理(AI Agent)的進一步發展,單純運用 RAG 技術,顯然已經不是企業所考慮的最佳方案。
為此,一種被稱作「決策脈絡圖(decision context graph)」的全新框架,透過為 AI 代理提供結構化記憶、具有時間意識的推理能力,以及明確的決策邏輯,試圖彌補 RAG 的技術缺口。
由 AI 新創公司 Rippletide 所研發的決策脈絡圖框架,主打讓現有的 AI 代理具備「非退化性(non-regressive)」能力,並且可以「凍結」過往已經過驗證的動作序列,再隨時間推移不斷累積、完善先前的動作序列。
根據 Rippletide 共同創辦人 Yann Bilien 的解釋,非退化性是決策脈絡圖框架的重點,其意義在於如何確保當 AI 代理生成全新內容時,可以在先前的基礎上,持續累積並最佳化自身動作。
傳統 RAG 檢索無法提供決策背景
為什麼 RAG 對於當今的 AI 代理來說,已經開始顯得力不從心呢?
首先,企業資料通常散佈於 ERP 工具、日誌、資料庫、向量儲存庫及政策文件之中,雖然生成式 AI 工具能夠透過關鍵字搜尋、SQL 查詢或完整的 RAG 處理流程,從這些來源中取得資料,可是其檢索能力依舊存在上限。
AI 代理應用 RAG 技術所檢索出來的資料,可能會與企業當前準備發起的決策完全無關,進而導致幻覺發生;此外,即使 AI 代理確實調用了正確資料,它們往往也缺乏足夠指引,難以做出具備充分理論支撐的決策。
若用更簡單的方式理解,即 AI 代理透過 RAG 檢索出來的東西,終究只是單純的「文件」而非「決策背景」,因此容易發生誤判。
資料過時、覆蓋造成的 AI 幻覺
人工智慧顧問公司 Northwest AI Consulting 專家 Wyatt Mayham 指出,傳統上應用 RAG 技術的做法,雖然對於聊天機器人來說十分有效,但對於需要做出決策,甚至是採取行動的 AI 代理而言卻會失效。
因此,企業和開發者當前面臨的最大難題,其實在於 AI 代理在「資訊檢索」與「實際應用」之間的落差。
Wyatt Mayham 進一步解釋,那些透過 RAG 檢索到的文件,並不會主動向 AI 代理表明,該文件是否仍然適用、是否已經被新文件取代,或者是否具備優先適用的衝突規則,但 AI 代理需要的是整體決策背景,不僅是紙面上的資訊。
舉例來說,在真實世界領域,單純透過 RAG 檢索資料庫中的文件,AI 代理並不會知道某項法規是否已經失效,或者某項安全政策只適用特定地區,以及某項標準作業程序已經獲得更新等,若 AI 代理忽略了其中任何一項,並且仍自信滿滿做出錯誤決定,那麼自然就會造成幻覺問題。
一旦缺乏結構化的決策背景,AI 代理就會將各種不相容、互相衝突的規則混為一談,甚至是胡亂編造原理、結論以填補漏洞,開發者亦難以追溯 AI 代理做出特定選擇的原因,導致事後難以重現錯誤並加以修正。
結構化對應的決策脈絡圖框架
Wyatt Mayham 說,AI 代理會不斷累積錯誤的問題確實存在,每個步驟中發生的微小失誤,未來於多步驟工作流程中累積起來,就會演變成極具災難性後果,這正是大多數企業級 AI 代理,始終無法脫離測試階段的主要原因。
在意識到 AI 代理需要更好的決策背景資料來源後,Rippletide 的決策脈絡圖框架以「適用內容」、「規則」,以及「適用時間」的結構化對應,嘗試解決 AI 代理的決策幻覺問題。
簡單來說,決策脈絡圖框架專為解答一項主要問題而來,即如何明確指示 AI 代理,在當前的特定情況下,決定適用哪些決策脈絡。
其中,時間被視為最重要的維度,每條規則、每個決策及每項例外,其作用範圍皆會被限定於一個有效的時間點。
適用性、時間感知與決策路徑
Yann Bilien 說明,AI 系統在建構決策脈絡圖時,該框架會明確處理缺失、不連貫或相互矛盾的資料,以避免 AI 代理運行時發生機率性錯誤,而該框架本身則奠基於三大原則:
第一為適用性,即將決策邏輯明確編碼,使 AI 代理知道在特定情境下,應該記住並且應用哪些規則,只有與當前情況相關時,系統才會回傳該脈絡供 AI 處理。
第二為時間感知記憶,即每條規則、每個決策和每項例外皆具有時間範圍,這讓 AI 代理能對「過去是怎樣,現在又是怎樣」進行推理,進而重現或解釋自身給出的決策。
第三為決策路徑,該框架讓 AI 代理能夠說明,其如何從 A 推理到 B,並闡明決策邏輯背後的「原因」,例如為何納入某個脈絡因素,卻排除另一個;框架會向 AI 代理提供決策路徑範例,說明過去如何處理類似案例。
在決策脈絡圖框架的前期設定階段,系統會導入非結構化資料進行轉化,確認哪些案例存在、適用哪些規則、哪些情況又屬於例外。
其中,神經符號式(Neuro-symbolic)AI 負責模式識別,並編碼成形式化且可供機器讀取的邏輯,隨著時間推移,框架會在做出新決策的同時,持續精進其知識庫。
Yann Bilien 指出,在進入生產環境前,AI 代理會先進行測試以驗證行為並找出改進點,此舉不僅能降低風險,還能減少推論時的運算需求。
更加一致、可預測、可解釋的行為
Yann Bilien 進一步表示,非退化性原則的關鍵,在於讓 AI 的智慧與知識能夠產生「複利效應」。當 AI 代理遇到不會處理的任務時,它能在受控的模擬環境中不斷探索、嘗試多種解法,例如讓客服機器人測試不同的應答模式。
一旦系統判定某個解法「令人滿意」,決策脈絡圖就會把這套動作流程「凍結」並儲存下來;未來,AI 代理將在這個「已驗證的穩固基礎」上繼續學習新事物,並確保它新學到的技能,絕對不會覆蓋或破壞過去已經學會的好表現。
在決策脈絡圖框架的輔助下,當 AI 代理採取實際行動之前,它會主動對照脈絡圖進行多項檢查,例如是否違反了規則、是否產生了幻覺、是否符合限制條件、是否能將解決方案推廣至類似案例等等,最後才發起行動。
若從宏觀層面來看,決策脈絡圖框架會評估 AI 代理的執行成果,判斷該行為是否提升了 AI 代理的長期表現、是否能在類似情境中泛化應用、以及是否成功保留了先前正確的任務處理能力。
Yann Bilien 說,這種限制、評估能力是 AI 代理在大規模環境下,維持可靠性的最大關鍵,同時這也會替 AI 代理帶來更一致、可預測且可解釋的行為,並實現更強的控制與可審計性。
避免 AI 學習效果無法累積
雖然 Rippletide 團隊最初以為,全面導入強化學習(RL)技術並非難事,然而事實證明,想要於企業環境中運用 AI 沒有想像中如此簡單,尤其某些特定應用場景乏足夠數據,而擁有數據的情境其資料卻又常常雜亂無章。
Yann Bilien 強調,要利用原始數據進行可靠的預測,通常是一項需要手動操作且耗時費力的挑戰,但如今有了 AI 代理,企業已經邁入一個能夠自動建構知識圖譜的新時代。
回顧傳統的監督微調方法,可能會導致 AI 模型在學習下一項技能時,忘記先前所學的技能,從而引發振盪(oscillations),導致其學習效果未能累積,知識遭到劇烈壓縮流失,並且令模型的進步呈現「階段性」而非連續性,使得 AI 在面對新任務或未曾見過的任務時屢屢失敗。
保有 AI 自主性,同時穩定輸出
Rippletide 共同創辦人 Yann Bilien 直言,若 AI 每次學習都會發生退化,就永遠無法打造出完全自主學習的模型,而決策脈絡圖框架能夠彌補這項缺口。
舉例來說,當同一個問題被反覆提出時,AI 代理將能給予可預測且沒有偏差的回答,同時仍能保有一定的自主性。
Northwest AI Consulting 專家 Wyatt Mayham 則表示,將適用性與時效性編碼到結構化的決策脈絡圖之中,而非依賴大型語言模型發起推斷,稱得上解決現有檢索機制實際限制的可靠方法。
然而,唯一有待釐清的問題,或許在於這套「自動建構知識圖譜」的技術,是否真的能夠應對企業內部雜亂且多元的真實數據。
【推薦閱讀】
◆ 如何用 AI 代理為軟體開發做出高價值貢獻?專家提點 5 大面向,人類管理仍不可或缺
◆ Gartner 預測九成企業需 AI 代理協調器,BAND 推「AI 代理版 Slack」解決跨平台碎片化
◆ 傳簡訊就能操控的 AI 代理 Poke 爆紅!擺脫 OpenClaw 技術門檻,甚至免下載安裝
*本文開放合作夥伴轉載,參考資料:VentureBeat、neo4j,首圖來源:Nano Banana 2
(責任編輯:鄒家彥)



