Search
Close this search box.

人類行為被 AI 預測嗎?科學家研發「半人馬讀心」模型 Centaur

人類行為可以被 AI 預測嗎?科學家研發「讀心術」模型 Centaur 準確度驚人

利用 AI 工具輔助日常任務,例如撰寫程式碼、寫作或繪圖等,已經是當今十分常見的基礎應用;然而,AI 有可能準確預測人類的各種行為嗎?

來自德國亥姆霍茲慕尼黑研究中心的科學家,近來於《自然》期刊上發表了全新論文,聲稱他們開發出了一款能夠模擬人類思維的 AI 系統「Centaur」,並希望可以藉由這套 AI 模型,理解人類的整體思維模式。

研究團隊在論文中指出,所謂「思考」幾乎涵蓋了人類生命中的一切活動,從選擇要吃什麼早餐,直到出門要穿哪一套衣服等,偶爾甚至還會涉及複雜的挑戰,例如找出治療癌症的方法或者探索外太空。

因此,若能開發出一套真正反映人類認知方式,擁有「讀心術」的 AI 系統,將可能會為行銷、教育、心理治療和產品設計等領域,帶來革命性的轉變。

將心理學實驗結果,直接當成 AI 訓練資料

為了實現上述理想,Centaur 研究團隊打從最初就訂下雄心勃勃的目標,即創造一套可以在任何心理學實驗中,準確預測人類行為的單一 AI 模型,而且他們選擇的實踐方法出乎意料地簡單,唯獨需要規模足夠龐大的訓練資料。

首先,科學家決定建立起一個名為「Psych-101」的資料集,其中包含 160 個先前已發表的心理學實驗,涵蓋超過 60,000 名人類參與者,合計共做出超過 1,000 萬個選擇,內容則包括記憶測試、學習遊戲、冒險情境和道德困境等,並把每個實驗的過程與結果,全都轉換成 AI 模型可以理解的純英文描述。

緊接著,科學家將 Psych-101 資料集的內容,輸入到 Meta 旗下的 Llama 3.1 大型語言模型進行訓練,過程中僅修改了極小部分的 AI 運算邏輯,再於搭載 80GB 記憶體的 NVIDIA A100 GPU 上,花費約 5 天時間訓練完成。

透過 Psych-101 資料集所訓練的 Llama 3.1 人工智慧模型,被科學家命名為 Centaur,意即傳說中的神話生物「半人馬」;研究團隊說,半人馬是他們能夠想到最貼近「半人半駝」的物種。(編按:Llama 原意就是駱馬/大羊駝。)

比專業認知模型更強大,條件改變也難不倒

在後續進行的效能測試中,科學家首先將 90% 的人類受測者實驗資料,輸入到 Centaur 模型之中,接著讓 AI 自行運算剩下的 10%。

結果發現,Centaur 的最終輸出成果,竟然十分貼近人類受測者,於相同實驗之下所進行的選擇,甚至擊敗了過往心理學家花費數十年時間,特地調效出來的專業認知模型。

只不過,新款 AI 可以做對「考古題」,並非是 Centaur 最令人驚豔的地方;研究人員指出,真正突破其實是他們為 Centaur 所設計的全新測試情境。

根據論文指出,即便實驗的內容有所改變,比方說將太空尋寶變成魔毯冒險,或者進行結構修改,例如在二選一的任務中,刻意加入第三個選項,甚至是引入全新知識領域,考驗 Centaur 的邏輯推理能力,該 AI 模型仍然可以成功預測人類行為,輸出跟人類受測者類似的選擇結果。

讓 AI 以「逆向工程」方式,呈現人類認知

不僅如此,研究團隊指出 Centaur 在一項涉及探索策略的測試中,其表現能夠媲美實際的人類參與者,並展現出跟人類相同的「不確定性決策」引導能力。

更加令科學家感到驚訝之處,在於 Centaur 的內部運作模式,已經十分貼近人類的大腦活動,且兩者之間的關聯性,甚至比原本未經訓練的模型更強,儘管 Centaur 模型從來沒有導入專門的神經網路資料進行訓練。

研究團隊認為,當人工智慧模型懂得學習、預測人類行為,即代表人類找到了一種方法,反映我們的大腦實際上是如何處理資訊,並透過研究人類在各項事務上的選擇,讓 AI 以「逆向工程」的方式,呈現出人類認知的各個層面。

除此之外,隨著 Centaur 模型的誕生,亦能加速相關領域的科學研究發展,比方說研究團隊即在透過 AI 分析人類行為模式後,意外發現了一種全新的決策模式,其表現甚至優於現存的心理學理論。

科學界有異音,Centaur 模型仍不像人類

然而,Centaur 模型所帶來的成果,卻也在科學家之間出現了質疑的聲音。英格蘭布里斯托大學認知科學家 Jeffrey Bowers 就認為,Centaur 聲稱可以反映人類思考模式的說法,事實上有些過於「荒謬」。

Jeffrey Bowers 表示,若仔細研究 Centaur 模型的論文初稿,其實就不難發現該套 AI 系統中,仍存在著許多明顯跟人類不相似的行為。

例如在短期記憶測試中,Centaur 模型可以回憶起最多 256 個數字,而人類通常只能記住大約 7 個;此外,該 AI 模型於反應時間測試中,竟能於短短 1 毫秒的「超人」時間內做出反應,普通人類根本做不到。

因此 Jeffrey Bowers 強調,當前 Centaur 模型的應用層面仍非常侷限,不應該在其訓練資料以外的領域,進行過度的應用與推廣。

追求人類「基本認知」運作方式的解答

同時 Jeffrey Bowers 也提出警告,指 Centaur 模型依然無法「解釋」人類認知事物的實際方式,這就像「指針時鐘」和「數位時鐘」雖然都能顯示時間,但兩者的運作機制卻完全不同。

換句話說,即便 Centaur 確實可以預測、輸出跟人類相似的行為,嘗試讀懂人類的心,但其所依賴的運作機制,仍然與人類的心智大相逕庭。

紐西蘭奧克蘭大學電腦理論神經科學家 Katherine Storrs 補充指出,許多理論神經科學家對於 Centaur 這類新工具感到「興奮」但「謹慎」,該論文雖然提出了許多不甚合理的籠統說法,但在資料集和 AI 模型方面確實花了許多時間和心力,這些工作長遠來說仍有希望得到回報。

主導 Centaur 論文的德國亥姆霍茲慕尼黑研究中心科學家 Marcel Binz 則向外界表示,團隊將 AI 研究與心理學理論互相結合的同時,亦對社會做出明確的道德承諾。

Marcel Binz 說,團隊只會於公共研究環境中,追求人類基本認知運作方式的解答,就算這些事物並非商業界所關注的焦點,希望藉此打消外界對此類 AI 研究,在人類隱私方面的相關疑慮。

資料涵蓋範圍有限,AI 模型必須更全面

總歸來說,Centaur 模型在整個 AI 與認知科學領域的發展中,僅僅只是個開端,尤其目前的版本主要著重於學習與決策,對社會心理學或跨文化差異等領域的涵蓋仍非常有限。

此外,Psych-101 資料集所收集的受測者資料,也偏向於西方受過教育的族群,這些都是過往心理學研究中的常見限制。

Centaur 研究團隊預計將進一步擴大 Psych-101 資料集的內容,藉此涵蓋更多不同領域和人群,並且建立起一個更加全面的模型,作為反映人類認知行為的統一理論。

而在 Centaur 模型的論文發表之後,研究團隊也已經將資料集和 AI 模型於網路上公開,供其他研究人員進行參考。

*立即報名 8/15 【AI Agent 知識工作革命論壇】,解析企業如何在各工作場景導入 AI Agent 完成任務

【推薦閱讀】

◆ 【這是我們在等的嗎】讓 AI 永遠不會產生幻覺!專家稱「符號推理」可能成最佳解答
◆ AI 思維鏈將失效?OpenAI、Google 和 Anthropic 等研究人員聯合發出警告
◆ 【AI 是個大黑箱】Anthropic 執行長提出「可解釋性 AI」的急迫性,和可解決的產業痛點

*本文開放合作夥伴轉載,參考資料:《StudyFinds》《Science》,首圖來源:Bing AI

(責任編輯:鄒家彥)