在今年的 Google I/O、OpenAI 春季發表會與 Microsoft Build 大會上,有個全新的名詞「AI 代理」不斷從科技巨頭們的口中頻繁出現,但究竟「AI 代理」是什麼意思?科技圈為什麼把它看得如此重要?甚至認為「AI 代理」將是人工智慧領域的下個關鍵突破?
日前的 Google I/O 大會上,該公司執行長 Sundar Pichai 示範了一種人工智慧於未來能夠達成的應用,他指出消費者以後只要透過 Google Gemini 對剛剛網購取得的鞋子拍張照,並表示商品不符合自己的尺寸,接著 AI 就會介入運作,主動搜尋電子郵件中的訂單紀錄,然後自動完成所有的退貨程序,就如同請了一位「代理人」讓 AI 打理日常生活中的一切。
無獨有偶,微軟的 Copilot 人工智慧、OpenAI 的 GPT-4o 模型,幾乎都在嘗試達成類似的事情,科技巨頭正試圖讓「AI」轉變成「AI 代理」,或者說是更好理解的「AI 代理人」。
掌握 AI 趨勢 & 活動資訊一點都不難!訂閱電子報,每週四一起《AI TOgether》

感謝訂閱!隨時注意信箱的最新資訊
簡單來說所謂的 AI 代理,其實就是能夠獨立完成某件事情的 AI 模型,就像漫威電影《鋼鐵人》中的人工智慧管家賈維斯、《星際效應》中的塔斯、凱斯,或者《2001 太空漫遊》中的 HAL 9000。
AI 代理的最大特色是行動力
相較於我們已經非常熟悉的人工智慧聊天機器人,AI 代理的最大特色在於「行動力」,允許跟現實世界進行互動。換句話說 AI 代理不只是能夠回答使用者的問題,更可以藉由各種 API 的串接,在使用者提出要求之後全自動作出決策,並且在無需人類干涉的情況下,完成使用者所指派的任務。
AI 代理已經十分接近我們理想中的通用人工智慧(AGI),但能力和學習力仍然不及。Echo AI 創辦人兼執行長 Alexander Kvamme 認為,AI 代理將是人類的未來,不過即便科技界已經討論了這個名詞數年,但至今仍尚未有團隊實現真正的 AI 代理,因為其開發實在太過困難。
Alexander Kvamme 表示,真正的 AI 代理需要獨立做出數十個甚至數百個決策,但這是一件非常難以自動化的事情,例如 Google 對於退貨鞋子的示範,AI 代理得先掃描消費者的電子郵件並尋找訂單,接著抓取訂單號碼和貨運地址,然後填寫完整的退貨表格……等等一連串的操作及確認,以人類角度在該過程中甚至有很多事情是自己沒有想到,僅僅靠著潛意識所作出決定的。
然而即便是在受控環境中,現今的大型語言模型也還不夠完美,如果想要像 Google 的示範一樣,要求 AI 代理在開放網路下進行獨立工作,人工智慧將會變得更加容易出錯。
太完美的 AI 會造成人類困擾
此外 AI 代理還有另一個經常被討論的問題,那就是人工智慧經常會把事情做得「太完美」。
舉例來說,當消費者要求 AI 代理退回鞋子,那麼它可能會把你整個鞋櫃的鞋子通通退貨,或者在掃描電子郵件的過程中,退貨掉消費者數年來網購所買的一切東西,這聽起來雖然很荒誕,但卻是 AI 研究人員實際擔心的問題,太過「固執」且「能幹」的 AI 反而會讓人類感到困擾。
但對於科技巨頭與 Alexander Kvamme 這類,在 AI 領域上的投資者及樂觀主義者來說,他們仍然堅信 AI 將賦予人類更強大的力量。Kvamme 說,他覺得 AI 未來將要承擔的任務,將是大部分人類都不願意去做的工作,許多人將因此得到更多時間和空閒,有機會去尋找自我價值,前提是這些人必須適應 AI 搶走他們工作的合理性。
AI 代理還有一段路要走
那麼何時人類才能進入充滿 AI 代理的未來呢?首先,驅動一切的人工智慧模型必須變得更好、更準確,這意味著如 ChatGPT、 Google Gemini 和微軟 Copilot 將來的進步,將會以實踐 AI 代理為主要發展方向。
其次,目前的 AI 仍要克服嚴重的幻覺問題,即會於無意間散播錯誤資訊,但研究人員至今仍然尚未找到有效的解決方案,即便是擁有龐大資金、設備與團隊的科技巨頭,也還是需要一段不短的發展時間。
【延伸閱讀】
◆ 「Google 搜尋變得有夠蠢!」吃披薩時起司會掉下來怎麼辦?AI 說那你就用膠水黏住食材啊
◆ 「當 AI 全都做得比你好」馬斯克稱未來是普遍高收入社會,人類該思考生存目標而非工作與財富
◆ 【快跟 AI 同事打招呼】Google Workspace 導入「虛擬隊友」可一秒看完工作群組訊息,隨時在線問什麼都能答




