推理 AI 結合代理 RAG,為什麼 Deep Research 會取代你的工作?

推理 AI 結合代理 RAG,為什麼 Deep Research 即將取代你的工作?

日前 OpenAI 為 ChatGPT 推出了全新功能 Deep Research,又稱為「深度研究」,讓外界對於 AI 的應用方式再度眼睛一亮。然而,強大且出色的 Deep Research,在成功吸引企業與開發者目光後,卻可能導致基層員工因此失業。

Deep Research 捲起 AI 產業界巨變

身處整個 AI 科技發展最前沿的 Deep Research,成功將大型語言模型(LLM)、網路搜尋引擎及其他 AI 工具互相整合,大幅擴展了 AI 的應用範圍。

機器學習公司 Red Dragon AI 共同創始人 Sam Witteveen 表示,自己只需要花費 200 美元,即 ChatGPT Pro 的訂閱費,就能透過 Deep Research 直接取得,過去得支出 20000 美元,才能從全球知名市場分析公司所製作的報告,這種衝擊將讓產業界發生巨變,更會令某些人直接失業。

透過 Deep Research 功能,使用者可以向 OpenAI 最新的 o3 模型提出任何問題,並且獲得 AI 詳盡閱讀各種資料,思考、統整及歸納之後所得到的結果;根據實際使用體驗,Deep Research 所產出的報告,通常會優於人類分析師,而且速度更快、製作成本更為低廉。

儘管 Deep Research 的強大、高效率和低成本,已經獲得 AI 產業界的廣泛討論,但不少專家認為,它所帶來更加廣泛的影響,至今其實仍尚未完全展現。

從金融到醫療,AI 延伸各行各業

比方說,近來有使用者於網路上指出,稱自己的妻子由於罹患乳癌,因此透過 Deep Research 嘗試理解放射線治療的正確方法,並表示 AI 提供了比腫瘤科醫師,更加深入的分析和說明。

美國賓州大學華頓商學院 AI 領域教授 Ethan Mollick 表明,即便 Deep Research 跟所有 AI 模型一樣,偶爾會出現幻覺而提供錯誤資訊,但它的優點早已遠遠超過偶爾出現的缺點,畢竟人類回過頭來檢查 AI 內容正確性的時間,絕對比起從頭開始研究問題、蒐集資料的時間來得更少。

Deep Research 為使用者帶來的時間節省,對於需要處理大量資料的金融機構來說尤其有利;排名美國前 12 大銀行的 BNY,即紐約梅隆銀行,甚至已經開始透過 Deep Research 功能,替客戶及企業進行信用風險評估。

產業界專家認為,Deep Research 的影響將持續延伸至各行各業,從醫療保健到零售、製造和供應鏈管理,幾乎所有依賴知識性工作的領域,最終都會因為 Deep Research 而出現改變。

Deep Research 的不同之處

不同於傳統 AI 模型,通常會透過最快的速度,給予使用者最明確的答案,Deep Research 更偏好先「理解和思考問題」,確保 AI 完全瞭解使用者當下的需求,接著再開始執行研究。

在大多數情況下,Deep Research 在理解問題之後,即會列出一份結構化的研究計畫,接著進行多次搜尋,並且根據 AI 所獲得的資訊,適當修改研究計畫,不斷循環反覆,直到成功撰寫出一份全面且格式優秀的詳細報告。

根據問題深度、研究領域的不同,Deep Research 每次進行研究,時間得花上幾分鐘到半小時不等,報告字數也會落在 1500 至 20000 字的極大範圍,更會引用 15 到 30 個資料來源,同時為參考資料附上精確的 URL 連結。

推理模型及代理 RAG 完美結合

驅動 Deep Research 強大功能的背後,為 AI 產業積極發展的兩大技術,包含「大型語言推理模型」(Reasoning LLMs)以及「代理型檢索增強生成」(Agentic RAG)。

首先在 LLM 部分,日前 OpenAI 所推出的旗艦 AI 模型 o3,在邏輯推理和思維鏈延伸方面,至今依然領先群雄,o3 更在超高難度的 ARC-AGI 基準測試上,獲得了史無前例的 87.5% 高分,但模型本身仍尚未開放給一般開發者進行存取。

對此 OpenAI 的執行長 Sam Altman 指出,未來 o3 模型並不會作為獨立產品釋出,只會整合到即將發表的 GPT-5,並以「統一智慧系統」的名義,跟搜尋、程式碼撰寫等代理工作緊密結合。

至於代理 RAG 部分,它的主要功用是讓 AI 模型,有能力自主於網際網路上搜尋資訊,並且分析內容上下文;經過進一步發展後,藉由各種各種 API 的串接,代理 RAG 甚至有辦法存取更加豐富的資料來源,例如企業內部資料庫,使任務成果更精確也更有效率。

Deep Research 的問題和盲點

藉助 AI 推理模型及代理 RAG,OpenAI Deep Research 的效能顯然達到了全新水準,儘管它還是會產生 AI 工具一定會出現的「幻覺」,但其機率已經降至 8%,為目前 AI 業界的最佳表現,若 OpenAI 願意再導入引文要求等可信度檢查機制,其幻覺肯定能夠再進一步減少。

另一方面,Deep Research 也並非沒有競爭對手。比方說 HuggingFace 開發人員就在 24 小時內,推出了「Open Deep Research」的開源 AI 代理功能;同時像 DeepSeek 這類的開源推理模型,還有微軟的開源多代理 AI 系統 Magentic-One,也都在對 OpenAI 發起挑戰。

此外,仰賴網際網路進行研究的 Deep Research,更有著因為「網路」所產生的盲點。

即便遭到圍攻仍力壓群雄

科技產業分析師 Ben Thompson 就指出,對於在網路上找到「罕見資料」,Deep Research 確實非常有效率,但假若使用者的研究領域,存在於網路上的資料本來就過度稀少,那麼 Deep Research 即便再智慧也毫無用處。

那些被直接記憶於研究者、特定領域專家的腦海中,以及儲存在私人領域、私有資料庫中的珍貴數據,Deep Research 不可能有方法能夠存取,並且將其納入參考。因此 Ben Thompson 認為,Deep Research 所衝擊到的人,仍是工作技能本身就比較差的分析師或學術研究者。

即便如此,我們依然無法忽視 Deep Research 的強大。在衡量 AI 模型智力,涵蓋 100 個不同主題、3000 道問題的 Humanity’s Last Exam 測試中,Deep Research 於 o3 模型的驅動下,獲得了 26.6% 成績,榮登史上最佳。

相較之下,同樣導入 Deep Research 功能的 Perplexity,得分只有 20.5%;o3-mini 成績為 13%;DeepSeek R1 更只有 9.1%。

用 0.5 元成本,完成價值 5 萬元工作

Deep Research 如此力壓群雄的表現,多少也激起基層員工對於失業的擔心。美國 BNY 銀行工程與 AI 主管 Sarthak Pattanaik 就指出,Deep Research 肯定會被銀行業用於各種高級金融活動,並且對分析師、研究者的任務產生重大影響,但他仍無法言明實際受到衝擊的工作人數。

回顧歷史上來看,每每當人類出現技術革命時,勞工總是最先遭到犧牲的群體,但以長期眼光來看,新技術通常也會創造出新產業,比方說汽車取代馬車,電腦讓文職工作自動化,藉由就業市場的不斷演進,催生全新的工作崗位,同時未能擁抱進步的企業,亦將落後於競爭對手。

OpenAI 執行長 Sam Altman 日前在談到通用人工智慧,即 AGI 的願景時,第一個點出來的產品就是 Deep Research。他說,企業只要花 0.5 美元的運算費用,就能完成價值 500 甚至 5000 美元的工作,Deep Research 帶來的效率提升、成本降低顯而易見。

知識產業的 AI 分水嶺

Sam Altman 直言,Deep Research 已經能夠自主完成,目前全球所有經濟任務中,大約個位數百分比的工作,雖然這個比例看似很低,但是在一年之前,根本沒人相信 AI 辦得到,這樣的突破已經足夠令產業界感到瘋狂。

Deep Research 代表了 AI 於知識產業中,關鍵且重要的分水嶺,OpenAI 透過將尖端推理模型與自主工作能力互相結合,創造出比人類分析師更聰明、更快速、更具成本效益的 AI 工具。

從金融服務、醫療到企業決策,Deep Research 的影響將非常廣泛,有效利用此技術的組織,肯定會獲得顯著的競爭優勢,同時那些忽視 Deep Research 的企業,未來將有可能自食惡果。

【推薦閱讀】

◆ 想用 Deep Research 不必花 200 美元,開放版 AI 代理複製品神速誕生

◆ 「幾週後我們不會再談 DeepSeek」美國 AI 新創想用但遇 3 大麻煩

◆ 行銷團隊一夜變成軟體工程師,企業 AI 轉型 0 經驗也能寫程式

*本文開放合作夥伴轉載,資料來源:《VentureBeat》Stratechery》。首圖來源:OpenAI