RSI 是新的 AGI：矽谷追逐的最終魔王關，為何讓 Anthropic 呼籲全球按下暫停鍵？

在全球 AI 競賽全力加速的此刻，身處第一線的 Anthropic 卻提出一個反方向的呼籲。Anthropic 在官方部落格中警告，AI 系統正接近能在無人監督下自我改進的臨界點，並呼籲全球頂尖實驗室考慮一項協調一致的協議，暫停或至少放慢前沿模型的開發步調。

這篇部落格文章由 Anthropic 內部研究主管 Marina Favaro 與政策主管 Jack Clark 共同撰寫，他們認為模型的進展正逐漸逼近一個理論概念：遞迴式自我改進（Recursive Self-Improvement，RSI）。他們表示有理由相信，某些模型可能在短短兩年內就具備這項能力。

COMPUTEX 2026 現在進行中！最新報導都在【TO Highlight】直擊 COMPUTEX 2026 台北國際電腦展

Anthropic 為何示警？逾 80% 程式碼已由 Claude 寫成

Anthropic 之所以這麼說，是因為它在自家內部看到了具體訊號。《VentureBeat》報導，截至 2026 年 5 月，Anthropic 合併進生產環境程式庫的程式碼中，有超過 80% 是由其 AI 模型 Claude 撰寫，而非人類；Anthropic 補充，在 Claude Code 於 2025 年 2 月推出研究預覽前，這個比例還只有個位數的低點。連帶地，相較於 2021 至 2025 年的基準，每位工程師每季交付的程式碼量增為 8 倍。

更關鍵的是 AI 在「研發 AI」這件事上的進步。Anthropic 攤開數據：在優化實驗的測試中，2025 年 5 月的 Claude Opus 4 平均能讓訓練程式碼加速約 3 倍，到了 2026 年 4 月，Claude Mythos Preview 已達到約 52 倍，而一名熟練的人類研究員要達到 4 倍加速，通常得花上四到八小時。在最開放、沒有明確規格的工程任務上，Claude 的成功率在 2026 年 5 月達到 76%，半年內提升了 50 個百分點。Anthropic 還舉例，2026 年 4 月，Claude 自主交付了 800 多項修正，把某一類 API 錯誤降低為原本的千分之一，而監督的工程師估計，同樣的工作由人類來做得花上四年。

Anthropic 也坦言，程式碼行數不是完美指標，不能直接等於真實生產力提升，但這確實顯示 AI 已開始大幅改變研發節奏。Anthropic 內部研究主管 Marina Favaro 與政策主管 Jack Clark 在文章中指出，如果 AI 系統最終能完全自主設計與開發自己的後繼版本，這將是科技史上的重大轉折。它可能推動科學、醫療與工程突破，但也可能放大人類失去控制的風險。

這也是為什麼 Anthropic 主張，全球應該至少保留一個可選項：在必要時，讓前沿 AI 開發能夠以可驗證方式放慢或暫停，好讓社會制度與 AI 對齊研究跟上技術速度。

那麼，讓 Anthropic 如此戒慎的 RSI，究竟是什麼？

RSI：AI 自己打造下一代自己

《TechCrunch》稱「RSI 是新的 AGI」，原因在於兩者同樣具有強烈想像空間，也同樣難以精準界定。其初步解釋，RSI 指的是一套能持續自我升級的 AI 系統；一旦 AI 管理升級循環的能力勝過人類，整個過程就會變成一個封閉迴圈，只受限於它能取得的運算資源，而人類不再是必要、甚至不再有幫助。

《Financial Times》則以「飛輪效應」描述這個概念：自學的 AI 不斷打造更強、更高效的新版本，一代接一代重複這個動作。Anthropic 給出的定義最為直接：RSI 是一套能完全自主設計並開發自身後繼者的 AI 系統。

繼 AGI 之後的新關鍵字，眾人競逐這顆「最終魔王」

RSI 之所以受到關注，也因為它已經不只是 Anthropic 的安全議題。《TechCrunch》指出「遞迴」已成為 AI 圈最新的流行語，更有兩家新創直接以此命名，更多公司也將 RSI 寫進發展藍圖；就像先前的 AGI 一樣，RSI 也成了象徵 AI 急速起飛的代名詞，儘管大家對它的確切定義仍有分歧。

追逐這個目標的，來自各大頂尖實驗室。《Financial Times》指出，這是一場由 OpenAI、Anthropic 與一群快速增加的新創共同投入的競賽。

Google DeepMind 負責人 Demis Hassabis 在 Google I/O 大會上即宣稱，回頭看這段時期，會發現「我們正站在奇點的山腳下」；OpenAI 執行長 Sam Altman 則在去年 10 月設下目標，要在 2028 年 3 月前打造出「真正的自動化 AI 研究員」。OpenAI 創始成員、特斯拉前 AI 總監 Andrej Karpathy，更把 RSI 稱為「最終魔王關」，並斷言「做這件事『只是工程問題』，而且一定會成功」；他目前已加入 Anthropic 從事預訓練工作。

在新創端，知名研究者 Richard Socher 與 DeepMind、OpenAI 前研究員今年 5 月共同創辦了 Recursive Superintelligence，就明確以 RSI 為目標；這家公司在成立短短數月後便以 40 億美元估值募得 6.5 億美元。此外，由 Sara Hooker 創辦的 Adaption 推出 AutoScientist 工具，試圖自動化前沿模型訓練；Disarray 創辦人 Doris Xin 的自訓機器學習代理，則在一場 Kaggle 競賽中拿下 28 面獎牌，擊敗許多人類訓練的代理。

RSI 到底到了沒？業界意見分歧

不過這場競賽究竟走到哪裡，看法分歧。Google 執行長 Sundar Pichai 接受外媒訪談時相對保守，他表示這是一個連續的過程、大家都在進步，但「以人們描述 RSI 的方式來說，我們還沒真正到那裡」。

目前 AI 最大的缺口仍在於方向判斷。Anthropic 也承認，Claude 已能在明確目標下執行複雜任務，例如最佳化訓練程式碼、修復錯誤、加速實驗流程；但在選擇哪些問題值得研究、哪些結果可信、何時應該放棄某條路線等「研究品味」上，人類仍具有明顯優勢。

《TechCrunch》也引述喬治城大學 CSET 主任、OpenAI 前董事 Helen Toner 的觀點：單純用 AI 工具來做 AI 研究，並不足以稱為 RSI，因為它的經典定義是「不需要任何人類」。她引用 METR 研究者 Ajeya Cotra 提出的里程碑：當系統在移除所有人類後仍能研究，稱為「足夠」；純 AI 與純人類系統一樣擅長研究，稱為「對等」；純 AI 勝過人機協作，則為「超越」。Cotra 認為 AI 已很接近「足夠」門檻。

實驗室內部的訊號則喜憂參半。《TechCrunch》指出，與 Mythos 預覽相關的一份調查中，18 位 Anthropic 工程師裡有 5 位認為，若工具鏈再改進，這版 Mythos 可望很快取代一名 L4 工程師（能在無人監督下承接複雜專案的中階程式設計師）。但報告也同樣列出 Claude 的主要弱點，包括自我管理長達一週的模糊任務、理解組織優先順序、品味、驗證與認識論能力。

AI 競爭規則正在改寫

RSI 之所以值得關注，不只因為它被視為通往超智慧的可能路徑，也因為它可能改寫這場 AI 競賽的規則。當 AI 開始大幅承接 AI 本身的研發工作，比拚的重點，或許將從誰擁有最多 GPU，轉向誰能最快建立起「AI 研發 AI」的飛輪。

只是，這顆飛輪究竟能轉多快、又能轉多遠，仍是未知數。《Financial Times》引述 Apollo Research 負責人 Marius Hobbhahn 的提醒，所有人都在衝刺，「卻沒有人知道該如何安全地做到」；牛津大學教授 Michael Wooldridge 則認為，這個概念「非常接近《魔鬼終結者》的劇情」，而「它究竟能走多遠，目前並不清楚」。無論如何，Anthropic 那記反方向的煞車聲，已經把這個問題推到了檯面上。

＊本文開放合作夥伴轉載，資料來源：Anthropic、《VentureBeat》、《TechCrunch》、《Financial Times》、《SiliconAngle》，首圖來源： Anthropic

Cookie	Duration	Description
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

RSI 是新的 AGI：矽谷追逐的最終魔王關，為何讓 Anthropic 呼籲全球按下暫停鍵？

Anthropic 為何示警？逾 80% 程式碼已由 Claude 寫成

RSI：AI 自己打造下一代自己

繼 AGI 之後的新關鍵字，眾人競逐這顆「最終魔王」

RSI 到底到了沒？業界意見分歧

AI 競爭規則正在改寫

TO 會員電子報

台灣 AI 採用贏全球，產出成果卻落後一截？微軟揭企業 AI 的導入盲點

南韓砸逾 8,800 億美元打造 AI 國家隊：拆解台、日、韓的 AI 國力競賽

從 8 小時到 22 秒就能破解！當 AI 變成駭客工具，你的公司準備好了嗎？（下篇）

資安長看不到的「暗物質」：放手讓 AI 自動修補前，先過 5 道門檻