在全球 AI 競賽全力加速的此刻,身處第一線的 Anthropic 卻提出一個反方向的呼籲。Anthropic 在官方部落格中警告,AI 系統正接近能在無人監督下自我改進的臨界點,並呼籲全球頂尖實驗室考慮一項協調一致的協議,暫停或至少放慢前沿模型的開發步調。
這篇部落格文章由 Anthropic 內部研究主管 Marina Favaro 與政策主管 Jack Clark 共同撰寫,他們認為模型的進展正逐漸逼近一個理論概念:遞迴式自我改進(Recursive Self-Improvement,RSI)。他們表示有理由相信,某些模型可能在短短兩年內就具備這項能力。
COMPUTEX 2026 現在進行中!最新報導都在【TO Highlight】直擊 COMPUTEX 2026 台北國際電腦展
Anthropic 為何示警?逾 80% 程式碼已由 Claude 寫成
Anthropic 之所以這麼說,是因為它在自家內部看到了具體訊號。《VentureBeat》報導,截至 2026 年 5 月,Anthropic 合併進生產環境程式庫的程式碼中,有超過 80% 是由其 AI 模型 Claude 撰寫,而非人類;Anthropic 補充,在 Claude Code 於 2025 年 2 月推出研究預覽前,這個比例還只有個位數的低點。連帶地,相較於 2021 至 2025 年的基準,每位工程師每季交付的程式碼量增為 8 倍。
更關鍵的是 AI 在「研發 AI」這件事上的進步。Anthropic 攤開數據:在優化實驗的測試中,2025 年 5 月的 Claude Opus 4 平均能讓訓練程式碼加速約 3 倍,到了 2026 年 4 月,Claude Mythos Preview 已達到約 52 倍,而一名熟練的人類研究員要達到 4 倍加速,通常得花上四到八小時。在最開放、沒有明確規格的工程任務上,Claude 的成功率在 2026 年 5 月達到 76%,半年內提升了 50 個百分點。Anthropic 還舉例,2026 年 4 月,Claude 自主交付了 800 多項修正,把某一類 API 錯誤降低為原本的千分之一,而監督的工程師估計,同樣的工作由人類來做得花上四年。
Anthropic 也坦言,程式碼行數不是完美指標,不能直接等於真實生產力提升,但這確實顯示 AI 已開始大幅改變研發節奏。Anthropic 內部研究主管 Marina Favaro 與政策主管 Jack Clark 在文章中指出,如果 AI 系統最終能完全自主設計與開發自己的後繼版本,這將是科技史上的重大轉折。它可能推動科學、醫療與工程突破,但也可能放大人類失去控制的風險。
這也是為什麼 Anthropic 主張,全球應該至少保留一個可選項:在必要時,讓前沿 AI 開發能夠以可驗證方式放慢或暫停,好讓社會制度與 AI 對齊研究跟上技術速度。
那麼,讓 Anthropic 如此戒慎的 RSI,究竟是什麼?
RSI:AI 自己打造下一代自己
《TechCrunch》稱「RSI 是新的 AGI」,原因在於兩者同樣具有強烈想像空間,也同樣難以精準界定。其初步解釋,RSI 指的是一套能持續自我升級的 AI 系統;一旦 AI 管理升級循環的能力勝過人類,整個過程就會變成一個封閉迴圈,只受限於它能取得的運算資源,而人類不再是必要、甚至不再有幫助。
《Financial Times》則以「飛輪效應」描述這個概念:自學的 AI 不斷打造更強、更高效的新版本,一代接一代重複這個動作。Anthropic 給出的定義最為直接:RSI 是一套能完全自主設計並開發自身後繼者的 AI 系統。
繼 AGI 之後的新關鍵字,眾人競逐這顆「最終魔王」
RSI 之所以受到關注,也因為它已經不只是 Anthropic 的安全議題。《TechCrunch》指出「遞迴」已成為 AI 圈最新的流行語,更有兩家新創直接以此命名,更多公司也將 RSI 寫進發展藍圖;就像先前的 AGI 一樣,RSI 也成了象徵 AI 急速起飛的代名詞,儘管大家對它的確切定義仍有分歧。
追逐這個目標的,來自各大頂尖實驗室。《Financial Times》指出,這是一場由 OpenAI、Anthropic 與一群快速增加的新創共同投入的競賽。
Google DeepMind 負責人 Demis Hassabis 在 Google I/O 大會上即宣稱,回頭看這段時期,會發現「我們正站在奇點的山腳下」;OpenAI 執行長 Sam Altman 則在去年 10 月設下目標,要在 2028 年 3 月前打造出「真正的自動化 AI 研究員」。OpenAI 創始成員、特斯拉前 AI 總監 Andrej Karpathy,更把 RSI 稱為「最終魔王關」,並斷言「做這件事『只是工程問題』,而且一定會成功」;他目前已加入 Anthropic 從事預訓練工作。
在新創端,知名研究者 Richard Socher 與 DeepMind、OpenAI 前研究員今年 5 月共同創辦了 Recursive Superintelligence,就明確以 RSI 為目標;這家公司在成立短短數月後便以 40 億美元估值募得 6.5 億美元。此外,由 Sara Hooker 創辦的 Adaption 推出 AutoScientist 工具,試圖自動化前沿模型訓練;Disarray 創辦人 Doris Xin 的自訓機器學習代理,則在一場 Kaggle 競賽中拿下 28 面獎牌,擊敗許多人類訓練的代理。
RSI 到底到了沒?業界意見分歧
不過這場競賽究竟走到哪裡,看法分歧。Google 執行長 Sundar Pichai 接受外媒訪談時相對保守,他表示這是一個連續的過程、大家都在進步,但「以人們描述 RSI 的方式來說,我們還沒真正到那裡」。
目前 AI 最大的缺口仍在於方向判斷。Anthropic 也承認,Claude 已能在明確目標下執行複雜任務,例如最佳化訓練程式碼、修復錯誤、加速實驗流程;但在選擇哪些問題值得研究、哪些結果可信、何時應該放棄某條路線等「研究品味」上,人類仍具有明顯優勢。
《TechCrunch》也引述喬治城大學 CSET 主任、OpenAI 前董事 Helen Toner 的觀點:單純用 AI 工具來做 AI 研究,並不足以稱為 RSI,因為它的經典定義是「不需要任何人類」。她引用 METR 研究者 Ajeya Cotra 提出的里程碑:當系統在移除所有人類後仍能研究,稱為「足夠」;純 AI 與純人類系統一樣擅長研究,稱為「對等」;純 AI 勝過人機協作,則為「超越」。Cotra 認為 AI 已很接近「足夠」門檻。
實驗室內部的訊號則喜憂參半。《TechCrunch》指出,與 Mythos 預覽相關的一份調查中,18 位 Anthropic 工程師裡有 5 位認為,若工具鏈再改進,這版 Mythos 可望很快取代一名 L4 工程師(能在無人監督下承接複雜專案的中階程式設計師)。但報告也同樣列出 Claude 的主要弱點,包括自我管理長達一週的模糊任務、理解組織優先順序、品味、驗證與認識論能力。
AI 競爭規則正在改寫
RSI 之所以值得關注,不只因為它被視為通往超智慧的可能路徑,也因為它可能改寫這場 AI 競賽的規則。當 AI 開始大幅承接 AI 本身的研發工作,比拚的重點,或許將從誰擁有最多 GPU,轉向誰能最快建立起「AI 研發 AI」的飛輪。
只是,這顆飛輪究竟能轉多快、又能轉多遠,仍是未知數。《Financial Times》引述 Apollo Research 負責人 Marius Hobbhahn 的提醒,所有人都在衝刺,「卻沒有人知道該如何安全地做到」;牛津大學教授 Michael Wooldridge 則認為,這個概念「非常接近《魔鬼終結者》的劇情」,而「它究竟能走多遠,目前並不清楚」。無論如何,Anthropic 那記反方向的煞車聲,已經把這個問題推到了檯面上。

*本文開放合作夥伴轉載,資料來源:Anthropic、《VentureBeat》、《TechCrunch》、《Financial Times》、《SiliconAngle》,首圖來源: Anthropic



