Anthropic 與白宮從對抗轉向合作:一場管制風波,正逼出 AI 安全新規則

當美國以國家安全為由對 Anthropic 祭出出口管制、迫使其最先進的 Fable 5 與 Mythos 5 模型全面下架時,根據《POLITICO》報導,這場衝突正轉向更有建設性的方向:白宮與 Anthropic 已開始共同制定一套框架,用來評估新一代 AI 模型安全漏洞的嚴重程度,並據此決定政府是否需要介入。這意味著,雙方的角力可能正從對抗,轉向替前沿 AI 的安全風險評估建立一套共同標準。

從互相對立到共建框架,談判桌上的轉向

這套正在成形的機制,目標是建立一組共同基準,用來衡量未來 Jailbreak(越獄)事件的三個面向:模型護欄被繞過的程度、因此暴露出的能力,以及漏洞實際造成的後果。據《POLITICO》指出,談判由 Anthropic 公共政策主管 Sarah Heck 與共同創辦人 Tom Brown 帶領。

值得注意的是,這場談判的基礎,反映出雙方正逐漸收斂出一個共識:沒有任何 AI 模型能完全免於被入侵。與其追求不可能達成的「零漏洞」,政府應訂出一套規則,讓企業有所依循地衡量風險:這個立場,是從原本針鋒相對的兩端慢慢靠近的結果。

雙方過去一週的談判並不平順。據《POLITICO》報導,最初雙方一度近乎破局,起因是 Anthropic 拒絕政府要求其撤下 Fable 5 的指令,主張該漏洞影響有限、不構成實質的安全缺陷。白宮隨即以出口管制回應,禁止海外用戶存取該模型,迫使公司將其下架。

隨後,川普政府官員向《WIRED》表示,如果 Anthropic 希望重新發布 Fable 5,就必須證明該模型的安全防護機制(guardrails)無法被繞過。不過據《POLITICO》報導,隨著談判推進,雙方並未停在這種要求上,而是逐漸把焦點移到前述的共同前提:與其糾結於單一漏洞的對錯,不如建立一套客觀的評估標準。

然而,Anthropic 共同創辦人 Tom Brown、美國商務部長 Howard Lutnick 與國家網路總監 Sean Cairncross 接著進行了數通冗長的電話會談,最終促成將近一週的華府面對面會議;Anthropic 並在 6 月 15 日派出資深研究員與安全防護專家前往商務部,試圖修補關係。截至本文發稿,出口管制尚未解除,但從爭執本身轉向技術標準的制定,本身就是談判向前推進的訊號。

為何需要這套制度?AI 監管的混亂現狀

要理解這套框架為何重要,得先看美國 AI 監管目前的處境。這次爭端的核心,在於技術進展的速度已經超越政府既有的治理基礎建設。當 Anthropic 與行政官員對同一個 Jailbreak 的嚴重程度各執一詞時,雙方其實缺乏一套公認的標準來判定誰對誰錯。

《CNN》的報導點出,這場爭端暴露出一個更廣泛的隱憂:美國目前並沒有一套透明、一致的 AI 監管框架,而這樣的真空狀態,最終可能反過來扼殺美國本土的 AI 產業。

這樣的擔憂其來有自。事件爆發後,數十位資安研究員、AI 創業者與企業高層連署公開信,批評政府的處置方式,並呼籲行政部門承諾在未來建立「開放、科學且透明」的 AI 風險評估流程。連署者也指出,先進 AI 模型同樣能被善意的防禦方使用,若在沒有充分理由的情況下,把最強的能力從防禦者手中抽走,反而是危險的。

對於漏洞的嚴重性,業界看法分歧。包括 Facebook 前資安長 Alex Stamos 在內的多位 AI 安全研究員表示,他們看過美國政府決策背後的研究,並不認同其評估,認為其中雖有部分有效的發現,但沒有獨特到足以撐起如此激烈反應的能力。川普政府 AI 顧問 David Sacks 則持相反立場,認為一個能讓網路武器運作的 Jailbreak,很難被定義為「不嚴重」。喬治華盛頓大學政府採購法副院長 Jessica Tillipman 的評論則更尖銳,她認為問題不在於政府行使了裁量權:國家安全本就需要這樣的彈性空間,但問題在於整個過程「缺乏任何有意義的程序」。

正因如此,這套標準化的評估框架,被視為填補監管真空的一步。一個能客觀衡量漏洞嚴重程度的共同基準,或許能讓未來類似的爭議,不再淪為各說各話的角力。

真正的問題:誰有資格定義風險

把這些線索拼起來,會看到一個共同的指向。無論是白宮與 Anthropic 共建的評估框架,還是連署信對透明流程的要求,爭論的核心其實都不是哪一家公司擁有最強的模型,而是當 AI 能力持續逼近國家安全與經濟安全的邊界時,誰有資格定義模型的風險,又是誰握有最終的裁決權。

Anthropic 事件留下的真正問題,或許從來不是某個模型是否存在漏洞,而是當 AI 能力開始影響國家安全時,誰有權定義風險、誰有權決定模型能否繼續運作,以及這些決策應受到哪些程序與監督約束。這套答案,未來很可能成為美國乃至全球 AI 治理的重要基礎。

【推薦閱讀】

川普對 Anthropic 禁令引爆 G7 角力:AI 出口管制戰場,已從晶片變「誰能用模型」

Anthropic 監管立場大轉向:Dario Amodei 為何發長文主張政府有權阻止 AI 上線?

Anthropic 推出 Fable 5 與 Mythos 5,最重要的升級其實不是模型

*本文開放合作夥伴轉載,資料來源:《Business Insider》《Politico》《CNN》《WIRED》,首圖來源:Anthropic