Anthropic 與白宮從對抗轉向合作：一場管制風波，正逼出 AI 安全新規則

當美國以國家安全為由對 Anthropic 祭出出口管制、迫使其最先進的 Fable 5 與 Mythos 5 模型全面下架時，根據《POLITICO》報導，這場衝突正轉向更有建設性的方向：白宮與 Anthropic 已開始共同制定一套框架，用來評估新一代 AI 模型安全漏洞的嚴重程度，並據此決定政府是否需要介入。這意味著，雙方的角力可能正從對抗，轉向替前沿 AI 的安全風險評估建立一套共同標準。

從互相對立到共建框架，談判桌上的轉向

這套正在成形的機制，目標是建立一組共同基準，用來衡量未來 Jailbreak（越獄）事件的三個面向：模型護欄被繞過的程度、因此暴露出的能力，以及漏洞實際造成的後果。據《POLITICO》指出，談判由 Anthropic 公共政策主管 Sarah Heck 與共同創辦人 Tom Brown 帶領。

值得注意的是，這場談判的基礎，反映出雙方正逐漸收斂出一個共識：沒有任何 AI 模型能完全免於被入侵。與其追求不可能達成的「零漏洞」，政府應訂出一套規則，讓企業有所依循地衡量風險：這個立場，是從原本針鋒相對的兩端慢慢靠近的結果。

雙方過去一週的談判並不平順。據《POLITICO》報導，最初雙方一度近乎破局，起因是 Anthropic 拒絕政府要求其撤下 Fable 5 的指令，主張該漏洞影響有限、不構成實質的安全缺陷。白宮隨即以出口管制回應，禁止海外用戶存取該模型，迫使公司將其下架。

隨後，川普政府官員向《WIRED》表示，如果 Anthropic 希望重新發布 Fable 5，就必須證明該模型的安全防護機制（guardrails）無法被繞過。不過據《POLITICO》報導，隨著談判推進，雙方並未停在這種要求上，而是逐漸把焦點移到前述的共同前提：與其糾結於單一漏洞的對錯，不如建立一套客觀的評估標準。

然而，Anthropic 共同創辦人 Tom Brown、美國商務部長 Howard Lutnick 與國家網路總監 Sean Cairncross 接著進行了數通冗長的電話會談，最終促成將近一週的華府面對面會議；Anthropic 並在 6 月 15 日派出資深研究員與安全防護專家前往商務部，試圖修補關係。截至本文發稿，出口管制尚未解除，但從爭執本身轉向技術標準的制定，本身就是談判向前推進的訊號。

為何需要這套制度？AI 監管的混亂現狀

要理解這套框架為何重要，得先看美國 AI 監管目前的處境。這次爭端的核心，在於技術進展的速度已經超越政府既有的治理基礎建設。當 Anthropic 與行政官員對同一個 Jailbreak 的嚴重程度各執一詞時，雙方其實缺乏一套公認的標準來判定誰對誰錯。

《CNN》的報導點出，這場爭端暴露出一個更廣泛的隱憂：美國目前並沒有一套透明、一致的 AI 監管框架，而這樣的真空狀態，最終可能反過來扼殺美國本土的 AI 產業。

這樣的擔憂其來有自。事件爆發後，數十位資安研究員、AI 創業者與企業高層連署公開信，批評政府的處置方式，並呼籲行政部門承諾在未來建立「開放、科學且透明」的 AI 風險評估流程。連署者也指出，先進 AI 模型同樣能被善意的防禦方使用，若在沒有充分理由的情況下，把最強的能力從防禦者手中抽走，反而是危險的。

對於漏洞的嚴重性，業界看法分歧。包括 Facebook 前資安長 Alex Stamos 在內的多位 AI 安全研究員表示，他們看過美國政府決策背後的研究，並不認同其評估，認為其中雖有部分有效的發現，但沒有獨特到足以撐起如此激烈反應的能力。川普政府 AI 顧問 David Sacks 則持相反立場，認為一個能讓網路武器運作的 Jailbreak，很難被定義為「不嚴重」。喬治華盛頓大學政府採購法副院長 Jessica Tillipman 的評論則更尖銳，她認為問題不在於政府行使了裁量權：國家安全本就需要這樣的彈性空間，但問題在於整個過程「缺乏任何有意義的程序」。

正因如此，這套標準化的評估框架，被視為填補監管真空的一步。一個能客觀衡量漏洞嚴重程度的共同基準，或許能讓未來類似的爭議，不再淪為各說各話的角力。

真正的問題：誰有資格定義風險

把這些線索拼起來，會看到一個共同的指向。無論是白宮與 Anthropic 共建的評估框架，還是連署信對透明流程的要求，爭論的核心其實都不是哪一家公司擁有最強的模型，而是當 AI 能力持續逼近國家安全與經濟安全的邊界時，誰有資格定義模型的風險，又是誰握有最終的裁決權。

Anthropic 事件留下的真正問題，或許從來不是某個模型是否存在漏洞，而是當 AI 能力開始影響國家安全時，誰有權定義風險、誰有權決定模型能否繼續運作，以及這些決策應受到哪些程序與監督約束。這套答案，未來很可能成為美國乃至全球 AI 治理的重要基礎。

【推薦閱讀】

◆ 川普對 Anthropic 禁令引爆 G7 角力：AI 出口管制戰場，已從晶片變「誰能用模型」

◆ Anthropic 監管立場大轉向：Dario Amodei 為何發長文主張政府有權阻止 AI 上線？

◆ Anthropic 推出 Fable 5 與 Mythos 5，最重要的升級其實不是模型

＊本文開放合作夥伴轉載，資料來源：《Business Insider》、《Politico》、《CNN》、《WIRED》，首圖來源：Anthropic

Cookie	Duration	Description
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

Anthropic 與白宮從對抗轉向合作：一場管制風波，正逼出 AI 安全新規則

從互相對立到共建框架，談判桌上的轉向

為何需要這套制度？AI 監管的混亂現狀

真正的問題：誰有資格定義風險

TO 會員電子報

Anthropic 與白宮從對抗轉向合作：一場管制風波，正逼出 AI 安全新規則

【AI 經濟新藍圖】矽谷創投提三階段美國財稅藍圖，用運算稅與主權基金重建社會安全網

直擊 AI Agent 創造高生產力實戰：Qualcomm 與 MoBagel 共同打造安全地端 AI 平台、鴻海 CityGPT 提升智慧城市決策效能

【AI 代理越學越退步？】「決策脈絡圖」框架補強 RAG，整合背景讓決策更精確