Search
Close this search box.

Anthropic 推出 Fable 5 與 Mythos 5,最重要的升級其實不是模型

今年 4 月,Anthropic 首度公開 Mythos Preview 模型時,曾以資安風險為由拒絕全面開放。當時 Anthropic 認為,這類模型如果直接開放,可能被惡意攻擊者用來開發新的網路工具。然而不到三個月,Anthropic 在今日正式發表 Claude Fable 5 與 Claude Mythos 5,首次把 Mythos 級能力以 Fable 5 的形式推向大眾市場。仔細觀察,這次並非單純的新模型發布,Anthropic 想回答的問題是,如何讓最強的模型,安全地進入商業世界。

Fable 5 與 Mythos 5 差異不在模型,而在治理層

可能會有人以為,Fable 5 與 Mythos 5 是兩款不同模型。但 Anthropic 明確指出,兩者使用的是相同底層模型(same underlying model)。其中真正差異在於安全控制機制。

根據《WIRED》報導,針對大眾開放的 Fable 5 雖然與 Mythos 5 是相同底層模型,但前者內建了極為嚴格的分類器(Classifiers)與安全護欄(Safeguards)機制,會擋下許多與資安、生物、化學相關的提問,並把這些請求轉交給前一代旗艦模型 Claude Opus 4.8 回答;若 Anthropic 懷疑使用者試圖對 Fable 5 進行「蒸餾」(以大模型的回應訓練小模型),相關請求同樣會被轉走。Anthropic 表示,發生轉接時會告知使用者。

Mythos 5 則相反:能力限制較少,但取得門檻高得多。《VentureBeat》指出,它是先前限量釋出的 Mythos Preview 的升級版,部分護欄已解除,但僅開放給 Anthropic 核准的使用者,包括 Project Glasswing 的資安夥伴與獲選的生物研究人員。

Anthropic 也表示,Mythos 5 將與美國政府合作部署,是「全世界資安能力最強的模型」,未來打算透過更廣泛的「受信任存取計畫」擴大開放。Anthropic 在官方部落格中也預告,將另開一個生物領域的受信任計畫,提供解除生物與化學護欄(但保留資安護欄)的版本給少數生命科學研究者。

為何現在敢開放?「不是模型變弱,是護欄變強」

Anthropic 改變態度的理由,來自對安全機制的信心。Anthropic 產品管理、研究與實驗室主管 Dianne Penn 告訴《Fortune》:「我們現在釋出 Fable 5,很大程度是因為我們對既有的安全護欄更有信心。」

過去幾個月,Anthropic 針對分類器進行大量內外部紅隊測試(red teaming)。根據該公司說法,超過 1,000 小時測試中,研究人員並未找到能穩定繞過系統的通用越獄方法。《VentureBeat》補充,一家外部夥伴發現,在涉及策劃網攻、開發攻擊程式或規避防禦的單輪有害請求上,即使套用 30 種公開越獄技巧,Fable 5 的配合次數為零。

不過 Anthropic 也坦承代價。官方表示,為了盡快又安全地釋出,護欄刻意調得保守,「有時無害的請求也會觸發分類器」,平均不到 5% 的工作階段會被觸發,其目標是在上市後盡快降低誤判。Penn 告訴《WIRED》,這套保護機制設計上寧可過度謹慎,「這是我們目前能廣泛釋出這個模型唯一安全的方式」。

史上最強公開版 Claude:能力與價格都創新高

撇開護欄,Fable 5 本身的能力相當突出。Anthropic 表示,Fable 5 的能力「超越我們先前公開提供過的任何模型」,在幾乎所有測試基準上都是當前最佳,任務越長、越複雜,領先幅度愈大。

在衡量困難軟體工程任務的 SWE-bench Pro 上,Fable 5 與 Mythos 5 達到 80.3%,大幅超越 OpenAI 最新一代通用模型 GPT-5.5 的 58.6%;在 Cognition 的 FrontierCode Diamond 基準上拿下 29.3%,對比 Opus 4.8 的 13.4% 與 GPT-5.5 的 5.7%。

圖片來源:Anthropic

一個具體的客戶案例來自 Stripe。Anthropic 表示,Stripe 在一個 5,000 萬行的 Ruby 程式庫中測試 Fable 5,模型一天內完成了原本需要整個團隊手動做兩個多月的全程式庫遷移。

Penn 指出,Fable 5 特別擅長「長程記憶管理」,先前的模型在漫長複雜的任務中有時會跟丟線索,新模型則能記住自己在做什麼,並更主動地自我查核、驗證假設與修正方向;她建議客戶「把最具挑戰性的工作交給 Fable 5」,例如讓它通宵執行超長程專案、檢視整個程式庫找出改進空間。視覺能力方面,Anthropic 舉例,先前的 Claude 模型即使配有輔助工具也難以玩《Pokémon FireRed》遊戲,Fable 5 卻只靠最小化的純視覺介面就破關。

強大的能力也反映在價格上。兩款模型定價均為每百萬輸入 token 10 美元、每百萬輸出 token 50 美元。這是 Anthropic 一般公開模型的兩倍,但僅為 Mythos Preview 定價的一半以下。

《AXIOS》引述 Penn 的回應:費用是相對的,Mythos 級模型提供更高的智慧與表現,讓客戶「每項任務的整體成本更低」。取得方式上,Fable 5 即日起對 Pro、Max、團隊與企業方案開放,但免費試用期僅到 6 月 22 日,之後須額外購買用量點數才能使用;Anthropic 表示若容量允許會延長免費期間,並希望盡快把 Fable 5 納入為訂閱方案的標準配備。

這對於企業意味著什麼

另一個企業必須留意的,是新的資料保留政策。《VentureBeat》指出,Anthropic 將對 Fable 5、Mythos 5 與未來同等級以上的模型,要求所有流量保留 30 天,涵蓋第一方與第三方介面;該公司承諾不會用這些資料訓練新模型或用於非安全目的,並加入記錄人為存取、30 天後幾乎一律刪除等隱私保護。對重視資料控制的受監管產業而言,這可能成為採購評估的關鍵問題。

這次發布正值 Anthropic 的關鍵時刻:其一週多前才宣布已秘密遞交 IPO 申請文件草案,其主要對手 OpenAI 也在週一宣布秘密遞件。《WIRED》點出其中的商業張力:Anthropic 想在科技業尚未完全解決這類模型的資安疑慮前,就讓 Mythos 級模型進入一般市場,而護欄在真實世界中能撐多久,仍有待觀察。畢竟,正如《VentureBeat》提醒的,企業市場檢驗的不只是基準分數,還有可靠度、誤判率、資料保留的取捨與規模化後的成本。

無論如何,今日的新模型發布,象徵著 Claude 產品線出現了明顯轉變。過去 Anthropic 的做法是先限制能力,再逐步開放;如今則開始嘗試另一條路:維持最前沿模型能力不變,改以分類器、存取權限與治理框架控制風險。從 Fable 5 與 Mythos 5 的雙軌策略來看,Anthropic 正試圖證明一件事:前沿 AI 的商業化,不一定要建立在能力閹割之上,而可以建立在更細緻的治理機制之上。

【推薦閱讀】

RSI 是新的 AGI:矽谷追逐的最終魔王關,為何讓 Anthropic 呼籲全球按下暫停鍵?

「沒有台灣就沒有 Anthropic。」Anthropic 高層來台,點名台灣在 AI 生態系三個不可取代的角色

趨勢科技加入 Anthropic Project Glasswing:將前沿 AI 模型化為防禦武器,守住台灣 AI 供應鏈防線

*本文開放合作夥伴轉載,資料來源:Anthropic《WIRED》《VentureBeat》《Business Insider》《AXIOS》《Fortune》,首圖來源:Anthropic