OpenAI 再次將「AI 代理」帶進一個新領域──資安研究。該公司本週正式推出全新人工智慧代理 Aardvark,能模擬人類安全研究員一樣,自主發現、驗證並說明程式碼漏洞。這款工具目前處於內部測試階段,但已開放企業申請搶先體驗。
Aardvark 的出現,意味著開發者能在不依賴傳統滲透測試或模糊測試(fuzzing)的情況下,藉由 AI 來即時掃描並理解整個程式碼庫的弱點結構。《AXIOS》指出,這項創新可望改變資安攻防的權力平衡,讓「防守方」比駭客更早一步發現問題。
從 GitHub 直接啟動,AI 代理 24 小時掃描漏洞
依 OpenAI 説明,Aardvark 是一款以 GPT-5 為核心的「代理型安全研究員」,可連結使用者的 GitHub 環境,自動持續進行程式碼分析。它會先讀完整個程式碼庫,建立威脅模型與架構理解,接著在每次新提交(commit)後即時比較差異,找出潛在漏洞。
不同於傳統工具僅依靠字串比對或靜態掃描,Aardvark 透過大型語言模型(LLM)的推理與工具使用能力,能理解程式語意與邏輯結構,並在沙箱環境中模擬漏洞觸發過程,以驗證可利用性。確認後,根據嚴重程度排序,附上程式碼註解、說明與修補建議,協助開發者理解原因與影響。
OpenAI 資安副總 Matt Knight 表示:「在某種程度上,Aardvark 找漏洞的方式,與人類安全研究員非常相似。」
不自行修補、但能提出修補方案──與 Codex 協作
不過,Aardvark 本身並不會自動修補程式,但當發現漏洞後,它會使用 OpenAI 的 AI 寫程式工具 Codex 生成修補建議,並由開發者在審核後決定是否採用。
此設計保留了人類最終決策權,避免 AI 在企業級程式碼中進行未經授權的修改。
OpenAI 透露,Aardvark 早在公司內部開發團隊中使用數月,成功找出 10 個此前未公開的開源軟體漏洞,後續都被官方收錄為 CVE(Common Vulnerabilities and Exposures)項目。在「黃金」程式庫的基準測試中,Aardvark 識別率達 92%。OpenAI 強調,該工具的高準確率與低誤報率是其主要差異化優勢。
目前 Aardvark 以邀請制內部測試的形式運作,開放邀請制申請。參與企業需使用 GitHub Cloud,並同意在 Beta 階段提供操作回饋。OpenAI 強調,測試期間提交的代碼不會用於模型訓練。另針對部分非商業開源專案,OpenAI 提供免費漏洞掃描服務,希望藉此強化軟體供應鏈安全。
戰略意涵:「Agentic AI 系統」專業化關鍵拼圖
OpenAI 今年即推出多款具「行動能力」的 AI 代理,包括可操作虛擬電腦與瀏覽器的 ChatGPT Agent、以及用於自動撰寫程式的 Codex。Aardvark 的推出,代表 OpenAI 正全面邁向具備特定領域能力的代理式 AI 系統(agentic AI systems)。
在資安任務上,此類代理的價值尤為明確:OpenAI 內部統計顯示,2024 年新增 CVE 超過 4 萬個,平均每百筆 commit 約有 1.2% 引入新錯誤。
《VentureBeat》分析,對資安領導者而言,資安 AI 代理能在人力有限下擴充能量、降低警報疲勞,把時間留給策略性事件;對產品化的 AI 工程師,可減少快速迭代中潛在漏洞滲入;而對負責分散式部署的團隊,Aardvark 的沙箱驗證與持續回饋循環可與 GitHub 工作流程無縫整合;對資料基礎設施團隊,持續代碼審查機制能把風險前移到開發生命週期早期。
Aardvark 將自身定位為「防禦優先」的 AI,與開發人員的工作流程緊密整合,目標是讓資安不再是事後補救,而是持續進行的開發流程一部分。
*本文開放合作夥伴轉載,資料來源:OpenAI、《ZDNET》、《AXIOS》、《Venturebeat》,首圖來源:AI 工具生成



