AI 巨頭自己怎麼用 AI？OpenAI、Google、Anthropic 員工正從執行者變「審稿人」

未來工作會長什麼樣子？看看那些打造出 AI 工具的公司怎麼用 AI，或許可以找到答案。《華爾街日報》報導，當許多企業還在想辦法催員工使用 AI 時，OpenAI、Google 與 Anthropic 已經走到下一步：把複雜的多步驟任務直接交給 AI「Agent（代理）」，讓員工轉而扮演「審稿人」的角色，負責對 AI 的產出做事實查核。

只是，把工作託付給一個會自己跑出去執行任務的 Agent，本身就是一場信任的賭注。《華爾街日報》指出，這些走在最前面的公司也承認，過程中曾出現大量信件被誤刪、程式碼憑空消失等狀況；而且即使一切順利，Agent 有時還會替人類製造出新的工作。換句話說，AI Agent 上工的真正挑戰，才正要浮現。

三巨頭的辦公室實況：人類從「執行者」變「審稿人」

在 OpenAI，整套自動化工作流的骨幹是 Codex。這項工具原本是為軟體開發者設計，卻連 OpenAI 行銷、招募這類非技術團隊也能上手，目前近乎全體員工每週都在使用。Codex 部署工程師 Kelsey Pedersen 向《華爾街日報》形容，員工開始把它拿來做各種事，如今它已經變成一個通用的知識工作工具。

具體的用法已經滲進日常。OpenAI 市場團隊的客戶總監 Ashton Summers 收到一則帳單金額有誤的客訴，過去他得跑去找帳務與營運團隊調查，現在 Codex 把所有跑流程的雜事都做完，他只需驗證結果。他說，這等於移除了一堆瓶頸，也降低了對其他團隊的依賴。根據報導，Codex 還替他建了一個每日自動更新的儀表板、替他要拜訪的潛在客戶做產品展示，甚至花了約 30 分鐘爬梳他的電子郵件與 Slack 訊息，為新進同事整理出一份交接文件。

法務端的轉變也值得玩味。OpenAI 副法務長 Nicole Diaz 開始讓 Codex 承接原本由初階律師處理的工作，包括分析新進員工申報的利益揭露、草擬回覆，例如 Codex 可能會標記出某位新人仍在另一家新創的董事會任職、或有兄弟在競爭對手 Anthropic 工作。值得注意的是，Diaz 表示她仍持續聘用初階律師，部分原因正是要有人來審查 Codex 的產出。

Google 則習慣自稱「customer zero（零號客戶）」，也就是搶在客戶之前先試用自家要推出的產品。《華爾街日報》報導，Google 由數千名員工組成的財務團隊，去年導入一個發票驗證 Agent，把廠商發票與合約條款逐一比對、確認無誤。Google Business Services 主管 Van Bui 指出，過去得靠一個團隊枯燥地逐條檢視合約，導入 Agent 後審查量提升為五倍。原本負責發票核對的員工，如今轉而執行更高層級的稽核並審查 AI 的工作成果，Bui 把這形容成員工正在學習的新技能。

效益的數字也很可觀。Google 財務組織負責推動 AI 導入的副總裁 Kristin Reinke 向《華爾街日報》表示，這個 Agent 預估一年可替公司省下約 2 億美元的發票溢付損失。她並說明，財務團隊也用 AI 協助管理散落在數千個銀行帳戶裡的現金，並依風險容忍度等條件建議投資標的，由人類團隊審查方案是否合理，再交由另一個 Agent 去執行交易；財務團隊的人數維持不變，產出卻變多了。

Anthropic 的情況也呼應同樣的模式。在行銷營運部門工作的 Annabel Custer，過去得手動建立活動頁面、自己處理資料匯入，光一次匯入就可能耗掉 15 分鐘到一小時；現在她用 Anthropic 自家的 Claude 把這兩件事都自動化。她讓一個 Claude agent 擔任「builder（建置者）」、另一個擔任「auditor（稽核者）」負責摘要前者做了什麼，再由她統一審查。

Custer 坦言，剛開始用 Claude 處理多步驟任務時，最大的挑戰是不知道該問對的問題、該怎麼引導它，Claude 有時會跳過步驟、或對她的建議提出異議，甚至曾反問她某項任務是不是值得它花時間去做。她學會了放慢腳步、反覆修改指令；一旦放下舊有的做法、順著 AI 的節奏走，她說，會發現它能解鎖很多不一樣的可能。

三家公司的做法不盡相同，卻指向同一個共同點：人類正從任務的執行者，轉變為 AI 產出的審稿人。

知識工作者比開發者更快擁抱 Agent，開始「並行」工作

這股轉變不只發生在少數明星部門。根據 OpenAI 在 6/2 發布的《The Next Era of Knowledge Work》報告，知識工作者目前約占 Codex 用戶的兩成，採用速度是開發者的三倍以上，涵蓋產品與專案管理、設計、研究與學術等角色。

報告分析，軟體工作與知識工作之間的界線正在模糊：開發者拿 Codex 來產出知識性的文件，而知識工作者則用它來寫程式、處理工程操作。產品經理可以自己把儀表板建出來，而不必委託另一個團隊；研究者親手寫資料清理腳本，而不必繞道工程部門。最靠近問題的人，得以自己把缺的工具做出來，不必苦等正式的軟體排程批准與交付。

更關鍵的是使用行為的轉變。OpenAI 在報告中指出，影響最深遠的一項數據，是用戶正大量轉向「並行」處理任務：約 50% 的用戶在一天當中的某個時點，會同時跑超過一個 Codex 任務，這個比例在 4 月中旬還不到三分之一。從循序操作轉向並行操作，意味著一名知識工作者可以用一支小團隊的規模運作；使用者的角色，從逐一執行單一任務，變成多條工作流的協調者。

Agent 越用越多，反而逼出新瓶頸與治理難題

不過，把更多工作交給 Agent，並不會讓問題自動消失，有時反而會逼出新的瓶頸。《華爾街日報》報導，Google 工程院士 Partha Ranganathan 把這稱為「10X 問題」：當你把某個工作流的處理量放大十倍，系統裡的其他環節可能就會被波及。

以前述的發票驗證 Agent 為例，正因為它運作得太順，反而累積出一批被標記出來、需要營運團隊回頭去跟供應商交涉的爭議件；Google 的解法是，再打造另一個 Agent 來啟動聯繫供應商的流程。

這類「Agent 製造出更多 Agent」的現象，正在演變成企業層級的管理難題。根據市場研究機構 Gartner 的預估，到了 2028 年，一家全球型 Fortune 500 企業平均將有超過 15 萬個 Agent 在運作，而 2025 年這個數字還不到 15 個。Gartner 資深總監分析師 Max Goss 指出，隨著 Agent 在組織內爆量，許多 CIO 與 IT 主管正面臨一種失控的「Agent 蔓延（agent sprawl）」，讓組織暴露在錯誤資訊、過度共享與資料外洩等風險之中。

值得注意的是，Gartner 的調查顯示，只有 13% 的受訪組織認為自己已具備足夠的 Agent 治理機制。Goss 強調，許多組織索性封鎖或限制 Agent 的使用，但這並非長久之計：員工一旦無法在受核可的工具裡完成工作，多半會繞過控管、轉而使用風險更高的「shadow AI（影子 AI）」。他認為，組織真正需要的，是在治理蔓延與安全賦能員工創新之間取得平衡。

跨團隊的協作摩擦，是另一道難關。《華爾街日報》引述 AI 顧問公司 Mindspan Labs 合夥人 Jeremy Korst 的觀察，較小的公司在運用 Agent 上最為靈活，一旦跨團隊管理就變得複雜。舉例來說，法務團隊未必樂見業務團隊讓 AI 自行審查合約。

當 Agent 走出受信任環境，資安風險才剛開始

如果說治理是組織內部的挑戰，那麼一旦 Agent 走出公司、進入開放的網路，風險的性質就完全不同了。據《Search Engine Journal》報導，Google DeepMind 資深研究科學家 Nenad Tomašev 在一場訪談中直言，正因為個別互動無法保證百分之百可靠，任何具有大量互動的大規模系統，統計上自然會出現失敗；加上這類系統要耗費可觀的運算、能源與金錢，若不可靠就根本無法成立。這也是他認為大規模部署 Agent 在現階段難以運作的主因之一。

他描述的核心威脅，是所謂的「Agent 陷阱」。Tomašev 在訪談中解釋，Agent 是在一個環境裡運作的，而這個環境就是網路；一旦環境本身被「下毒」、被布下陷阱，Agent 在瀏覽網頁時就可能誤踩。他點出三種手法：hidden tokens（隱藏的 token）、dynamic cloaking（動態偽裝），以及會誘導 jailbreak（越獄）的內容。這些對人類使用者完全不可見，卻會被 Agent 讀進去。

生產力是真的，但門檻不在能不能用，而在如何管

針對治理這一端，Gartner 提出了六個步驟供 CIO 與 IT 主管參考：建立 Agent 治理政策與規範、盤點並集中化 Agent 清單、定義 Agent 的身分與權限及生命週期、發展 AI 資訊治理、持續監控並矯正 Agent 行為，以及培養負責任使用 AI 的組織文化。其核心並非一味封堵，而是在管控蔓延與賦能創新之間找到平衡。

而在「人」這一端，OpenAI 的報告給出的方向是把最靠近工作的人放在採用的核心。報告主張，Agent 不是知識工作者的替代品，而是讓最了解問題的人擁有更多自主權與解決難題的能力；最高報酬的應用，往往是貼近現場、針對特定痛點的小工具。對照三巨頭辦公室裡那些成為「審稿人」的員工，這條路徑指向的並非人被取代，而是人的判斷力被擺到更關鍵的位置：治理與賦能並行，或許才是 Agent 真正走進職場後，最務實的下一步。

【推薦閱讀】

◆ Claude Tag 哪裡不一樣？Anthropic 的「數位同事」與導入前 4 個提醒

◆ 日本 AI 新創 Sakana 推出 Fugu：AI 下一場戰爭不只比模型，而是誰更會協調模型

◆ 推論成本砍半、9 個月做出來：OpenAI 首款自研 AI 晶片 Jalapeño 想換到什麼？

＊本文開放合作夥伴轉載，資料來源：《The Wall Street Journal》、OpenAI、Gartner、《Search Engine Journal》，首圖來源：Unsplash

Cookie	Duration	Description
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

AI 巨頭自己怎麼用 AI？OpenAI、Google、Anthropic 員工正從執行者變「審稿人」

三巨頭的辦公室實況：人類從「執行者」變「審稿人」

知識工作者比開發者更快擁抱 Agent，開始「並行」工作

Agent 越用越多，反而逼出新瓶頸與治理難題

當 Agent 走出受信任環境，資安風險才剛開始

生產力是真的，但門檻不在能不能用，而在如何管

TO 會員電子報

AI 巨頭自己怎麼用 AI？OpenAI、Google、Anthropic 員工正從執行者變「審稿人」

【AI 推理成本革命】不再靠人類直覺設計策略，AutoTTS 讓 AI 自己找最省 Token 推理方式

迎戰 AI 武器化新風暴！解密 Agentic AI 紅藍對決與企業治理生路

TrendAI™ 獲選為 OpenAI Daybreak 資安計畫「可信任合作夥伴 (Trusted Partner) 」