當企業從試驗 AI 走向大規模部署,一個新的管理難題正在浮現:沒人真的知道 AI 花了多少錢。
顧問機構 KPMG 一份尚未公開的調查指出,只有 26% 的受訪企業表示對自家 AI 成本擁有全面的掌握,50% 僅有部分可見度,另有 22% 表示完全沒有可見度,或要等帳單寄來後才知道。KPMG 全球 AI 主管 Steve Chase 形容,這是一種過去不存在、如今卻需要被管理的新資源,而且正在呈現指數級成長。
為什麼 AI 成本比 SaaS 更難管理?
問題的根源,在於收費模式的轉變。過去企業採購 SaaS 軟體時,大多按照使用者數量或授權席次付費。無論是使用 Microsoft 365、Salesforce 或 Slack 等軟體,財務部門都能事先預估年度預算。但《The Wall Street Journal》觀察,AI 業者與軟體公司正逐步改以使用量計價,並以 Token(AI 運算的基本計量單位)為衡量基準,這對即使是最有經驗的財務團隊也難以應對。
財務長習慣為技術支付固定金額,如今在打造 AI 代理、投入大手筆 AI 投資時,發現成本更難預測、也更難建模。金融服務公司 D.A. Davidson 科技研究主管 Gil Luria 認為,使用量計價把風險轉嫁給了客戶,因為它逼著客戶得自行追蹤用量;他並直言,雖然有些大公司鼓勵員工「tokenmaxx」(盡可能多用運算資源以展現走在 AI 前沿),但許多財務長「這一季看到 Anthropic 的帳單恐怕會嚇壞」。
另外,從 Anthropic 的 Claude 系列、OpenAI GPT 系列到 Google Gemini,新一代模型不再只是回答問題,而是能自主規劃、搜尋資訊、撰寫程式、執行工作流程,甚至呼叫其他工具完成複雜任務。這些能力提升生產力的同時,也大幅增加 Token 消耗量。
「帳單衝擊」已經發生,5 億美元帳單成警示
這樣的「帳單衝擊」已實際發生。《TechCrunch》報導,Uber 在 4 月就燒光了 2026 年整年的 AI 程式編寫預算;Microsoft 在開通數月後撤回了開發者的 Claude Code 授權;旅遊平台 Priceline 一名員工則透露,一份例行的 Cursor 合約續約報價,竟比原本貴了四到五倍。報導更指出,曾有一家公司因為忘了為員工設定使用上限,最後收到一張高達 5 億美元的 Claude 帳單。
工程營運平台 Faros AI 指出:「我的一名工程師上個月花了 4 萬美元在 Token 上,我真的不知道該攔住他,還是該叫其他人都向他看齊。」Priceline 的 IT 財務資深總監 Chris Reed 更把這種現象形容為「古柯鹼疫情」:先讓你免費試用上癮,接著你就離不開了,該公司已開始對特定群組設下 Token 上限。
根據《Tom’s Hardware》,甚至連 OpenAI 執行長 Sam Altman 近期都坦言,企業客戶開始頻繁抱怨 AI 成本問題。Altman 在公開活動中表示,今年初企業幾乎不會討論 AI 花費,但如今情況完全不同。「許多人告訴我們,他們在第一季就花光了整個 2026 年的預算。」
「tokenmaxxing」是不是虛榮指標?ROI 仍是問號
《Tom’s Hardware》提到,NVIDIA 執行長黃仁勳曾說,他的工程師使用的 AI Token 價值至少要達到年薪的一半,否則他會「深感憂慮」。但 tokenmaxxing 這種「用得越多越好」的文化是否合理,開始受到質疑。
《TechCrunch》引述 Faros AI 一項針對 2 萬名開發者的兩年研究,發現產出雖然上升,但 bug 與重寫的情況也同步增加;工程管理平台 Jellyfish 則發現,用最多 Token 的工程師生產力約為少用者的兩倍,卻得耗費十倍的 Token 才能達到。Jellyfish 研究主管 Nicholas Arcolano 指出,每位開發者的 Token 消耗在九個月內成長了約 18.6 倍,但極端支出是否划算,最終取決於交付程式碼帶來的商業價值,而多數公司至今仍無法衡量。
《Business Insider》則呈現金融業更審慎的態度。法國巴黎銀行投資銀行部門(BNP Paribas CIB)的 AI 長 Charles Holive 直言,「tokenmaxxing」可能只是一個「虛榮指標」,他的團隊雖然也追蹤 Token 消耗,但那遠非首要關注;他更在意的是員工「做了哪些以前做不到的事、又快了多少」,並以營收與生產力來衡量 AI 的投資報酬。報導也提到,Amazon 近期關閉了一個內部 AI 使用排行榜,因為有員工為了衝排名而執行不必要的任務。
企業紛紛建立 Token 治理機制
面對快速膨脹的 AI 支出,企業開始建立新的治理制度。美國金融科技公司 Affirm 在 3 月那一季大幅增加以代理撰寫程式碼的比例,也因此增加了 Token 消耗數量,但如今 Affirm 已將 Token 成本納入年度預算規劃,並建立近即時監控機制,每週向管理團隊提交 AI 使用報告。
家庭定位服務公司 Life360 則導入了能降低 Token 消耗的工具並重新設計 AI 代理架構,其財務長 Russell Burke 坦言公司尚未建立即時的 Token 支出監控,但希望很快能上線。
也有企業選擇放慢 AI 導入速度。玻璃材料大廠 Corning 選擇限制員工可使用的 AI 工具數量,將預算集中於少數關鍵專案。運動品牌集團 Amer Sports 甚至刻意放慢 AI 導入腳步,以避免未來產生成本失控問題。
這種現象與疫情期間企業大舉投入雲端服務頗為相似。當時許多企業在數位轉型浪潮下快速擴張雲端資源,之後又不得不建立 FinOps 制度管理成本。如今類似情況正重新發生在 AI 領域。
與過去不同的是,AI 成本不只是基礎設施支出,更直接與員工生產力、產品開發速度以及企業競爭力相關。因此如何在控制成本與鼓勵創新之間取得平衡,成為企業新的管理課題。
企業的焦慮也催生出全新的市場機會。《TechCrunch》報導,一個圍繞 Token 成本管理的市場正在成形,目前包括 Datadog、New Relic、Ramp 等企業,都開始推出 AI 成本監控服務;Jellyfish、Faros AI 等新創則專注於協助企業衡量 AI Agent 的實際投資報酬率。更具指標意義的是,Linux Foundation 旗下 FinOps Foundation 正籌組名為「Tokenomics Foundation」的新組織,希望建立 AI Token 管理的共同標準。
下一階段的 AI 競賽,將是成本治理競賽
《The Wall Street Journal》指出,過去兩年,AI 導入主要由 CIO、CTO 或 AI 團隊主導,焦點集中在模型能力、技術架構與應用場景。但隨著企業逐步從試驗階段走向大規模部署,財務部門的角色正變得越來越重要。
未來 CFO 需要回答的問題包括:哪些 Agent 值得持續投資?哪些模型能帶來最佳成本效益?企業是否應該採用開源模型降低推理成本?以及每一筆 Token 支出究竟創造了多少回報?
這也意味著 AI 導入正在進入第二階段。第一階段,企業關心的是如何使用 AI;第二階段,企業開始關心如何有效率地使用 AI。
當 Token 成為新的成本中心,AI 的競爭也將不再只是模型能力競賽,而是一場成本治理與投資回報率的競賽。對企業而言,真正的挑戰或許不是取得更多 AI,而是知道該把每一顆 Token 花在哪裡。
【推薦閱讀】
◆ 當企業開始管理 15 萬個 AI 代理:Google Cloud 高層解析 AI Agent 導入三大支柱
*本文開放合作夥伴轉載,資料來源:《The Wall Street Journal》、《Business Insider》、《Tom’s Hardware》、《TechCrunch》,首圖來源:AI 工具生成



