Search
Close this search box.

讓 AI 走向「極簡主義」——什麼樣的 AI 策略能幫企業省錢飆速?

小型 AI 模型市值上看 1500 億,為了省錢企業開始讓 AI 走向「極簡主義」

在 AI 引領科技發展的時代新局下,大型語言模型(LLM)成為了許多企業的得力助手,無論實驗、試點或正式部署,各種 LLM 的應用案例如雨後春筍般冒出,然而企業卻也突然驚覺,自身的負擔正因 AI 開始變得越來越重。

隨著各種 AI 專案不斷發展,許多企業都意識到自己早期採用的 LLM,不僅笨重而且還十分昂貴。為了解決日益增加的成本問題,LLM 即開始朝向蒸餾、客製化的小型語言模型方向演進。

舉例來說,由 Google 所開發的 Gemma 系列模型,以及 Microsoft 的 Phi 模型,還有 Mistral 的 Small 3.1 等,全都是以「小型化」和「精簡」為主要目標,希望讓企業擁有一套成本更低、運算更快,但又不失精準度的 AI 模型來處理特定任務。

更低的資本支出,更簡單的開發維護

對於那些想要採用 AI 技術,可是又擔心開銷過大的企業來說,將特定工作任務指派給規模較小的模型,不只是由於它們可以降低 AI 的執行成本,企業更能藉此期盼獲得更好的投資報酬率。

LinkedIn 傑出工程師 Karthik Ramgopal 就說明,近來許多企業相繼投入小型模型發展,背後其實有幾項關鍵原因。

首先,採用小模型意味著 AI 的運算資源、記憶體消耗都會變得更少,結果也會更快得到輸出,若再一併考量 GPU 硬體成本、電力費用等因素,應用小模型意味著企業將擁有更低的營運支出(OPEX)和資本支出(CAPEX)。

同時相對於能力強大的 LLM,各大 AI 開發商對於小模型的定價,通常來說也會更加親民。比方說較精簡的 OpenAI o4-mini,其每百萬個 Token 的輸入價格為 1.1 美元,輸出價格為 4.4 美元,然而完整版的 o3 模型,其輸入價格為 10 美元,輸出價格更是高達 40 美元。

此外 Karthik Ramgopal 也強調,為運算特定任務所打造的小模型,由於其能力覆蓋範圍較窄,反而可以讓行為、輸出結果更加一致,操作時既不需要動用複雜的提示工程,後續的開發、維護也變得更為簡單。

企業透露需求,推動小模型市值飆升

發展小模型所帶來的好處,不只吸引企業紛紛轉向,AI 開發商自然也看到了市場,並且從旗艦型 LLM 延伸出精簡版、蒸餾版,讓企業客戶獲得更多選擇。

舉例來說 Anthropic 旗下的 Claude 系列 AI 模型,就有能力最強的 Opus、多用途的 Sonnet,以及規模最小、速度最快的 Haiku;許多精簡後的模型甚至可以在智慧型手機、文書筆電等,效能較弱的行動裝置上無礙運作。

企業對小型模型所展現出來的高度興趣,亦直接反映在市值表現上。

根據市場調查公司 MarketsandMarkets 的最新研究,2025 年小型語言模型的市場價值約為 9.3 億美元,但預計到了 2032 年將大幅成長至 54.5 億美元,複合年增長率高達 28.7%。

整合多模態,小模型加速 AI 攻城掠地

MarketsandMarkets 進一步表明,小型語言模型的整體市場,正在成本效益、能源效率和多模態功能的推動下,呈現出極為快速的成長。

跟大型 AI 模型不同,小模型所需要的運算資源較少,因此讓各種規模的企業都能無畏負擔 AI 應用;同時,小模型的能源效率也符合可持續發展目標,即在維持高效能的前提下,降低 AI 運算的耗電量。

另一方面 MarketsandMarkets 亦指出,多模態 AI 的發展讓小模型也可以處理文字、語音、影像和視訊,擴大其在內容創作、自動化和即時決策方面的應用。

MarketsandMarkets 直言,隨著各行各業都在尋求經濟實惠、高效率且多用途的 AI 解決方案,小模型顯然正在成為企業首選,加速 AI 於醫療保健、零售、金融和製造業等領域的投入應用。

效率不輸 LLM,小模型適合「針對性」任務

小型 AI 模型雖然降低了企業營運成本,卻也避免不了需要投入更多後期訓練,以及針對特定任務所進行的各種微調。人工智慧領域公司 Aible 創辦人兼執行長 Arijit Sengupta 表示過,由於小型模型通常需要大量的後期訓練,才能產生與大型模型相當的結果,因此單純就維護成本而言,這些工作若是由人類工程師手動進行,其開銷就會變得很高。

Arijit Sengupta 直言「天下沒有白吃的午餐」,想要讓 AI 模型運作獲得人類預期中的效果,工程師就必須給予情境或訓練,對於 LLM 通常可以透過安插提示詞來實現,而針對小模型就能夠改以各種微調與後期訓練來取代。

Arijit Sengupta 指出,若後期訓練的品質夠高,小模型的使用成本甚至可以降低約 100 倍;同時 Aible 所進行的內部實驗也顯示,針對特定任務微調過後的小模型,在某些使用案例中擁有跟 LLM 同樣良好的表現。

根據 Aible 的實驗,它們將 Llama-3.3-70B-Instruct 的後訓練版本,跟同一模型中參數規模較小的 8B 模型進行對抗,前者的使用成本為 11.3 美元,並在自動化基準測試中獲得 84% 的精確度表現,而手動測試中則為 92%。

至於微調後的 8B 版本模型,其使用成本降至 4.58 美元,手動測試中的精確度為 82%,這表明小模型確實適合規模更小、更有針對性的任務專案。

從大模型開始導入 AI,再往小模型調整

對於那些想要採用 AI 技術,卻陷入成本考量的企業來說,人工智慧情報公司 Cresta 技術長 Daniel Hoske 建議,在針對專案、任務導入 AI 應用時,企業應該考慮先從大模型下手。

Daniel Hoske 認為,企業可以首先採取 LLM 執行任務,觀察大模型是否足夠承擔,畢竟要是連較大的模型都無法給出成果,那麼即便改採微調過後的小模型也不見得會有用。

LinkedIn 工程師 Karthik Ramgopal 亦有相同看法,並指出 LinkedIn 通常會先仰賴 LLM 的通用性,為產品專案快速建立原型、驗證假設,再評估產品與市場的契合度;當產品逐漸走向成熟,或者遇到品質、成本或延遲方面的限制時,才會開始轉換到更加客製化的解決方案。

換句話說,企業在透過大模型導入 AI 技術的實驗階段,就可以先行判斷該 AI 應用需要重視哪些面向,一旦搞清楚目標,開發人員就能開始規劃節省成本的方式,並根據預算和目的,選擇規模更加適當的 AI 模型。

長期使用有疑慮,要注意小模型缺點

不過企業也必須注意,過度使用小型或特定任務模型,長期下來也會產生意料之外的問題。

日前 AWS 高階主管 Rahul Pathak 就在一篇文章中發出提醒,指出「降低成本」不應該是企業選擇小型模型的前提,重點應該擺在選用模型跟任務之間,是否能夠互相匹配。

Rahul Pathak 說,小模型可能會因為沒有足夠大的上下文視窗,去有效理解較為複雜的指令,進而反過來造成人類工作量增加,提高 AI 使用成本。

Aible 執行長 Arijit Sengupta 也警告,有些經過提煉、蒸餾的模型,可能會變得十分脆弱,難以應付高負載的任務,長期使用下來亦會造成額外支出。

拋棄執著、保持靈活,轉換模型需彈性

無論模型規模、訓練資料量為何,多數 AI 業界人士皆不斷強調,企業要學會靈活處理各種任務和特殊個案;即便是先從大模型開始,一路轉換到性能相似或更佳、成本更低的小模型,當遇見問題時,企業也不應該執著於僅用後者。

品牌行銷公司 Mod Op 技術長 Tessa Burg 就向外媒表示,企業組織必須明白,無論自己正在使用什麼技術,未來總會被更好、更進化的版本取代。

根據 Mod Op 的應用經驗,Tessa Burg 發現小模型有助於節省公司與客戶,在研究和開發概念方面的時間,一旦時間獲得節省,久而久之就能節約預算。因此 Tessa Burg 建議,企業可以考慮將高成本、高頻率的使用個案,主動交給小模型處理,為不同參數規模的 AI 應用找出合適方向。

*立即報名 8/15 【AI Agent 知識工作革命論壇】,解析企業如何在各工作場景導入 AI Agent 完成任務

【推薦閱讀】

◆ 「AI 將迅速接管金融體系。」《人類大歷史》作者哈拉瑞提醒 AI 本質是代理
◆ 企業老闆最新的口頭禪:人工智慧,否則就再見
◆ 下一個 DeepSeek 來了?百度今開源「Ernie 4.5」AI 模型,專家看好嗎?

*本文開放合作夥伴轉載,參考資料:《VentureBeat》《MarketsandMarkets》,首圖來源:Unsplash

(責任編輯:鄒家彥)