小型 AI 模型市值上看 1500 億，為了省錢企業開始讓 AI 走向「極簡主義」

在 AI 引領科技發展的時代新局下，大型語言模型（LLM）成為了許多企業的得力助手，無論實驗、試點或正式部署，各種 LLM 的應用案例如雨後春筍般冒出，然而企業卻也突然驚覺，自身的負擔正因 AI 開始變得越來越重。

隨著各種 AI 專案不斷發展，許多企業都意識到自己早期採用的 LLM，不僅笨重而且還十分昂貴。為了解決日益增加的成本問題，LLM 即開始朝向蒸餾、客製化的小型語言模型方向演進。

舉例來說，由 Google 所開發的 Gemma 系列模型，以及 Microsoft 的 Phi 模型，還有 Mistral 的 Small 3.1 等，全都是以「小型化」和「精簡」為主要目標，希望讓企業擁有一套成本更低、運算更快，但又不失精準度的 AI 模型來處理特定任務。

更低的資本支出，更簡單的開發維護

對於那些想要採用 AI 技術，可是又擔心開銷過大的企業來說，將特定工作任務指派給規模較小的模型，不只是由於它們可以降低 AI 的執行成本，企業更能藉此期盼獲得更好的投資報酬率。

LinkedIn 傑出工程師 Karthik Ramgopal 就說明，近來許多企業相繼投入小型模型發展，背後其實有幾項關鍵原因。

首先，採用小模型意味著 AI 的運算資源、記憶體消耗都會變得更少，結果也會更快得到輸出，若再一併考量 GPU 硬體成本、電力費用等因素，應用小模型意味著企業將擁有更低的營運支出（OPEX）和資本支出（CAPEX）。

同時相對於能力強大的 LLM，各大 AI 開發商對於小模型的定價，通常來說也會更加親民。比方說較精簡的 OpenAI o4-mini，其每百萬個 Token 的輸入價格為 1.1 美元，輸出價格為 4.4 美元，然而完整版的 o3 模型，其輸入價格為 10 美元，輸出價格更是高達 40 美元。

此外 Karthik Ramgopal 也強調，為運算特定任務所打造的小模型，由於其能力覆蓋範圍較窄，反而可以讓行為、輸出結果更加一致，操作時既不需要動用複雜的提示工程，後續的開發、維護也變得更為簡單。

企業透露需求，推動小模型市值飆升

發展小模型所帶來的好處，不只吸引企業紛紛轉向，AI 開發商自然也看到了市場，並且從旗艦型 LLM 延伸出精簡版、蒸餾版，讓企業客戶獲得更多選擇。

舉例來說 Anthropic 旗下的 Claude 系列 AI 模型，就有能力最強的 Opus、多用途的 Sonnet，以及規模最小、速度最快的 Haiku；許多精簡後的模型甚至可以在智慧型手機、文書筆電等，效能較弱的行動裝置上無礙運作。

企業對小型模型所展現出來的高度興趣，亦直接反映在市值表現上。

根據市場調查公司 MarketsandMarkets 的最新研究，2025 年小型語言模型的市場價值約為 9.3 億美元，但預計到了 2032 年將大幅成長至 54.5 億美元，複合年增長率高達 28.7%。

整合多模態，小模型加速 AI 攻城掠地

MarketsandMarkets 進一步表明，小型語言模型的整體市場，正在成本效益、能源效率和多模態功能的推動下，呈現出極為快速的成長。

跟大型 AI 模型不同，小模型所需要的運算資源較少，因此讓各種規模的企業都能無畏負擔 AI 應用；同時，小模型的能源效率也符合可持續發展目標，即在維持高效能的前提下，降低 AI 運算的耗電量。

另一方面 MarketsandMarkets 亦指出，多模態 AI 的發展讓小模型也可以處理文字、語音、影像和視訊，擴大其在內容創作、自動化和即時決策方面的應用。

MarketsandMarkets 直言，隨著各行各業都在尋求經濟實惠、高效率且多用途的 AI 解決方案，小模型顯然正在成為企業首選，加速 AI 於醫療保健、零售、金融和製造業等領域的投入應用。

效率不輸 LLM，小模型適合「針對性」任務

小型 AI 模型雖然降低了企業營運成本，卻也避免不了需要投入更多後期訓練，以及針對特定任務所進行的各種微調。人工智慧領域公司 Aible 創辦人兼執行長 Arijit Sengupta 表示過，由於小型模型通常需要大量的後期訓練，才能產生與大型模型相當的結果，因此單純就維護成本而言，這些工作若是由人類工程師手動進行，其開銷就會變得很高。

Arijit Sengupta 直言「天下沒有白吃的午餐」，想要讓 AI 模型運作獲得人類預期中的效果，工程師就必須給予情境或訓練，對於 LLM 通常可以透過安插提示詞來實現，而針對小模型就能夠改以各種微調與後期訓練來取代。

Arijit Sengupta 指出，若後期訓練的品質夠高，小模型的使用成本甚至可以降低約 100 倍；同時 Aible 所進行的內部實驗也顯示，針對特定任務微調過後的小模型，在某些使用案例中擁有跟 LLM 同樣良好的表現。

根據 Aible 的實驗，它們將 Llama-3.3-70B-Instruct 的後訓練版本，跟同一模型中參數規模較小的 8B 模型進行對抗，前者的使用成本為 11.3 美元，並在自動化基準測試中獲得 84% 的精確度表現，而手動測試中則為 92%。

至於微調後的 8B 版本模型，其使用成本降至 4.58 美元，手動測試中的精確度為 82%，這表明小模型確實適合規模更小、更有針對性的任務專案。

從大模型開始導入 AI，再往小模型調整

對於那些想要採用 AI 技術，卻陷入成本考量的企業來說，人工智慧情報公司 Cresta 技術長 Daniel Hoske 建議，在針對專案、任務導入 AI 應用時，企業應該考慮先從大模型下手。

Daniel Hoske 認為，企業可以首先採取 LLM 執行任務，觀察大模型是否足夠承擔，畢竟要是連較大的模型都無法給出成果，那麼即便改採微調過後的小模型也不見得會有用。

LinkedIn 工程師 Karthik Ramgopal 亦有相同看法，並指出 LinkedIn 通常會先仰賴 LLM 的通用性，為產品專案快速建立原型、驗證假設，再評估產品與市場的契合度；當產品逐漸走向成熟，或者遇到品質、成本或延遲方面的限制時，才會開始轉換到更加客製化的解決方案。

換句話說，企業在透過大模型導入 AI 技術的實驗階段，就可以先行判斷該 AI 應用需要重視哪些面向，一旦搞清楚目標，開發人員就能開始規劃節省成本的方式，並根據預算和目的，選擇規模更加適當的 AI 模型。

長期使用有疑慮，要注意小模型缺點

不過企業也必須注意，過度使用小型或特定任務模型，長期下來也會產生意料之外的問題。

日前 AWS 高階主管 Rahul Pathak 就在一篇文章中發出提醒，指出「降低成本」不應該是企業選擇小型模型的前提，重點應該擺在選用模型跟任務之間，是否能夠互相匹配。

Rahul Pathak 說，小模型可能會因為沒有足夠大的上下文視窗，去有效理解較為複雜的指令，進而反過來造成人類工作量增加，提高 AI 使用成本。

Aible 執行長 Arijit Sengupta 也警告，有些經過提煉、蒸餾的模型，可能會變得十分脆弱，難以應付高負載的任務，長期使用下來亦會造成額外支出。

拋棄執著、保持靈活，轉換模型需彈性

無論模型規模、訓練資料量為何，多數 AI 業界人士皆不斷強調，企業要學會靈活處理各種任務和特殊個案；即便是先從大模型開始，一路轉換到性能相似或更佳、成本更低的小模型，當遇見問題時，企業也不應該執著於僅用後者。

品牌行銷公司 Mod Op 技術長 Tessa Burg 就向外媒表示，企業組織必須明白，無論自己正在使用什麼技術，未來總會被更好、更進化的版本取代。

根據 Mod Op 的應用經驗，Tessa Burg 發現小模型有助於節省公司與客戶，在研究和開發概念方面的時間，一旦時間獲得節省，久而久之就能節約預算。因此 Tessa Burg 建議，企業可以考慮將高成本、高頻率的使用個案，主動交給小模型處理，為不同參數規模的 AI 應用找出合適方向。

＊立即報名 8/15 【AI Agent 知識工作革命論壇】，解析企業如何在各工作場景導入 AI Agent 完成任務

【推薦閱讀】

◆ 「AI 將迅速接管金融體系。」《人類大歷史》作者哈拉瑞提醒 AI 本質是代理
 ◆ 企業老闆最新的口頭禪：人工智慧，否則就再見
 ◆ 下一個 DeepSeek 來了？百度今開源「Ernie 4.5」AI 模型，專家看好嗎？

＊本文開放合作夥伴轉載，參考資料：《VentureBeat》、《MarketsandMarkets》，首圖來源：Unsplash

（責任編輯：鄒家彥）

Cookie	Duration	Description
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

讓 AI 走向「極簡主義」——什麼樣的 AI 策略能幫企業省錢飆速？

更低的資本支出，更簡單的開發維護

企業透露需求，推動小模型市值飆升

整合多模態，小模型加速 AI 攻城掠地

效率不輸 LLM，小模型適合「針對性」任務

從大模型開始導入 AI，再往小模型調整

長期使用有疑慮，要注意小模型缺點

拋棄執著、保持靈活，轉換模型需彈性

TO 會員電子報

高盛預估到 2030 年 Token 用量暴增 24 倍，企業如何避免 AI 帳單失控？

AI 接管排程、品管與物流：西門子砸 2 億歐元，把整座工廠變成會自我調度的系統

成立不到 4 年拿下 10 億美元訂單：AI 晶片新創 Etched 為何被視為 NVIDIA 新勁敵？

AI 太貴難落地、太強又怕失控：Anthropic Sonnet 5 如何把企業 AI 變便宜，又不踩政府安全紅線？