Search
Close this search box.

當 GPU 從成本負擔變成獲利引擎,企業 AI 經濟進入新賽局

當全球 AI 競賽的焦點從「模型演算法」轉向「算力基礎設施」,誰能高效調度 GPU、誰能將算力資產商業化,誰就掌握了下個世代 AI 經濟的話語權。

在剛落幕的 COMPUTEX 2026 上,深耕 AI 基礎設施近十年的 INFINITIX 數位無限,以「從 AI 基礎設施到 AI 雲端經濟」為主題,協助企業將手中昂貴卻無法最大化效率的 GPU,轉化為可營運、可計價、可變現的雲端服務。

「AI 經濟的底層驅動力不是模型,而是算力。」這是 INFINITIX 在 COMPUTEX 2026 展場上向業界傳達的核心命題,也是執行長兼共同創辦人陳文裕對當前 AI 產業的觀察。

從 AI Factory 到 Token Factory:算力需求為何出現轉折?

針對近兩年全球 AI 產業的競爭焦點轉變,陳文裕指出,這個轉折其實是相輔相成的過程,「三年前大家明顯看到算力的增長,開始有人在投資相關基礎設施,但那時候算力的應用場景尚未明朗。」直到模型越來越普及、使用者大量增加,「訓練模型的需要算力,使用模型的也需要算力」,GPU 才開始供不應求。

「再加上今年 AI Agent 的使用,人類可以訓練很多 Agent,這些 Agent 也大量使用到模型,所以算力肯定不夠。」陳文裕解釋,這也是為什麼 INFINITIX 把今年的 COMPUTEX 主題訂為「從 AI 基礎設施到 AI 雲端經濟」,因為當 AI 從基礎設施走向經濟循環,算力本身就必須被服務化、商業化。

陳文裕進一步觀察到,今年最明顯的轉折在於市場下沉,去年還只是大型算力中心持續擴建,今年則開始下沉到企業端,企業也開始建置中小型的算力基礎設施。

而對於台灣硬體產業而言,這波算力浪潮無疑是巨大的機會。「建 AI Factory、建 Token Factory 都需要買伺服器,這就是台灣的強項。」陳文裕分析,GPU 伺服器解決的是高耗電、高散熱與高密度的技術挑戰,這些刁鑽的工程問題正好是台灣供應鏈的舞台。「我認為這一波 AI 會比網路時代更劇烈,因為人類對 AI 的使用強度遠高於網路。」他預估,這一波算力需求至少可以延續 7 到 10 年才會到達高原期,另外每 3 到 5 年則會出現一波汰換動能。

價值錯配的真相,為何 GPU 利用率普遍不足 30%?

不過回過頭看,儘管 AI 算力支出屢創新高,企業端的 GPU 利用率卻普遍偏低。據數據指出,多數企業 GPU 平均使用率不到 30%,造成大量算力閒置。而這個「高成本、低回報」的價值錯配,根源究竟在哪裡?

陳文裕指出,這個問題其實在 CPU 時代就存在,當年虛擬化技術的興起,就是為了「擠乾 CPU 伺服器的所有 performance」。GPU 時代同樣面臨類似困境,但問題更為複雜,呈現出多種樣態:第一是企業端的應用錯配,也就是企業的 AI 技術應用跟硬體設備產生的 Gap ; 第二是訓練端的中斷閒置,在企業端使用過程中,或多或少都會遇上訓練到一半因硬體故障或程式瑕疵讓訓練中斷的情況,造成機器閒置的問題 ; 最後則是推論端的需求預估難題,「在採購時,企業無法精準估算有多少人流,因此先買一票 GPU 來應對高峰期的使用者,但可能實際上使用者就沒那麼多,即出現閒置問題,」陳文裕解釋道。

因此,這正是 INFINITIX 旗艦產品 AI-Stack 切入的關鍵痛點。

CTAs Scheduler 獨家技術:GPU 利用率拉到 90% 的解法

AI-Stack 的獨家技術 CTAs Scheduler(Core Type Aware Scheduler),協助企業端將 GPU 使用率拉升到 90% 以上。陳文裕實際拆解了 INFINITIX 累積近十年的技術演進路徑,分別是 GPU 切割(虛擬化)、GPU 聚合以及分散式運算自動化,還有 INFINITIX 最新的技術突破:CTAs 核心感知排程。

陳文裕解釋,NVIDIA GPU 上除了 CUDA Core 還有 Tensor Core,兩者各有所長。「有時候用戶只需要 CUDA,不需要 Tensor。因此 INFINITIX 研發出 CTAs 技術,將 CUDA Core 與 Tensor Core 的調度權交回使用者手中,可依工作負載自主決定所需的核心類型與數量,避免 Tensor Core 被無謂占用。」

另外,隨著 GPU 從單卡走向機櫃、走向工廠,跨節點通訊成為新瓶頸。AI-Stack 也能在分配 GPU 時,盡可能將同一任務的資源集中在同一台伺服器或同一機櫃內,避免跨櫃延遲。「算力調度的命題已從『一張 GPU 如何切得更細』升級為『一座 AI 工廠如何更有效率調度』,INFINITIX 也隨著這條演進路徑,持續向前推進核心技術。」陳文裕說道。

如果說 AI-Stack 解決的是「如何用好 GPU」,那麼 INFINITIX 的 ixCSP(INFINITIX Cloud Service Provider)解決的就是「如何賣好 GPU」。

陳文裕坦言,這兩個產品面對的是不同客戶族群。AI-Stack 主要服務企業使用者,幫助企業有效管理自有 GPU;ixCSP 則是面向算力中心與 CSP(Cloud Service Provider)業者,協助他們把算力轉化為可銷售的雲端服務。

「我們發現算力中心更在意的是如何把算力資源賣出去。所以我們做了 ixCSP,提供 GaaS(GPU as a Service)、MaaS(Model as a Service)、TaaS(Training as a Service)三層架構,協助 CSP 業者高效率地建構像 CoreWeave 或是 Nebius 這種線上算力銷售平台。」

對於一家想跨入 AI 雲端業務的客戶來說,建置算力中心可能要半年到兩年的時間,但透過 ixCSP 上線銷售,最快一週、平均一個月內就可以開始營運。「ixCSP 讓算力中心升級成線上銷售模式,服務可以面向大企業,也可以是零散的小規模使用者。」

舉例來說,近期 OpenAI、Claude 等應用端正逐步走向 Token 計費,陳文裕對此趨勢也觀察到,「Token 計價模式正從應用端一路反向滲透到供應端。」這也呼應了 ixCSP 平台中 MaaS 與 TaaS  的設計,讓算力中心能透過 Token 計費、模型商業化等方式,讓算力資產的營收路徑多元化。

而在生態合作層面,INFINITIX 與 NVIDIA、AMD 是認證夥伴計畫關係,與群聯電子(Phison)則是聯合解決方案等級的深度合作。

群聯的 aiDAPTIV+ 技術透過高速 SSD 動態擴展 GPU 記憶體,突破傳統 HBM/GDDR 的容量限制。陳文裕解釋,這項合作的契機在於兩家公司的客戶高度重疊,因此雙方談及合作,要讓客戶有更有效的算力調度選擇。「對企業客戶而言,這意味著不需要全數採購高階 HBM GPU,就能完成大型語言模型訓練,以更經濟的硬體組合達成相同目標。」

數位無限執行長陳文裕。

從算力調度走向 AI 經濟生態,未來三年的奇異點是什麼?

最後,談到未來三年的 AI 發展,陳文裕認為 AI Agent 將是「星星之火、可以燎原」的起點。

「如今人類與 AI 高度互動 ,未來模型會越來越多樣化,而 Agent 就是指揮這些模型、產生自動化工作流的關鍵角色。」陳文裕認為, Agent 作為新時代的工作介面,方向已不可逆。

而 INFINITIX 已開始招募 AI 軟體應用開發商,將其應用拓展到 AI-Stack 或 ixCSP 平台,形成一個完整的雲端經濟生態。「這些 AI 應用需要找到出口,而我們提供出口、提供通路。這是我們未來三年希望持續做得更好的事情。」

可以看出,從 AI-Stack 到 ixCSP ,INFINITIX 想要打通算力商業化路徑的決心,它們在 AI 經濟的關鍵節點上,扮演的是「算力變現的商業化推手」角色,它們知曉在 AI 經濟時代,誰能高效調度、靈活分配並商業化 GPU 資源,誰就掌握了核心生產力。

當全球算力市場進入下沉週期、企業加倍重視資料主權,台灣作為硬體製造之島正迎來新一輪產業高峰,而 INFINITIX 則站在軟體層的關鍵位置,要用近十年的基礎設施調度經驗,協助企業端把這些昂貴的資源,變成擁有營收效率的 AI 雲端經濟體。

(本文訊息由 INFINITIX 數位無限提供,內文與標題經 TechOrange 修訂後刊登。新聞稿 / 產品訊息提供,可寄至:[email protected],經編輯檯審核並評估合宜性後再行刊登。圖片來源:INFINITIX 數位無限。)