當全球 AI 競賽持續升溫,科技巨頭比拚的已經不只是模型能力,而是誰能用更快速度、更多元的硬體組合,撐起愈來愈龐大的訓練與推論需求。近日 Meta 公布 MTIA 300、400、450 與 500 等四代自研 MTIA 晶片路線圖,在這一系列晶片路線圖的背後,透露的是一場 AI 基礎設施戰略的加速。
Meta 一方面希望因應快速擴張的 AI 工作負載,另一方面也試圖透過自研晶片降低成本、分散硬體來源,因此這次發布的意義不只是單純的推出新晶片,更反映出 Meta 正在重新調整 AI 硬體布局的節奏與優先順序。
Meta 晶片戰略轉向,推論成為下一個主戰場
目前,首款新晶片 MTIA 300 已經投入使用並進入量產,主要負責支撐 Meta 內容排序(ranking)與推薦系統(recommendation systems)的演算法訓練。這也是在生成式 AI 崛起前,Meta 內部最主要的工作負載。
然而,隨著生成式 AI 浪潮興起,Meta 的硬體設計重點也隨之轉移。雖然 MTIA 400、450 與 500 等後續三代晶片仍具備處理各類工作負載的能力,但在近期至 2027 年間,將採取「推論(inference)優先」的策略,專門針對生成式 AI 的推論進行優化,並支援已訓練完成的模型產生文字或圖片等輸出。
針對此路線的轉變,Meta 工程副總裁 Yee Jiun Song 點出關鍵:「我們看到目前推論需求呈現爆炸性增長,這也是我們目前專注的重點。」相較於市面上主流 GPU 通常優先為模型「預訓練」而打造,Meta 刻意選擇將新款晶片聚焦於生成式 AI 的「推論」環節,以期能更具成本效益地支撐旗下龐大的應用服務。
為了跟上 AI 變化速度,Meta 把 MTIA 做成可快速迭代的產品線
為了跟上這種從推薦系統轉向生成式 AI 推論的需求變化,Meta 也同步調整自研晶片的開發節奏。《Reuters》指出,Meta 規劃以約每六個月一代的驚人節奏推進新晶片,這也與 Meta 正在快速擴張支撐 Facebook、Instagram 等服務的資料中心基礎設施密切相關,「這就是我們基礎設施建設速度的現實,」Meta 工程副總裁 Yee Jiun Song 在受訪時坦言。
然而,要在如此短的時間內不斷更新硬體,主要是為了解決「AI 模型演進速度遠快於傳統晶片開發週期」的痛點。Yee Jiun Song 解釋,與其按照傳統硬體模式押注單一設計並經歷漫長的開發等待,Meta 刻意採取「持續迭代」的策略。同時,為了達成這種高頻率的更新節奏,每一代 MTIA 都建立在上一代的基礎上,並透過使用模組化的小晶片(chiplets)設計,讓 Meta 能夠將更新週期從數年縮短至數個月。這樣的模式,也讓研發團隊能確保基礎設施始終跟得上快速變動的 AI 需求。
Meta 想用自研晶片壓低成本,但不會停止採購外部晶片
《Bloomberg》指出,Meta 推進四代自研晶片,主要目的是在昂貴且快速變動的 AI 競賽中,分散硬體來源、降低對外部晶片商的依賴,藉此壓低成本。「我們不需要像通用市場那樣包山包海,可以捨棄不需要的功能,從而大幅降低成本,」Meta 工程副總裁 Yee Jiun Song 解釋,由於這些晶片是專為 Meta 自身特定資料處理需求量身打造,這也使得自研晶片能帶來更低的能耗與更好的效能表現。
不過,開發客製化晶片既昂貴又耗時,因此 Meta 採取的是「雙管齊下」的策略:一方面持續投資自研晶片,另一方面仍會向 NVIDIA 與 AMD 採購大量通用的 AI 硬體,以確保能應付整體營運龐大的運算需求。
自研晶片技術與部署節奏,也反映 Meta 的 AI 基建思路
為了將自研晶片的客製化效益最大化,Meta 的硬體布局也不再侷限於單一晶片。從 MTIA 400 開始,Meta 不只做晶片本身,而是圍繞著晶片設計「整套硬體系統」,規模涵蓋多個伺服器機櫃,甚至包含為了因應龐大散熱需求而設計的液冷(liquid cooling)版本。
在供應鏈與底層技術上,《WIRED》指出 Meta 是與 Broadcom(博通)合作開發這批半導體,採用開源的 RISC-V 架構,並交由台積電製造。
在具體規格的推進上,MTIA 400 已完成測試並準備進入資料中心,預計 2027 年初發布的 MTIA 450,其高頻寬記憶體(HBM)的頻寬(Bandwidth)將是 MTIA 400 的兩倍。緊接著推出的 MTIA 500 更會在記憶體擴充與低精度資料(low-precision data)處理上帶來進一步的創新。這也顯示,Meta 這波自研晶片布局不只是單點硬體升級,而是圍繞推論需求、記憶體配置與資料中心部署速度,重新設計整體 AI 基礎建設架構。
Meta 這次公布四代 MTIA,不只是強調自研晶片的再升級,更揭示 AI 基礎設施競爭的轉向。當推論需求持續暴增,誰能用更快的迭代節奏、更多元的硬體組合與更低成本撐起服務規模,誰就更有機會掌握下一輪 AI 競賽的優勢。
*本文開放合作夥伴轉載,參考資料:Meta、《Reuters》、《Bloomberg》、《WIRED》,圖片來源:Meta



