Search
Close this search box.

功耗僅 750W!微軟第二代自研晶片 Maia 200 登場,用低精度換取極致推論效能

在全球雲端業者加速擺脫對 NVIDIA 依賴之際,微軟正式推出第二代自研 AI 加速器 Microsoft Azure Maia 200,全面瞄準生成式 AI 推論市場。

採用台積電 3nm 製程,稱效能超越亞馬遜、Google

Maia 200 採用台積電 3 奈米製程打造,內含約 1,400 億個電晶體,專為大規模 AI 工作負載設計。根據微軟說法,該晶片的 FP4 運算能力最高可達 10.1 PetaOPS,約為亞馬遜第三代 Trainium 晶片的三倍,同時在 FP8 運算表現上,也超越 Google 第七代 TPU。

圖片來源:Microsoft

與前一代 Maia 100 相比,微軟此次不再迴避與競爭對手的比較,反而主動強調其效能優勢。微軟雲端與 AI 事業群執行副總裁 Scott Guthrie 表示,Maia 200 能夠輕鬆運行目前最大的 AI 模型,並為未來更大型模型預留足夠空間。

不過《The Register》分析,微軟為了最大限度地提高每瓦性能,做出了一些重大讓步。在設計上,Maia 200 僅原生支援 FP8、FP6 與 FP4 等低精度資料類型。因此,雖然從 FP8 降到 FP4 仍可帶來約 2 倍的 FLOPS 效能提升,但對於需要 16 位元或 32 位元精度的工作負載,效能影響相當明顯,因為相關運算必須改由晶片的 Tile Vector Processor(TVP)處理,導致運算效率下降。

強化記憶體與頻寬、挑戰 NVIDIA 護城河

與訓練相比,推理對於記憶體頻寬更為敏感。為解決此問題,Maia 200 重新設計記憶體子系統,配備了 216GB 第五代高頻寬記憶體,分佈在六個 HBM3e 堆疊中,據稱可提供 7 TB/s 的頻寬,接近 NVIDIA Blackwell 系列 8 TB/s 的水準。

微軟也強調 Maia 200 在成本效益和能源效率上,比競爭對手的加速器高。「Maia 比目前市場上任何其他 AI 晶片都便宜 30%,」Guthrie 在一段宣傳影片中說道。

《The Register》分析,這款晶片功耗僅 750 瓦,遠低於 NVIDIA 的兩款晶片(每款功耗超過 1200 瓦)。微軟表示,如此低的功耗使得 Maia 可以靈活部署在風冷或液冷資料中心。

此外,微軟也試圖挑戰 NVIDIA 的軟體護城河。隨同新晶片,微軟推出了一套包含 Triton 在內的軟體開發工具,該工具由 OpenAI 協助開發,旨在提供與 NVIDIA CUDA 相似的功能,降低開發者遷移的門檻。

不過《The Register》也提醒,由於 Maia 是一款推理晶片,因此即便可能比 NVIDIA 的 Blackwell 系列晶片更勝一籌,但功能遠不如後者全面。

首批晶片交付內部超級智慧團隊

微軟表示,Maia 200 的首批晶片將優先交付給內部的「超級智慧團隊」(Superintelligence Team),用於生成數據以訓練下一代 AI 模型。隨後,這些晶片將大規模部署於 Azure 的美國中部資料中心,並逐步擴展至鳳凰城等地,主要任務是支援企業版 Microsoft 365 Copilot 以及 OpenAI 的最新模型,包括備受矚目的 GPT-5.2。

Gartner 分析師 Chirag Dekate 認為,Maia 200 的推出證明了微軟對自研晶片的長期承諾。他強調,隨著全球 AI 資料中心的能源需求激增,但新能源供應卻相對匱乏,像 Maia 這樣專注於提升能源效率的專案顯得至關重要。

立即預約下載【2026 AI 人才年會暨 AI 職涯博覽會】演講精華,掌握 AI 時代人才升級的最前沿趨勢與戰略

*本文開放合作夥伴轉載,資料來源:Microsoft 1Microsoft 2《SiliconAngle》《Tom’s Hardware》《Bloomberg》《The Register》《Reuters》《The Verge》,首圖來源:Microsoft