當外界以為 AI 競賽已從 H100 走向 Blackwell,舊一代 GPU 的價值應該隨時間下滑時,SemiAnalysis 創辦人 Dylan Patel 卻在近日受訪時,拋出一個反直覺的判斷:H100 今天的價值,可能比 3 年前還高。
Dylan Patel 指出,目前真正限制 AI 發展的,已經不只是模型能力,還有更底層的基礎建設,分別是邏輯晶片、記憶體與電力。同時,SemiAnalysis 最新報告更進一步指出,儘管過去幾年科技巨頭已大舉擴建 AI 基礎設施,但市場如今還是進入了「矽晶片短缺」的新階段。
瓶頸 1:AI 晶片集體轉向台積電 N3,但供應鏈擴產速度追不上 AI 需求
SemiAnalysis 指出,2026 年主要 AI 加速器(AI accelerator)家族,包括 NVIDIA、AMD、Google TPU、AWS Trainium 以及 Meta MTIA 等,幾乎都在往台積電 3 奈米(TSMC N3)製程轉移。SemiAnalysis 預估,AI 相關需求在 2026 年將吃下接近 60% 的 N3 產出,到了 2027 年這項佔比甚至上看 86%。
Dylan Patel 分析,NVIDIA 很早就鎖定台積電的產能分配,而且到 2027 年,NVIDIA 可能會拿走超過 70% 的 N3 晶圓產能。因此,當 Google 與 Amazon 等對手較晚意識到需求爆發而回頭向台積電要產能時,往往面臨嚴重的排擠效應。在這個供不應求的局面下,台積電實質上扮演了「造王者(kingmaker)」的角色。由於 AI 晶片面積更大、利潤更高,且客戶有著無上限的支付意願,台積電已明確將 AI 基礎設施的產能優先級,排在智慧型手機與 PC 等消費性電子產品之前。
雖然 TSMC 持續砸重金擴產,但在未來兩年內仍無法完全補足 AI 對 N3 的龐大需求。SemiAnalysis 更預估,有效 N3 產能利用率(effective N3 utilization)將在 2026 年下半年超過 100%。為了榨出更多供給,台積電甚至試圖將部分製程層轉移到其他晶圓廠來挑戰極限,這也顯示過去幾年備受關注的 CoWoS 封裝產能如今已經逐漸緩解,目前擴張算力最主要的瓶頸,已正式轉移至前端的晶圓製造能力。
Dylan Patel 進一步補充,半導體供應鏈的前置時間遠比資料中心還要長,像晶圓廠的建設就需要兩到三年的時間,但資料中心的建設卻可在不到一年內完成。若將時間線拉長到 2030 年,供應鏈的最底層限制將會落在艾司摩爾(ASML)的 EUV 曝光機上。
Dylan Patel 認為,這台世界上最複雜的機器單價高達 3 億至 4 億美元,其供應鏈涉及成千上萬的專業技術與零件,根本無法像傳統製造業那樣彈性擴產。目前 ASML 一年大約生產 70 台 EUV,即使供應鏈極限擴張,到了 2030 年預計每年也僅能生產 100 台左右,這終將成為未來無限擴張 AI 算力時難以跨越的天花板。
瓶頸 2:HBM 吃掉更多產能,且每代加速器的記憶體內容量都在上升
Dylan Patel 指出,第二個瓶頸在於 AI 推理與長上下文(long context)進一步拉高了記憶體需求。為了處理龐大的 KV cache,記憶體在硬體佈局中的重要性持續飆升,Dylan Patel 也直言:「加速器一半的成本是記憶體。」更驚人的是,預計到 2026 年,科技巨頭整體資本支出中,高達 30% 都將單獨砸在記憶體上。
SemiAnalysis 指出,全球記憶體短缺在短期內難以緩解,因為多數新增的 DRAM 產能都被高頻寬記憶體(HBM)所吸收,擠壓通用型 DRAM 的生存空間。在每位元消耗的晶圓產能上,HBM 大約是通用 DRAM 的 3 倍,隨著推進到 HBM4,這項差距可能接近 4 倍。
針對這項供給困境,Dylan Patel 補充,記憶體廠在過去幾年因為價格低迷、利潤不佳,所以並沒有新建晶圓廠,因此即使目前價格訊號已經出現、廠商決定擴產,新晶圓廠的建設仍需約兩年時間才會真正到位。為了在 2027 年末或 2028 年新廠完工前擠出產能,廠商只能採取極端手段,例如美光就選擇直接買下台灣成熟製程的廠房來改裝。
SemiAnalysis 指出,就算消費性電子產品出貨量衰退 10% 到 15%,所釋放出來的產能也僅佔整體 DRAM 需求的 3%,完全不足以填補 AI 帶來的巨大缺口。這也意味著,大眾可能將面臨手機與 PC 變貴又沒實質升級的窘境,甚至可能因此引發對 AI 的強烈反感。
瓶頸 3:電力與資料中心雖然吃緊,但晶片供應鏈仍是最大弱點
談到 AI 算力擴張的第三項瓶頸,Dylan Patel 認為是「電力(power)」與資料中心建設。然而,Patel 特別強調,雖然過去業界一度將 CoWoS 封裝、電力與資料中心視為 AI 發展的最大阻礙,但這些其實都屬於「前置時間較短」的基礎設施項目。舉例來說,一座晶圓廠的建設需要兩到三年,但一座資料中心通常在不到一年內即可完工。
針對電力問題,Patel 承認電力並非可以「任意無限制地擴展」,但整體供應鏈相對晶片製造而言要簡單得多,而且在資本主義的推動下,人類絕對有辦法解決擴建的難題,他也列舉業界正積極狂掃的多元發電來源,包含:燃氣渦輪機、航空衍生型燃氣渦輪、往復式引擎、船用引擎、燃料電池,以及太陽能、風力發電與電池儲能等。
儘管這些自建發電設施的建置成本可能高達傳統電網發電的兩倍,但若將其分攤到單一 GPU 每小時的總擁有成本(TCO)上,實際上僅會增加幾美分。相較於新一代 AI 模型能力躍升所帶來的龐大經濟價值,這點額外的電力成本根本微不足道,因此 AI 實驗室與雲端供應商都具備極高的支付意願去克服這些障礙。
當 H100 比 3 年前更值錢,背後反映的是整個 AI 產業已從模型競賽走入基礎建設競賽。當邏輯晶片、HBM 記憶體,以及電力與資料中心建設同步成為擴張瓶頸,誰能率先鎖定產能、記憶體與算力部署條件,誰就更有機會主導下一輪 AI 競爭格局。
*本文開放合作夥伴轉載,參考資料:《SemiAnalysis》、Dwarkesh Podcast,圖片來源:Unsplash



