OpenAI 一直是全球最大的 AI 算力買家之一,也是 NVIDIA 最重要的客戶之一。如今,這家最依賴 NVIDIA 的公司,推出了第一顆自己設計的 AI 晶片。OpenAI 與博通(Broadcom)於週三共同發表首款自研晶片 Jalapeño,根據兩家公司說法,它的定位是專為大型語言模型(LLM)推論打造的加速器,而非用於訓練,且測試中推論成本大幅低於現有 GPU,開發週期只花了 9 個月。
表面上,這是又一顆客製化晶片的發表;但若把鏡頭拉遠,它更代表 AI 競賽的主場正從「誰的模型更強」位移到「誰掌握底層的基礎設施」。不過,一家以軟體與模型起家的公司,為什麼要親手跨進晶片這道又慢又燒錢的關卡?
Jalapeño 是什麼?一顆只做推論、不做訓練的客製晶片
Jalapeño 屬於特定應用積體電路(ASIC)。《VentureBeat》解釋,與能處理多種工作負載的通用型 GPU 不同,ASIC 是為較窄用途調校的晶片,這讓它在特定 AI 任務上可能更便宜、更有效率,即便靈活度不如 GPU。OpenAI 強調 Jalapeño 是針對現代 LLM 推論的「全新設計」,而非把既有的通用加速器改裝來用,架構目標是減少不必要的資料搬移,並讓運算、記憶體與網路資源彼此更協調。
在合作分工上,OpenAI 表示,博通負責核心晶片實作與網路技術,包括其 Tomahawk 網路交換晶片;另一家夥伴 Celestica 則協助電路板、機架與系統整合。根據《VentureBeat》,OpenAI 表示他們已在實驗室以接近量產負載的方式,於 Jalapeño 晶片上運行前代模型 GPT-5.3-Codex-Spark。OpenAI 規劃,完成版晶片將從 2026 年底起,部署到其金主微軟(Microsoft)等合作夥伴的大型資料中心。
9 個月完成 tape-out,號稱史上最快
讓這顆晶片更受矚目的是開發速度。OpenAI 與博通指出,Jalapeño 從最初設計到製造 tape-out 只花了 9 個月,他們相信這是高效能先進半導體有史以來最快的 ASIC 開發週期。根據《VentureBeat》,這個層級的 tape-out 通常以年計算。
OpenAI 把這個速度歸功於深度的軟硬體協同開發,其中一個關鍵是運用 OpenAI 自家的模型來加速部分晶片設計與優化流程。不過,當被外媒詢問到具體用了哪一個模型時,OpenAI 發言人拒絕透露,僅有接近兩家公司的消息人士表示,開發過程倚賴的是前代模型。
OpenAI 在新聞稿中把這件事描述成一個自我強化的飛輪:服務使用者的同一批模型,回頭幫忙打造日後用來跑模型的硬體。OpenAI 主張,如果 AI 真能幫工程師更快設計出更好的晶片,就能壓低整個產業的運算成本。這套說法目前仍是 OpenAI 的願景論述,尚未被外部驗證,但《The Next Web》指出,這呼應了近期一批以 AI 設計晶片為賣點的新創熱潮。
為何跨進硬體?擺脫對 NVIDIA 的依賴與「全端控制」
OpenAI 跨進硬體的動機,與其說是追求技術霸權,不如說是「控制權」。《VentureBeat》指出,自 2022 年底掀起生成式 AI 熱潮以來,OpenAI 一直是 NVIDIA 高階產品的最大買家之一,同時也接受了 NVIDIA 數十億美元的投資,因而招來「循環交易」的批評,並陸續與 AMD、Cerebras 等其他晶片商合作,以餵養龐大的算力胃口。
負責 OpenAI 硬體計畫的 Richard Ho 向《The Next Web》指出,這讓 OpenAI 從模型、軟體、服務系統,一路到底層晶片握有「全端控制」。OpenAI 表示,當每一層都由自己掌握,就能把整套堆疊都調校向同一個目標:更便宜、更快的智慧。
博通執行長陳福陽把話說得更直接,他向《The Next Web》表示,關鍵零組件不該、也不能永遠仰賴第三方 GPU,並預期在中國以外為數不多的前沿模型業者,長期都會走向打造自己的客製 AI 加速器與網路。
但跨進硬體的算盤不只是控制權,還有一筆更實際的成本帳。陳福陽告訴《Bloomberg》,Jalapeño 在測試中的推論成本較典型 AI GPU 約低 50%。這對 OpenAI 而言並非小事,《VentureBeat》引述的審計文件顯示,OpenAI 2025 年營收約 130.7 億美元,全年營運支出卻膨脹到約 340 億美元,營運虧損將近 209 億美元,主因是龐大的運算開銷。在 OpenAI 為 2026 年備受期待的 IPO 鋪路之際,一顆能壓低推論成本的自研晶片,等於對外釋出有辦法把單位經濟拉回正軌的訊號。
OpenAI 加入自研晶片競賽,對 NVIDIA 與市場意味著什麼
把 Jalapeño 放回產業脈絡,會發現 OpenAI 是踏進了一場巨頭早已開打的競賽。《VentureBeat》盤點,Google 的 TPU、亞馬遜的 Trainium、微軟的 Maia、Meta 的 MTIA 系列,都早已走上自研客製晶片的垂直整合路線,而據報 Anthropic 也在探索自家晶片。在中國,受美國出口管制驅動,阿里巴巴半導體部門 T-Head、華為的 Ascend 系列、以及傳出正與高通洽談自研 ASIC 的字節跳動,同樣在加速自研晶片。
值得注意的是,《The Next Web》觀察,這波「後 NVIDIA」的晶片潮裡,博通悄悄成了關鍵供應者。從 Google 的客製加速器到 Jalapeño 背後,都有博通的身影,它近期還與 Anthropic、Google 簽下大型算力協議,提供 AI 實驗室所欠缺的網路連接與製造實力。
不過報導也點出,這些業者的共同邏輯都是「自研晶片搭配 NVIDIA」:各家的自研晶片多用於推論,訓練端仍高度倚賴 NVIDIA。這代表,當前對 NVIDIA 的競爭壓力主要集中在推論這一端。OpenAI 也已開始分散下注,近期就將 Cerebras 的晶片用於推論,Jalapeño 則把這種降低單一廠商依賴的做法進一步變成自有選項。
第一顆晶片不是終點,而是第一步
一顆晶片還稱不上一套完整的策略,OpenAI 已攤開一張多世代藍圖。陳福陽向《Bloomberg》表示,下一代晶片規劃在 2028 年推出,之後逐年更新。OpenAI 更把目標放在 2029 年,要讓自研晶片支撐高達 10GW 的算力。
事實上,《The DeepView》認為,Jalapeño 只是 OpenAI 想吃下 AI 產業更大切面的最新一步:今年 5 月,它先推出讓客戶長期取得算力的 Guaranteed Capacity,又發表開源的 GPU 網路標準 Multipath Reliable Connection,兩者都瞄準與其核心產品無關的層級。
不過《The Next Web》提醒,相關效能宣稱目前全部建立在 OpenAI 自家的早期測試上,詳細報告尚未出爐,在獨立數據出現前,廠商自評的發表數字仍須保留看待;此外,9 個月的 tape-out 距離 GW(十億瓦)級規模的可靠量產,還有一段不算短的路。
對 OpenAI 而言,真正待解的問題是:它究竟能不能靠自研晶片降低對 NVIDIA 的依賴,還是說,擁有一部分自己的晶片,只是替它在談判桌上多爭取一些籌碼。無論答案是哪一個,當這個買進最多 AI 算力的公司決定要自造晶片,這場競賽的衡量標準,已經悄悄從誰的模型強,往誰掌握基礎設施位移。而《The Next Web》指出,產業接下來會緊盯的,是 Jalapeño 在真實負載下究竟撐不撐得住。
【推薦閱讀】
◆ 比 NVIDIA 系統快 4 倍、功耗只有五分之一:Tensordyne 用一個數學技巧重新設計 AI 推理晶片
*本文開放合作夥伴轉載,資料來源:OpenAI、《VentureBeat》、《Bloomberg》、《The DeepView》、《CNBC》,首圖來源:OpenAI



