Search
Close this search box.

Tesla Dojo D1 啟動,AI 訓練效能超越想像

馬斯克(Elon Musk)展示 Dojo D1 超級電腦集群,性能相當於 8,000 個 Nvidia H100 GPU 用於 AI 訓練。這個集群被稱為世界上最強大的 AI 集群。他在 Tesla 的財報電話會議上宣布,由於 Nvidia GPU 價格過高,他將加倍開發和部署 Dojo 系統。

Dojo D1 系統年底運行,性能媲美 8,000 Nvidia H100 晶片

除了在田納西州的新設 xAI 設施,該設施計劃在單一架構上擁有 100,000 個 Nvidia H100 GPU,馬斯克表示,Dojo D1 系統將在年底前運行,具有 8,000 個 Nvidia H100 晶片的處理能力。馬斯克表示,這雖然不是非常巨大,但也不可忽視。

馬斯克於 2021 年首次推出 Dojo D1 晶片,目標性能為 322 TeraFLOPs。去年 8 月,Tesla 招募了一位資深工程計劃經理,負責資訊中心的規劃,隨後 Tesla 在次月訂購加倍數量的 Dojo D1 晶片,顯示對產品性能的信心。到 2024 年 5 月,Dojo 處理器已進入量產階段,現在這些晶片已經運抵美國並進入馬斯克的資訊中心。

Dojo D1 晶片採用 TSMC 先進技術,提升效能

Dojo 晶片是系統晶圓處理器,具有 5×5 陣列。這意味著其 25 個超高性能晶粒通過 TSMC 的集成扇出(InFO)技術互連,能像單個處理器一樣運行,比類似的多處理器機器更高效。

TSMC 為 Tesla 製造 Dojo 晶片,而馬斯克讓晶片與 Nvidia 驅動的 Memphis 超級集群一起運行。田納西州設施隸屬於 xAI ,主要用於訓練 Grok,而 Dojo 晶片則多用於 AI 機器學習和影像訓練,特別是用於訓練 Tesla 汽車從影片資訊中獲得的全自動駕駛技術。

馬斯克表示,年底前將擁有 90,000 個 Nvidia H100 晶片、40,000 個 Nvidia AI4 晶片和 Dojo D1 晶圓。這顯示了馬斯克在人工智慧領域投入的巨大努力和資源。

*本文開放合作夥伴轉載,資料來源:《Tom’s Hardware》首圖來源:《Unsplash》