NVIDIA 一直是資料中心 GPU 的主要供應商,但現在隨著需求的成長,AMD 很有可能成為這個市場的「大型」競爭者,尤其藉助一筆利潤驚人的天價訂單。
AMD 資料中心解決方案主管 Forrest Norrod,近日在接受媒體採訪時透露,公司已經收到某個大型客戶,希望使用 120 萬個 GPU 建立起 AI 訓練伺服器叢集的真實詢問。要知道,目前資料中心內的人工智慧運算設備,通常都只使用了數千個 GPU,並且讓橫跨多個伺服器機架的 GPU 們透過高速網路互相進行連接。
然而,現在卻有人想要將 120 萬個 GPU 通通串在一起,這種開發規模可謂前所未見;Forrest Norrod 也認為,該客戶的要求「確實令人難以置信」。
掌握 AI 趨勢 & 活動資訊一點都不難!訂閱電子報,每週四一起《AI TOgether》

感謝訂閱!隨時注意信箱的最新資訊
目前全世界用於 AI 訓練任務、效能最強的超級電腦為 Frontier,部屬在美國橡樹嶺國家實驗室之中,而它不過只擁有 37888 個 AMD Radeon GPU,假如 AMD 的客戶確實要求透過 120 萬顆 GPU 打造超級電腦成真,那麼它將會比 Frontier 強大近 30 倍。
只不過事情當然沒有那麼簡單,除了 AMD 得先想辦法造出 120 萬顆 GPU 之外,AI 訓練更強調低延遲環境,並在最短時間內呈現結果,然而這種任務將會消耗十分驚人的用電量,AMD 該如何解決能源方面的限制,首先就是個大問題。
其次 AI 訓練需求導致現代伺服器的結構和任務,已經產生重大變化,為了跟上機器學習模型和演算法的步伐,AI 資料中心必須配備專門為人工智慧任務所設計的強大運算能力,也就是伺服器必須負擔大規模的平行運算,並且讓每個叢集中的節點透過足夠快速的互連技術,盡可能高速來回傳遞訊息,因此 AMD 必須要考量如何透過當代技術達成這項要求。
AMD:客戶是位腦袋非常清醒的人
雖然客戶向 AMD 要求 120 萬顆 GPU 聽起來實在有些離譜,但 Forrest Norrod 強調,這是由一位「腦袋非常清醒的人」所提出,並且認真考慮中的事情,客戶甚至願意花上高達 1000 億美元,只為了打造人工智慧資料中心並訓練 AI。
過去幾年科技界的發展熱點,幾乎都脫離不了人工智慧,而 AI 的爆炸性成長,更讓許多科技巨頭願意投入大量資金以保持競爭力。
雖然 AMD 的整體 GPU 出貨量之中,資料中心產品當前比重仍不到 2%,但身為市場上少數能跟 NVIDIA 進行效能廝殺的公司之一,他們現在所提出的商業機會,似乎確實有著幾分的可信度。

【推薦閱讀】
◆ 蘇姿丰指半導體製造走向全球化, AMD 不偏重台灣但台積電仍是堅強戰友
*本文開放合作夥伴轉載,資料來源:《TechSpot》、《The Next Platform》。首圖來源:YouTube



