NVIDIA 預言「世界模型」市場等同全球經濟,馬斯克 xAI 成新玩家

馬斯克的 AI 公司 xAI 正悄悄開啟一場新戰役,這次目標是打造能理解並模擬世界的「世界模型(world model)」。《金融時報》報導,xAI 已從 NVIDIA 挖角多名專家,並將這項技術應用於遊戲開發與機器人 AI 系統,挑戰 Meta、Google 等科技巨頭。

世界模型:從文字邁向實體的 AI 競賽

與以文字訓練的大型語言模型(LLM)不同,世界模型的核心是「模擬現實」——透過影片、感測器資料與機器人動作數據進行訓練,讓 AI 理解物理法則、空間關係與物件互動。

根據《金融時報》,兩名熟悉內情的人士指出,xAI 的世界模型初期應用將聚焦在 AI 遊戲開發,目標是生成互動式 3D 世界;但另一位消息人士透露,這項技術的長遠計畫其實在於機器人與具身 AI 系統(Embodied AI)。

目前,xAI 已挖來 NVIDIA 的 AI 研究員 Zeeshan Patel 與 Ethan He 加入團隊,兩人皆有世界模型技術的豐富經驗。NVIDIA 的 Omniverse 平台是目前全球最先進的虛擬物理環境模擬工具之一,也為馬斯克的戰略提供了現成的技術養分。

馬斯克在社群平台 X 上透露,xAI 計畫在明年底前推出一款 AI 生成遊戲。根據內部徵才資訊,xAI 正招募影像與影片生成技術人才,打造「Omni 團隊」,專責多模態如文字、影像、聲音的內容生成,同時也招聘「遊戲導師」訓練 AI 助手 Grok 參與遊戲設計。

市場規模等同全球經濟,Google、Meta 已搶先布局

科技巨頭對於世界模型抱持著遠大的期望,認為其能將 AI 應用拓展至軟體和電腦以外的領域,例如人形機器人。上個月,NVIDIA 對外稱世界模型的潛在市場規模可能幾乎等於目前的全球經濟規模。Google、Meta、OpenAI 以及李飛飛成立的 World Lab 是這場世界模型競賽的領跑者。

根據《The Guardian》,Google DeepMind 今年 8 月推出名為 Genie 3 的世界模型,能在模擬的倉庫環境中訓練機器人與自駕車。DeepMind 將其視為邁向「人工通用智能(AGI)」的重要里程碑,能讓 AI 在虛擬環境中預測動作後果、學習因果邏輯。

Google 研究人員解釋,這類模型可用於在虛擬世界中模擬真實訓練,幫助 AI 理解不同情境下的行動選擇,節省實體試錯成本。

另一方面,Meta 也於今年 6 月發布 J-VEPA 2(Video Joint Embedding Predictive Architecture) 模型,強調讓 AI「像人類一樣理解世界」。Meta 首席 AI 科學家 Yann LeCun 表示,這項技術能讓 AI 建立物理世界的「心理模型」,在執行動作前預測物體變化與物理結果。根據 Meta,該模型已能協助實驗室機器人完成「取物與移物」等任務。

Yann LeCun 當時強調,世界模型對於自動駕駛和機器人技術至關重要,並相信這將開啟機器人技術的新時代,讓現實世界的 AI 能夠幫助完成家務和體力任務,而無需大量的機器人訓練數據。

不過,專家警告這仍是高難度任務。遊戲開發商 Larian Studios 的出版主管 Michael Douse 告訴《金融時報》,AI 模型雖能生成場景,卻難以取代人類的創意與敘事;而訓練能真實模擬世界的模型,也需龐大的影片與物理資料集,成本極高。

*本文開放合作夥伴轉載,資料來源:《金融時報》《The Guardian》《Quanta Magazine》《SiliconANGLE》,首圖來源:擷取自 xAI