現在,科技巨頭正從開發聊天機器人,大舉轉向投入「實體 AI(Physical AI)」領域。卡內基美隆大學電腦科學學院院長 Martial Hebert 就曾表示,實體 AI 正是傳統機器人技術的進化,畢竟,若 AI 只能閱讀文字,卻無法理解真實物理環境,就難以預測自身行為的後果,也難以具備真正的智慧。
看準這股實體 AI 的龐大趨勢,Arm 策略暨生態系執行副總裁 Drew Henry 近日接受《The Robot Report》Podcast 專訪時指出,Arm 正積極為未來幾年的人形機器人與自主機器,預先設計專屬運算架構,「對我來說,這個領域的核心工程屬性在於:如何縮短從感測器接收到光子,再到致動器觸發之間的延遲時間,」Drew Henry 說。
人形機器人的新算力指標:每焦耳、每公斤能處理多少 Token?
談到當前的硬體極限,Drew Henry 表示:「過去那種每 18 個月電晶體效能就翻倍的摩爾定律黃金時代,確實已經過去了。」 然而,他認為這不代表創新的終結,而是工程師現在必須轉向系統級設計,利用特定領域架構(Domain-specific architectures),或是將工作負載轉移到專用加速器上,以尋求效能突破。
針對未連接電源的機器人,Drew Henry 點出一個打破傳統資料中心思維的全新效能指標:「在這個領域,會出現一個全新的衡量維度:每焦耳、每公斤能處理的 Token 數。」 他解釋,機器人的重量會直接影響致動器移動時所消耗的電量,進而決定整體電池的壽命。因此,工程師必須在有限的電池容量和嚴苛的重量限制下,精算並分配致動器、感測器與運算系統各自的耗電比例。
從集中式大腦到分散式運算,人形機器人架構進入探索期
這種嚴苛的資源分配,也讓機器人的「大腦」設計面臨前所未有的挑戰。Drew Henry 形容,人形機器人平台可能是最複雜的運算平台之一,因為機器人內部存在截然不同的運算層面:一方面,它必須處理負責即時「運動(Locomotion)」控制的次毫秒級低延遲運算,以確保動作的安全性與精準度;另一方面,又要處理不需要極速反應,但專門負責與大型語言模型互動的「互動驅動智慧(Interactive Driven Intelligence)」。
面對如此龐大的運算需求,業界正迎來架構上的探索期。Drew Henry 分享自己近期在一週內拜訪兩家客戶的有趣對比:「有一家客戶告訴我,我們需要盡可能把所有最強大的運算力塞進這個機器人裡;但另一家客戶卻認為,正確的架構應該是在局部放置邊緣運算,並透過高速、低延遲的網路進行連接。」
Drew Henry 強調,在配備密集感測器的環境下,分散式運算確實有助於平行處理多項任務,因此他也預期業界最終將在這兩種極端的架構中,找到最佳平衡點。為了解決這類極度複雜的系統瓶頸,Arm 也推出名為「Performix」的效能分析工具套件,讓軟體開發者與 AI 代理都能直觀地透視底層系統的遙測數據(Telemetry)與 I/O 等待狀態。此外,Arm 也發揮軟體相容性的優勢,讓全球逾兩千萬名開發者能在基於 Arm 架構的雲端伺服器訓練模型後,無需重新編譯即可直接部署到邊緣設備上,大幅降低開發成本與門檻。
從感測器到 AI 加速器,Physical AI 的低延遲競爭始於資料路徑優化
不過,無論系統架構如何選擇,實體 AI 領域的終極挑戰仍在於如何縮短物理反應的延遲。為了解決資料傳輸的瓶頸並優化資料路徑,許多客戶正在捨棄傳統的影像訊號處理器(ISP),轉而採用基於神經網路的 ISP 技術。Drew Henry 指出,這種技術能在資料進入神經網路的初期就決定量化等級,提早過濾掉雜訊並保留關鍵資訊。
「你必須思考如何用最少的資料頻寬,讓傳遞出去的數據具備最高的資訊價值,」Drew Henry 指出,透過這種方式,系統能最大化資訊的「有效吞吐量」,避免浪費頻寬與運算資源,這也呼應前述「每焦耳 Token 數」的嚴苛效能要求。
真實訓練數據不夠用,Sim-to-Real 成為 Physical AI 落地關鍵
然而,就算有先進架構與極低延遲的晶片,機器人依然面臨「缺乏經驗」的困境。相較於自動駕駛汽車已經在現實道路上累積龐大的行車影片以供訓練,Drew Henry 坦言:「目前我們面臨的最大難題之一就是『資料』,機器人與無人機領域極度缺乏真實世界的訓練數據。」
為突破這個瓶頸,業界正積極將「模擬(Simulation)」技術融入實際的訓練系統中,藉此生成訓練所需的合成資料。目前 Arm 也積極與 Siemens、Synopsys 等夥伴合作,將運算系統本身的數位表徵整合進模擬環境中。「現在的重點是,如何創造一個在物理上足夠逼真的合成世界,能夠安全且可靠地在上面訓練機器人,」Drew Henry 表示,唯有透過這樣軟硬體的深度整合,才能讓「模擬到現實(Sim-to-Real)」的技術轉移真正成為可能。
從單純的文字生成,走向能夠預測自身行為後果的實體 AI,這場實體 AI 革命,最終考驗的會是整個科技界如何顛覆既有的系統架構,並透過重新定義能效指標、推動虛實融合訓練,一步步克服物理世界設下的嚴峻挑戰。
【推薦閱讀】
◆ 中美人形機器人對決:智元 G2 進駐量產線品檢,6 天直播零錯誤實測
◆ AI 機器人最缺的不是模型而是資料,新創 XDOF 如何切入這個基礎設施缺口?
◆「未來一定是機器人送包裹。」京東集團創辦人劉強東揭如何讓 70 萬配送員轉型維修人才
*本文開放合作夥伴轉載,資料來源:《The Robot Report》、《AP News》,首圖來源:Unsplash



