人形機器人發展至今,常常呈現走路不自然,看起來有點「笨拙」的樣子,但美國機器人新創 Figure AI 正在改變這個現況。Figure AI 本週釋出影片,展示其 Figure 02 機器人成功實現了自然流暢的步態,包括腳跟著地、腳尖離地與手臂自然擺動等動作,看起來更像人類。
Figure AI 是怎麼辦到的?
Figure 的核心方法是在高精度物理模擬環境中,模擬數千個、擁有不同物理參數的虛擬 Figure 02 機器人,並運用「強化學習(Reinforcement Learning, RL)」進行訓練──這能讓機器人透過試錯方式學習。
在 Figure 的模擬環境中,機器人會面對不同地形、致動器動態變化,甚至是跌倒、滑倒與外力推擠等突發狀況,並從中學習控制策略。不過,除了讓機器人學會走路,如果不加以引導,訓練結果可能會收斂在一些雖然有效,卻不具人類風格的控制策略。因此,Figure 團隊特別加入模仿人類走路的獎勵機制,讓機器人學習過程有參考軌跡,並根據回饋獎勵訊號不斷優化動作表現。
根據 Figure 的說法,他們能在幾小時內於模擬器累積相當於數年的經驗,而且這樣的多元訓練讓單一神經網路策略能夠廣泛適用,並且能夠「零樣本(zero-shot)」直接部署到多個實體機器人上,展現穩定且自然的人類步態。
更大的難關:將模擬結果轉移到實體機器人
不過,最大挑戰之一是如何將這些模擬中學到的技能轉移到真實機器人身上,這也是所謂的「模擬到真實(sim-to-real)問題」。
強化學習近年被廣泛應用於機器人領域,其優勢在於能處理複雜的連續控制問題,但也存在訓練成本高、收斂慢,以及難以從模擬環境直接遷移至真實世界等挑戰。強化學習若要成功轉移到真實機器上,除了模擬器需高度逼真,還必須解決動態不確定性、感測誤差與資料不足等問題。
Figure 的解法是結合兩項技術:一是「領域隨機化(domain randomization)」,在模擬階段隨機變化機器人的物理特性,使訓練結果更具通用性;二是利用「kHz 等級的力矩回饋控制」,即時補償真實世界中與模擬環境的差異。
Figure 的未來盤算:用機器人製造機器人
讓機器人自然行走只是第一步。Figure 同步也在打造機器人大量生產的基礎。根據 Figure,他們宣布啟用全新生產基地「BotQ」,第一代產線預計每年可生產多達 1.2 萬個人形機器人。
為了因應量產需求,Figure 不僅重新設計機器人結構,捨棄原型階段常用但難以量產的 CNC 加工,轉而採用射出成型與壓鑄等工業化流程,並建立了涵蓋 3,000,000 顆致動器的供應鏈。他們也揭露正在設計下一代機器人 Figure 03。
有趣的是,Figure 還計劃用自家機器人來協助生產更多機器人,並並導入自家研發的 AI 模型 Helix。機器人將能協助物料搬運、關鍵零件組裝,實現所謂的「機器人打造機器人」。Figure 的策略不僅在訓練機器人會走路,更要讓它們能大量生產並廣泛部署。
立即報名 4/9「AI 機器人產業論壇」由TO / NVIDIA / AWS共同主辦

【推薦閱讀】
◆ 特斯拉 Optimus 機器人今年挑戰生產 5,000 台,馬斯克:等同一支羅馬軍團
*本文開放合作夥伴轉載,資料來源:Figure AI 1、Figure AI 2,首圖來源:Figure AI。



