當前科技界正迎來一波人形機器人熱潮,包含特斯拉的 Optimus、波士頓動力的 Atlas 等數十款機器人,正積極準備進入市場 。業界之所以如此執著於「人形」,是因為生活環境原本就是為人類量身打造,像是要轉動門把需要手,要爬樓梯則需要雙腳。特別是市場對人形機器人的期待,就是要真正走入工作場域並發揮價值,進一步完成開門、搬箱子等枯燥的日常雜事。然而,這也是當前人形機器人,最難跨越的門檻之一。
為了解決這個實用性痛點,由前 NVIDIA 機器人研究人員所創立的瑞士新創公司 Flexion Robotics 提出全新的解方。與多數鑽研機械關節的硬體公司不同,Flexion 的核心重點是開發讓人形機器人能自主完成任務的「軟體系統」,打造一個能真正理解指令、拆解任務並串接行動的 AI 大腦。
Flexion 讓人形機器人從單點動作,到可以串接日常生活流程
為了展示這個「AI 大腦」的潛力,Flexion 運用一台改裝過的 Unitree 人形機器人進行實際測試。《WIRED》報導,這款機器人能夠接收語音指令到樓下領取包裹,接著自行走樓梯、搭電梯回來,最後甚至能拆開包裹並把零食放進抽屜裡。
這個任務的關鍵並不在於機器人學會某個單一動作,而是必須把取包裹、開門、移動、搭電梯、拆箱與整理物品等多個步驟,串連成一個流暢且完整的自動化流程。目前多數的人形機器人展示影片,通常只聚焦在摺衣服或上架等特定任務,且幕後往往高度仰賴人類進行遠端操控。然而,一旦把這些機器人放到不熟悉的環境中,遠端操控的方式便容易失效。相較之下,Flexion 的優勢在於能讓機器人先在模擬環境中學會各種基本技能,隨後再將這些技能組合起來,自主應用於真實世界中。
如何打造人形機器人的大腦?Flexion 用強化學習連接任務與動作
要達成這樣的高度自主性,Flexion 系統運作的核心在於結合不同的 AI 模型,其中的「主 AI」會先消化人類做事的影片,藉此學會什麼時候該採取什麼行動。這些影片的功能不是直接教導機器人如何完成每一個物理動作,而是教它在任務流程中應該依序採取的行動邏輯。
例如,當主 AI 判斷任務需要開門或搭電梯時,系統就會呼叫機器人先前在模擬環境中學到的對應技能,並將其順利應用到現實場景中。同時,Flexion 的軟體也肩負控制機器人馬達的重任,確保機器人能夠平穩地走路、移動四肢並維持平衡。
Flexion 共同創辦人兼執行長 Nikita Rudin 表示,這套軟體的秘密武器是大量使用強化學習技術,從主 AI 模型、模擬環境到馬達控制,每一層的設計都是透過不斷地試錯來完成訓練,正如 ABI Research 分析師 George Chowdhury 所強調:「真正具有革命性的不是人形機器人本體,而是支撐它們運作的 AI 模型。」
Physical AI 為何還沒迎來 ChatGPT 時刻?資料、安全與泛化能力是難題
儘管 Flexion 在軟體端取得了亮眼進展,但放眼整體機器人產業,打造強大的 AI 大腦仍面臨嚴峻考驗。《The New Yorker》的報導指出,和生成文字與影像的 AI 相比,驅動機器人的實體 AI(Physical AI)仍然面臨許多發展門檻,NVIDIA 機器人業務負責人 Deepu Talla 便坦言:「世界上還沒有機器人版的 ChatGPT。」
這背後最大的瓶頸在於資料嚴重不足。語言模型可以輕易從開放網路的文字中學習,但世界上根本不存在同等規模的「關節運動軌跡」資料庫,即使讓全世界的人都穿上動態捕捉服裝,也需要數十年的時間,才能產生出當初用來訓練 ChatGPT 那種規模的資料量。
為了解決這個資料匱乏的痛點,業界演化出不同的應對策略。例如 1X 公司近期重新擁抱遠端操作機制,提議讓操作員遠端幫客戶調酒,並將其視為收集資料以推動「數據飛輪(data flywheel)」效應的重要途徑。此外,德國機器人公司 Neura 則讓上千名工業勞工穿上動態捕捉服裝來大規模收集人類動作數據。還有一種解方,是透過工程技術,將 YouTube 等平台上的第一人稱視角影片,轉換為機器人可用的關節軌跡資料集。
另一方面,與 Flexion 理念相呼應的另一家新創 Skild AI,則試圖打造「通用實體 AI」大腦,目標是將這套軟體安裝到任何機器人的身體裡。為了讓這種通用大腦具備適應各種突發狀況的能力,Skild AI 團隊甚至會透過猛踹機器人,或是用電鋸切斷機器狗的腿等極端方式,來測試並強化 AI 自行補償機體損傷與修正錯誤的能力 。
這些案例顯示,機器人產業可能正走向一種「Android 模式」,也就是專注於編寫跨平台軟體,並運行在其他公司製造的硬體上。未來的機器人更能透過雲端發揮「蜂群思維(hive mind)」的優勢,只要其中一台機器人學會了新技能,其他機器人就能同步學會,加速整體進化。
然而,除了技術與資料,安全仍是無法迴避的課題。Apptronik 與 Google DeepMind 的專家皆提醒,在小孩或小型寵物周圍,使用人形機器人仍有極大的安全疑慮,這也是機器人進入家庭前必須克服的關鍵難題。
人形機器人下一戰:AI 大腦能否跨硬體、拆解任務
現在,人形機器人要走進真實場景,關鍵不只是會不會走路或抓取物品,而是能理解任務、拆解步驟,並把不同技能串成完整的流程。目前,Flexion 正與多家機器人公司展開合作,且其軟體系統可跨平台應用於不同形態的人形機器人上。這類軟體能力具有龐大的商業價值,分析師估計到 2036 年,機器人基礎模型的市場價值將高達 1,500 億美元。
人形機器人落地的下一步,已經不只是單純比拚硬體,而是像 Flexion 與 Skild AI 一樣,讓 AI 學會拆解現實世界的任務並實際執行,這或許才是解鎖未來千億美元市場與解決缺工危機的最後一哩路。
【推薦閱讀】
◆ 中國兩大實體 AI 新創估值同破 200 億人民幣,智平方、自變量力拚特斯拉
◆ 南韓砸逾 8,800 億美元打造 AI 國家隊:拆解台、日、韓的 AI 國力競賽
◆ 人形機器人民主化:Hugging Face 的 LeRobot 要讓任何人都能做真機 AI 實驗
*本文開放合作夥伴轉載,資料來源:《WIRED》、《New Yorker》,首圖來源:Flexion Robotics



