Search
Close this search box.

【挑戰人形機器人技術瓶頸】達明機器人如何破解「虛實落差」與「泛化」兩大難題?

專訪:《TechOrange》社長戴季全 / 撰稿:李昀蔚

「現在的人形機器人技術,其實是 AI 跟機器人技術的深度整合,與其說是垂直發展,倒不如說是橫向、把各種不同領域技術整合進來,所以如何無縫整合,其實是一個相當大的工程,」本集《全新一週》邀請到達明機器人智慧機器人發展處處長夏紹基,從達明機器人在今年五月成立的人形智創中心開始談起,分析 AI 機器人的趨勢,以及人形機器人發展的挑戰與解方。

夏紹基表示,因為人形機器人必須在人類生活的環境中移動並執行任務,所以最重要的是要讓機器人理解環境,因此需要一個空間 AI 模型,告訴機器人環境中物品的位置、方向、大小、顏色等資訊。這些感知與視覺技術,是達明機器人開發人形機器人時持續探究的一塊,並期待結合學術單位的研究成果,共同打造這些新技術。

傳統機器人與人形機器人的差異

夏紹基指出,傳統或現行的機器人,主要設計目的是「執行程式設計師編寫的程式碼」,屬於 Rule-based(規則式)。此外傳統機器人運行的時候會比較聚焦在物理階層的互動技術,但「規劃任務」則是人類的工作。

然而,隨著如大語言模型(LLM)或視覺大語言模型(VLM)等新一代 AI 模型的導入,機器人的架構開始產生結構性轉變,「除了可以透過自然語言對談之外,機器人也可以規劃整個任務過程,並根據環境因素規劃整個任務過程,」夏紹基形容,AI 進來之後,是把「規劃」這一層工作自動化,未來可能只需要直接指揮機器人、告訴它命令,就可以自動完成指定任務,這也是未來人形機器人與現有機器人最大的不同。

人形機器人落地應用的兩大挑戰

今年八月,達明機器人推出結合 NVIDIA Isaac GR00T 機器人通用模型與自主研發 AI 視覺技術的人形機器人TM Xplore I。從結構設計來看, Xplore I 頭部具有兩軸自由度,可進行旋轉與俯仰動作,雙手各有七個自由度,軀幹則有六個自由度。Xplore I 的頭部與雙手皆配有鏡頭,同時考慮到應用場景主要會在平坦的工廠,因此腳部以輪式為主。

「目前我們碰到的困難是在機器人跟真實世界互動時,會產生差異,導致精度沒有辦法符合,」夏紹基分析,造成這種現象的來源有兩個原因,首先是「從模擬到實體」的問題,因為現在缺乏一個可靠的物理 AI,因此經過虛擬環境所模擬出來的動作,放到真實世界的時候就會產生落差,進而造成落地的困難。

第二個原因是,機器人其實是透過有限資料學習運動技巧,所以當環境出現不同變數,機器人就較難進行之前學習的動作,這又被稱為「泛化」。因此如何克服從模擬到實體的差距,以及把動作泛化到每一個環境都適用,是目前人形機器人落地應用的兩大挑戰。

夏紹基說明,這兩大挑戰也是現今全球業界的共同課題,達明機器人也持續透過關注世界模型與物理模型的開發進展,並結合現有學術單位的研究成果,探究提升機器人精度與適應能力的解方。

人形機器人將是未來社會的解方

「Xplore I 是達明的第一代智慧人形機器人開發平台,基本上往後我們的人形機器人技術,都會以這個平台為基礎繼續發展,」夏紹基強調,達明選擇以工業應用為主戰場,期待充分發揮人形機器人的優勢,並針對不同行業與專業領域,訓練具備特定技能的專業型機器人,提供客製化服務,讓企業不需投入高額建置或維護成本,也無須專業團隊管理,就能達到提升生產效能、有效降低支出的成果。

夏紹基指出,隨著台灣進入超高齡社會,人形機器人將是填補人力缺口的重要解方。未來,這些機器人將不僅是生產線上的輔助夥伴,還可以延伸到長照與陪伴場域,進一步照顧老年人的日常生活,甚至能 24 小時監控長者的健康狀況,「以這個角度來看,其實人形機器人不只提供比較好的生活照顧,也減輕年輕人的負擔,所以對社會結構來講,我覺得人形機器人是一個正向的影響。 」