Search
Close this search box.

從抓雞塊到旋轉燈泡,機器人新創 Eka 讓機械手臂學會感覺物理世界

機器人靈活度迎來 ChatGPT 時刻?讓 AI 自主學習「怎麼動」竟比人類訓練更流暢

在 AI 技術的發展之下,實體機器人的「大腦」已經比過去聰明許多。然而,若提及機器人的「動作靈活度」,至今卻仍是該產業的最大罩門。

如何讓機器人的動作變得跟人類一樣精準、流暢,正是科學家積極想要解決的問題。對此,來自美國麻薩諸塞州的機器人新創公司 Eka,從機器人的訓練方式上,提出了與眾不同的解決方案。

根據報導,Eka 藉由讓機器人的 AI 模型「自主學習」,而非單純模仿並吸收人類所提供的訓練資料,自行找出抓握、移動物體的方法,並展現出比起當今同類機器人更高的動作靈活度水準。

外媒認為,看著 Eka 旗下機器人的運作,不禁令人想起第一次與 ChatGPT 對話的情景;Eka 的機械手臂不僅動作流暢、舉止自然,即使還稱不上完全跟人類一模一樣,但總讓人懷疑其動作背後,確實蘊藏著某種「智慧」。

從「抓雞塊」展現機器人動作能力

Eka 共同創辦人麻省理工學院教授 Pulkit Agrawal,以及 Google DeepMind 前機器人研究員 Tuomas Haarnoja 向外媒表示,數年之前,團隊意識到機器人的動作靈活度問題,事實上已經可以被現代技術所克服。

在經過更進一步的開發後,Eka 認為他們所擁有的技術,將有機會讓機器人的靈活度達到超人類水準,甚至於未來徹底改變機器人的應用方式,即這類產品將不再僅限用於工廠和倉庫,還會延伸至商店、餐廳,甚至是一般人的家中。

在 Eka 使用機械手臂移動物體的示範中,工程師打造出了一個工作站場景,桌上則散落著形狀各異的雞塊;緊接著,一條輸送帶會把塑膠容器送到 Eka 的機械手臂面前,讓機器人抓起雞塊並放入盒中。

透過 Eka 獨特訓練方式打造的 AI 模型與機械手臂,不僅能以驚人的速度完成任務,甚至還展現出了近乎人類般的臨場應變能力。

舉例來說,Eka 的機械手臂偶爾會小心翼翼放置雞塊,但如果盒子位置離得比較遠,被輸送帶移動到機器人無法觸及的範圍,那麼機械手臂就會做出「輕拋」的動作,把雞塊輕輕丟進容器內。

機器人靈活度問題「解決了一半」

Eka AI 模型與機械手臂對雞塊的流暢處理,其實還有著另一層關鍵意義。

時至今日,食品加工依然是個高度仰賴人工的領域,舉凡水果、蔬菜、肉類等,處理食物不只得迅速,過程還必須輕柔;此外,由於沒有任何兩顆水果、蔬菜或雞塊的外觀完全相同,因此實務上也很難實現自動化。

外媒認為,目前 Eka 所展現出來的技術實力,或許象徵著該公司正朝著機器人產業的重大里程碑進行突破;現時的 Eka 機器人就好比當年 OpenAI 的 GPT-1,雖然還擁有許多缺點,但卻也已經具備「智能」的蛛絲馬跡。

Pulkit Agrawal 與 Tuomas Haarnoja 說,單純以他們的角度來看,Eka 已經讓機器人的動作靈活度問題「解決了一半」,剩下另一半則是如何將 Eka 所採用的訓練方法擴大規模。

利用自主學習,開創不同策略

兩位創辦人指出,Eka 開發出一種名為「視覺-力-動作(Vision-Force-Action,VFA)」的全新 AI 模型,它能夠以模擬方式進行自主學習,並且結合逼真的關節、馬達,以及融入質量、慣性等物理原理。

Eka 的 AI 模型能夠導引機器人明白,究竟某種運動是如何影響螢幕上的像素變化,也能令機器人理解動作的重量與速度,究竟是如何跟被抓取的物體之間產生交互作用。

只不過於此之外,Pulkit Agrawal 與 Tuomas Haarnoja 拒絕提供 AI 模型與機器人本身,更進一步的訓練方式和技術細節。

簡而言之,Eka 的 AI 模型在不依賴人類提供訓練資料的情況下,於模擬環境中進行了數千小時的運算,反覆練習動作並自行構思解決方案,有點類似當年震驚世界的 Google DeepMind 通用棋類 AI AlphaZero,以自我訓練的方式,開創跟過去截然不同的解題策略。

主流 VLA 已經擁有產業鏈

綜觀當前機器人產業所追尋的「物理智能(physical intelligence)」願景,一部分資金雄厚的新創公司,選擇積極投入「視覺-語言-動作(VLA)」模型的開發與最佳化,透過向 AI 模型展示人類的運動影片,或者直接操作機器人讓 AI 模型記憶、學習,希望藉此催生出流暢的機器人原生動作技能。

受惠於網路上已經存在的大量影片作為訓練資料,發展至今 VLA 技術擁有了一定規模的產業鏈,讓開發者可以即時生成、運用這類數據,企業甚至會付費請人戴上攝影機和動作捕捉設備,花費數小時進行重複性的手部操作,只為取得數據供應給 AI 模型與機器人。

相較於產業中的多數公司,Eka 選擇了一條完全不同的路,而且從實際表現來看,似乎收到了相當不錯的效果。

機器人眼中世界跟人類很相似

根據媒體觀察,在從桌上抓取鑰匙串的示範中,Eka 的機械手臂就像擁有某種剛剛萌芽的物理智能,它會先將夾爪的尖端輕觸桌面,接著沿著桌面滑動,然後才接觸到鑰匙,並將鑰匙牢牢夾在指間。

外媒進一步形容,Eka 所開發的機器人和 AI 模型,總感覺跟業界的同類產品很不一樣;機械手臂上的感測器,似乎能夠感知到其承載的重量,以及當機械手臂朝鑰匙串掃去並減速時,整體動作所產生的慣性;一旦鑰匙被機械手臂的爪子夾住,其系統似乎也能感知有物體正掛在爪子上。

不僅如此,外媒還發現 Eka 的 AI 模型,似乎擁有非常強的錯誤恢復能力,除非是人類刻意且不斷干擾,否則機械手臂最終通常都能順利完成任務。

若是從第三者的角度來分析,外媒指出 Eka 機器人與 AI 模型眼中的世界,似乎跟人類所看見的世界很類似;但是,這家公司是否真的能夠於機器人領域,達到跟 OpenAI ChatGPT 一樣的突破及成就,還需要足夠的時間進行證明。

整合訓練模式,組裝 iPhone 可期待

一部分機器人領域專家認為,將真實世界的人類動作影像資料,跟 AI 自主模擬的數據互相結合,其訓練成效將優於單純模擬,所以對於機器人產業來說,同時利用兩種方式並達到相輔相成的效果,有可能才是最正確的答案。

無論如何,若業界想要讓機器人擁有跟人類同樣等級的動作靈活度,那麼其過程終究需要 Eka 正在研發的觸覺與物理智能技術。

Pulkit Agrawal 與 Tuomas Haarnoja 表示,機器人訓練技術是 Eka 最大的商業優勢,公司目前也已經開發出具備「觸覺」的客製化機械手臂與機械爪。

除了抓取體積較大的物體外,Pulkit Agrawal 補充,Eka 所開發出來的機器人技術,理論上也能用於更加精細的操作,比方說組裝 iPhone手機,客戶可以藉由安裝不同的致動器和感測器,讓 AI 於模擬環境中反覆練習來達成。

【推薦閱讀】

◆ 【資本慣性造成的戰略盲點】機器人市場規模是軟體的 30 倍,但資本投入差距 18 倍
◆ 破解機器人硬體碎片化難題:EPFL 研發「運動學智慧」,讓不同機器人無縫複製技能
◆ 20 毫秒快速反應、擊敗桌球職業選手:Sony AI 機器人 Ace 如何跨過 Physical AI 的即時決策門檻?

*本文開放合作夥伴轉載,參考資料:WiredEka Robotics,首圖來源:Eka Robotics

(責任編輯:鄒家彥)