機器人產業正在達到一個突破創新的臨界點。它們終於有機會可以多處理一些人類可以輕鬆負責的任務。
以前,機器人總是被人類認為只能執行單一任務或是笨笨的,這其實是來自以下限制:
- 機器人缺乏精確的控制和協調;
- 機器人對周圍世界的了解是有限的,完全依賴相機和感測器來感知環境進而做出反應;
- 機器缺乏與生俱來的實用物理意識。
所以對人類非常簡單的綁鞋帶、擦桌子、切菜動作,對機器人來說難如登天;反之機器人輕而易舉可完成的任務,卻對我們來說有困難度。
「模擬人類眼觀四面」機器人才不會跌四腳朝天
不過人工智慧和機器人的結合正日益演進,其中強化學習是一項關鍵技術,使系統能夠透過反覆試驗來自我改進。
例如,波士頓動力公司的 Spot 機器人利用在新環境中可以「模擬人類眼觀四面」的感知模式,自主適應行動方式——此前原先機器人只能在設計好的實驗環境中完成行動,但只要到實驗場域以外就容易跌個四腳朝天。
Spot 的研究人員訓練機器人在模擬環境中移動,再利用內置相機和電腦視覺軟體在現實中引導其學習新技能,如長距離跳躍和爬高箱子。這些技能不是預先設計的,而是透過機器人的自主學習和視覺輸入逐步精進。
加入「大型視覺語言模型」應用,機器人訓練能更精準
另外一個讓人工智慧可以加速機器人能力的關鍵是「數據」。過往,關於人類如何做家事、日常活動的數據量其實很少,大多都是工廠機台的數據。史丹佛大學的研究團隊則利用低成本的 Mobile ALOHA 機器人,僅通過少量的人類示範和數據,迅速學會複雜任務,如烹飪和清潔。這展示了人工智慧快速學習和轉移技能的能力,讓機器人能夠在不同任務間有效應用。
此外,Google DeepMind 的 Open X-Embodiment Collaboration 計畫則目標在全球範圍內收集機器人數據建立一個「機器人互聯網」。這個計畫可讓研究人員能夠更全面地理解和應用機器人在各種任務上的技能,如拾取和移動物件等。
專家認為,大型視覺語言模型的應用可能為機器人提供更深入的世界理解,透過分析影像和語言資料來進行推理和學習。這些模型能夠提供有關周圍環境的語義線索,並且逐步優化機器人的智慧行為能力和決策精準度。
透過「柔性感測器」,讓機器手懂得控制力道
在機器人應用中,另外一個很重要的元素為感測器。以人類手掌為例,我們可以輕易依照物件的大小、質地、重量來判斷要用多少的力道來拿取物品;對機器手掌來說,要在手掌中整合足夠的感官技術而不使其變得笨重或過於複雜仍是一大挑戰。
麻省理工學院電腦科學與人工智慧實驗室(CSAIL)開發的一種新的機器手設計 GelPalm,採用先進感測器實現高靈敏觸摸,幫助「肢體」以更細緻、更細膩的精確度處理物體。
GelPalm 將凝膠質地的柔性感測器嵌入手掌中,其靈感來自於人手柔軟、可變形的特性,並採用特殊的彩色照明技術,使用紅色、綠色和藍色 LED 來照亮物體,並使用相機捕捉反射。這種混合物可產生詳細的 3D 模型,以實現精確的機器人互動。GelPalm 可以更自然地與物體互動並執行更廣泛的任務,未來有機會應用在義肢、生物醫學相關領域的機器人創新應用。
「群體機器人」共享數據,形成群體智慧達成任務
一個機器人的研發設計通常是基於功能,所以形狀不一定得像是一個現實生活中的物品或生物。群體機器人 (Swarm Robot)的設計與應用概念則是來自於大自然中群體行動的魚群、鳥群。這樣的群體行動,可以看出有一致但又可及時應對外界環境的行為模式,也成為機器人未來應用的靈感。
哈佛大學展示一項群體機器人技術專案,開發了多種應用場景,其中包括用於搜索和救援任務、建築工作、環境問題和醫療應用的可程式自主機器人群。這些機器人群通常由微小、簡單且功能一致的機器人組成。
每個機器人都配備了感測器,如攝影機、雷達和聲納,能夠收集周圍環境的資訊。當單個機器人收集並與群組中的其他機器人共享數據時,群體智慧就得以形成,使得機器人群能夠結合數百萬個獨立、自主運行的知識和見解,進行統一決策。這使得機器人群能夠在人類難以到達的地方進行繪圖和尋找資源,特別是在救援人員無法安全到達的地點,搜救機器人群可以發揮重要作用。
儘管目前這些測試研發中的機器人專案,看起來已經讓機器人有更多運用的可能性,但是距離商業化與實際應用落地仍有一段差距。當然技術指數化進步的當下,更通用的機器人應用有望可以在不遠的將來快速實行。
繼續閱讀《你的機器人新同事已上工!》Highlight 其他內容:
*本文開放合作夥伴轉載,資料來源:《MIT Technology Review》、《MIT》。首圖來源:Pixabay。



