Search
Close this search box.

Google DeepMind 推出全新 AI 模型 Gemini 把機器人變聰明,辦公室趴趴走!

Google DeepMind 在 AI 領域又出招!這次他們發表了最新的 AI 模型 Gemini,主打讓機器人更聰明,能在辦公室裡自由移動、執行任務,宛如科幻電影場景在眼前上演。

根據 Google DeepMind 團隊發表的論文「Mobility VLA:利用長上下文大型語言模型和拓撲圖進行多模態指令導航」,他們成功利用 Gemini 1.5 Pro 模型訓練機器人,讓它不僅能聽懂指令,還能順利在辦公室裡找到路。

在一系列展示影片中,Google DeepMind 的員工只要對著機器人說「OK, Robot」,就能指揮它完成各種任務,像是帶路到白板前、根據白板上的地圖指示走到指定地點等等。令人驚豔的是,機器人展現出超強理解力和方向感,完美達成所有任務!

為了讓機器人變聰明,Google DeepMind 團隊可是花了不少心思。他們先帶著機器人在辦公室裡走透透,同時用講話的方式標記不同的地點,讓機器人熟悉環境。接著,他們利用「分層式視覺-語言-動作 (VLA)」技術,把環境理解和常識推理能力結合起來,讓機器人能夠看懂文字、圖畫指令,甚至連手勢都能理解。

Google 表示,他們和機器人進行了超過 50 次的互動測試,結果機器人的成功率高達 90%!這項驚人的成果顯示 Gemini 模型在機器人導航方面擁有巨大潛力,未來可望應用在更多領域,像是居家服務機器人、倉儲機器人、自動駕駛汽車等等,讓人類生活更加便利!

*本文開放合作夥伴轉載,資料來源:《TechCrunch》《The Verge》首圖來源:Unsplash

聽數發部、台積電、Gogolook 等重磅講者解密生成式 AI 時代的新策略

立即免費報名 7/23、24【2024 AWS 台灣雲端高峰會】