Search
Close this search box.

如何以感知技術為核心,讓 AI 機器人看懂世界、真正走進生活?Amazon Devices & Services 首席應用科學家親自剖析

「與在網頁上對話的軟體 AI 語言模型不同,我們所做的是 Embodied AI,也就是具身人工智慧,我們想讓 AI 走進實體世界。」

「科學家的成就感可以分為兩階段:當把不可能變成可能時,是第一階段的成就感;第二階段則來自看到這個新技術改變使用者的生活。」從台灣清華大學的教授,到消費型機器人團隊的感知技術專家,Amazon Devices & Services 首席應用科學家孫民分享到,在 Amazon Devices & Services 團隊,自己主要負責讓機器人理解人與環境,以 Amazon 家用智慧機器人「Astro」為例,其功能設計涵蓋安防與陪伴,這意味著 Astro 不只會看、會聽,還需要能理解語意。

比如:當使用者下達「去大門查看包裹」的指令,Astro 就需要了解這句話的意思—思考如何移動、去哪裡看、應該呈現什麼結果,這些應用涉及語言理解、空間感知、任務規劃等技術,「其中最核心的 Perception 感知技術,讓家用機器人能夠準確理解室內環境,無論是家庭住宅還是中小型企業這類人類活動空間。考驗一些核心能力,比如 3D 空間環境的理解以及準確解讀人類意圖,這要求機器人具備對文字指令的語義理解能力,以及能基於理解執行多樣化任務。」

透過 Amazon 文化與資源,將技術知識轉化為實際產品

「Paradigm Shift(正規化轉移)不會只發生在全世界的一個地方,而是全球性範圍的正規化級突破。在 AI 技術全球擴散的過程中,亞太地區需要的不僅是技術引進,更需要本土化的人才培養和技術創新體系 ⸺ 而這正是我能發揮最大價值的領域。」孫民分享,自己選擇職業始終遵循兩個核心原則,一方面是追隨自己的熱情,另一方面是尋找能夠最大化個人貢獻的領域。2018 到 2022 年間,孫民在台灣新創公司負責數位行銷,並成功運用機器學習技術實現營銷決策自動化,包括目標受眾篩選、產品匹配、投放時機選擇及通路最佳化等關鍵環節,這讓他學會洞察客戶需求的重要性,明白技術優勢必須與客戶需求相結合,與單純依靠技術不關注客戶需求的學校思維截然不同,「也是在那時,我開始系統思考企業文化的構建邏輯。」

「在 Amazon,我可以投入研究、做產品,同時也擁有資源和使用者,是非常理想的工作環境,」從清大教授、新創公司,再到目前加入的 Amazon 團隊,孫民表示 Amazon 環境與文化符合自己的期待,特別是領導力準則。例如 Customer Obsession(顧客至尚)、Bias for Action(崇尚行動)這兩項原則,都與孫民初創公司摸索的方法論高度契合,甚至已發展成熟制度,「基於過去累積的經驗,我還發現自己特別適合也特別喜歡技術突破後的這個階段 —— 將創新與客戶需求對接,並快速實現規模化。這就像把圖書館裡的技術知識轉化為實際產品,讓我獲得獨特的職業滿足感。」

與全球團隊協作,連接數據、模型與實體世界,避開「沉沒風險」

Amazon Devices & Services 是 Amazon 旗下創新硬體部門,旗下核心產品包括 Alexa、Kindle、Fire TV、Echo、Ring 和 Project Kuiper 等。

進一步談到作為台灣 Amazon 科學家,如何與全球團隊進行協作,孫民指出約一半的工作時間是與國際團隊的科學家深度合作,將非常模糊的技術問題與客戶需求相結合,共同識別核心技術方向、制定可行的 Roadmap(行動指南),並透過重要實驗來做出正確決策。其次,一部分的時間是與 SDE(工程師團隊)合作推進技術落地,當某些技術趨於成熟時,台灣團隊就可以開會與 SDE 緊密配合,將雲端研究成果部署至實體機器人,實現從研究原型到產品化的轉化。

此外,還有一些時間是與數據資料與標註團隊協作。為推進 AI 研發進程,Amazon 團隊需要大量高質量、多樣化的訓練資料。孫民觀察,許多年輕 AI 科學家注重實際操作、擅長做模型,但對於數據資料的理解與涉及還不夠深,「我的角色,就是讓數據、模型與實體世界的任務連起來,發現專案中容易被忽視的盲點,幫助大家避開『沉沒風險』。另一方面,很多年輕科學家起步快,但常在中途遇到瓶頸,這些問題往往不在演算法本身,而是隱藏於數據環節。比如我現在正協調數據資料與質量團隊和模型使用方的需求,這種經驗能幫助團隊規避那些不易察覺的『數據陷阱』。」

以開放的思考方式推動技術應用走進日常生活

「一個理想的 AI 工程師應該具備想像力與表達力,」孫民表示,工程師需要先構建一個可完成的願景,再進一步推導:如何收集到相關的資料?如何規模化?接著逐步往目標前進,才可能創造新的解法,倘若工程師缺乏想像力,很容易侷限在被動接受任務的框架內。在「表達力」部分,孫民指出當想像力驅動初步結果,工程師需要透過清晰簡單的語言表述清楚、說服成員,這是將自我構想轉化為團隊合力創新的關鍵,以掌握使用者更直接的反饋,和同事更多的支援,最終獲得資源與合作。

「我一直問自己一個問題:Why me?這件事為什麼是我來做?我能做出什麼不同?」孫民認為,自己在 Amazon 團隊的價值,就是幫助團隊看見盲點、串連資源,並維持開放的思考方式,「而真正讓我感到有意義的,是當一項本來看似不可能的技術,能被實現,並真正走進人們的生活。」

想瞭解更多 —— 完整「技術突破只是開始:Amazon Devices & Services 首席應用科學家如何讓 AI 真正走進生活」,現在可以立即免費下載電子書。