【AI 研究員異想天開】把類 GoPro 綁嬰兒頭上！為何要 AI 牙牙學語不跟科技巨頭作法走？

隨著人工智慧（AI）技術的迅速發展，大型語言模型在全球範圍內引起了關注。這些模型是依靠海量數據訓練出來的複雜神經網路，其能力足以用驚人的準確度預測語言的下一個單詞。然而，人工智慧的訓練方法正在進行一場革命，研究人員開始向人類學習語言的大師——兒童取經，希望透過了解兒童如何習得語言來優化模型。

全球的 AI 競賽日益激烈，研究人員為了尋找更有效的訓練方法，將目光投向了正在學習語言的兒童。蹣跚學步的兒童大腦如海綿般吸收周遭資訊，並能迅速將其轉化為語言能力。相比之下，現有的 AI 模型雖然能流利使用語言，但其訓練需天文數字的文本資料，效率遠不及兒童。

研究新作法：將幼童學語方式應用在 AI 訓練

一名紐約州立大學的心理學家布倫登·萊克（Brenden Lake），與他的研究團隊深入探討兒童如何習得語言，並嘗試將這些方法應用於 AI 模型訓練。萊克的團隊在美國各地收集了超過 25 名兒童的影像和音訊數據，其中也包括他自己女兒的數據。這些數據主要包括兒童在日常生活中的互動場景，並將類似 GoPro 的相機綁在幼兒頭上以捕捉第一人稱視角。

將單詞與它們所代表的物件配對，聽起來好像是一項簡單的任務，但事實上並非如此。

想像一個有小孩的家庭的客廳，客廳內有普通的傢俱，也有大量孩子的玩具與雜物。地板上到處都是玩具、蠟筆散落在咖啡桌上、窗臺上有一個奶瓶、椅子上有待洗衣物。如果一個幼兒聽到「球」這個詞，它可能指的是一個球，但它也可能指的是物體的形狀、顏色、或甚至一天中的時間。

「任何單詞都有無數種可能的含義，」因此不少發展心理學家認為，兒童必須天生就對語言的運作方式有一種與生俱來的理解，才能如此迅速地學習它。

萊克的模型試圖模仿兒童如何從看和聽中學習，並將影片片段和照顧者的話語相結合。這種方法與 OpenAI、Google、Meta 等巨頭的訓練方式正好相反。例如，Meta 的第三代 Llama 模型，使用 15 兆個構成句子的單詞和標點符號的分詞器（Tokenizer）進行訓練，可想而知，這語言模型訓練的背後，勢必要耗費大量的運算和時間。

（編按：萊克表示，實驗的重點不是訓練模型將圖像中的物件和單字做配對，而是希望了解 AI 模型能否只用兒童使用的、極其少量的數據集來學習辨識。）

掌握 AI 趨勢 & 活動資訊一點都不難！訂閱電子報，每週四一起《AI TOgether》

感謝訂閱！隨時注意信箱的最新資訊

研究初步取得成功！未來的發展挑戰是什麼？

儘管研究取得了初步成功，但萊克也坦承這一方法有一定的局限性。目前的模型僅能處理有限的數據，並且在處理動作和抽象概念時還是有所困難。「它沒有學到孩子會知道的一切，這只是一個孩子在這兩年內所獲得的經驗的百分之一。我們需要更多的數據，以便更好地了解什麼是可學習的。」

萊克也表示，未來的研究將整合更多的數據和更先進的技術，以模擬兒童的學習過程，並應用於更廣泛的語言學習情境。

「如果我們能夠建立一個真正開始習得語言的模型，和兒童的學習方式高度相關，那麼它將為理解學習和發展開闢非常重要的應用，甚至將能幫助人類更加了解有學習障礙的孩子或兒童在學習語言的實際情況。」

現在不需綁定信用卡即可在 AWS 上體驗 Claude 3 模型！

【立即試用 Claude 3 系列模型，24 小時內免費體驗！】

【推薦閱讀】

◆ 懂 AI 加薪逾 40% 的 3 種工作！調查揭全球 AI 職缺 10 年成長飆超快，AI 技能趕快學起來

◆ 不知道怎麼叫 AI 做事？微軟 Copilot 新功能可幫你打 pass 甚至改寫提示詞！

◆ 「Google 搜尋已經死了」當 AI 成為 Google 搜尋優先結果，你可能再也找不到自己想要的東西

＊本文開放合作夥伴轉載，參考資料：《The Register》、《MIT Technology Review》、《New York Times》，首圖由 AI 工具 Dall E 生成。

（責任編輯：廖紹伶）

Cookie	Duration	Description
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

【AI 研究員異想天開】把類 GoPro 綁嬰兒頭上！為何要 AI 牙牙學語不跟科技巨頭作法走？

研究新作法：將幼童學語方式應用在 AI 訓練

研究初步取得成功！未來的發展挑戰是什麼？

現在不需綁定信用卡即可在 AWS 上體驗 Claude 3 模型！

【立即試用 Claude 3 系列模型，24 小時內免費體驗！】

TO 會員電子報

迎戰 AI 武器化新風暴！解密 Agentic AI 紅藍對決與企業治理生路

TrendAI™ 獲選為 OpenAI Daybreak 資安計畫「可信任合作夥伴 (Trusted Partner) 」

AI 時代的新門檻：從會用 AI，到能打造 AI 應用

緩解資安人才缺口：Google SecOps 讓初階分析師戰力倍增，縮短 70% 上手時間！