隨著人工智慧(AI)技術的迅速發展,大型語言模型在全球範圍內引起了關注。這些模型是依靠海量數據訓練出來的複雜神經網路,其能力足以用驚人的準確度預測語言的下一個單詞。然而,人工智慧的訓練方法正在進行一場革命,研究人員開始向人類學習語言的大師——兒童取經,希望透過了解兒童如何習得語言來優化模型。
全球的 AI 競賽日益激烈,研究人員為了尋找更有效的訓練方法,將目光投向了正在學習語言的兒童。蹣跚學步的兒童大腦如海綿般吸收周遭資訊,並能迅速將其轉化為語言能力。相比之下,現有的 AI 模型雖然能流利使用語言,但其訓練需天文數字的文本資料,效率遠不及兒童。
研究新作法:將幼童學語方式應用在 AI 訓練
一名紐約州立大學的心理學家布倫登·萊克(Brenden Lake),與他的研究團隊深入探討兒童如何習得語言,並嘗試將這些方法應用於 AI 模型訓練。萊克的團隊在美國各地收集了超過 25 名兒童的影像和音訊數據,其中也包括他自己女兒的數據。這些數據主要包括兒童在日常生活中的互動場景,並將類似 GoPro 的相機綁在幼兒頭上以捕捉第一人稱視角。
將單詞與它們所代表的物件配對,聽起來好像是一項簡單的任務,但事實上並非如此。
想像一個有小孩的家庭的客廳,客廳內有普通的傢俱,也有大量孩子的玩具與雜物。地板上到處都是玩具、蠟筆散落在咖啡桌上、窗臺上有一個奶瓶、椅子上有待洗衣物。如果一個幼兒聽到「球」這個詞,它可能指的是一個球,但它也可能指的是物體的形狀、顏色、或甚至一天中的時間。
「任何單詞都有無數種可能的含義,」因此不少發展心理學家認為,兒童必須天生就對語言的運作方式有一種與生俱來的理解,才能如此迅速地學習它。
萊克的模型試圖模仿兒童如何從看和聽中學習,並將影片片段和照顧者的話語相結合。這種方法與 OpenAI、Google、Meta 等巨頭的訓練方式正好相反。例如,Meta 的第三代 Llama 模型,使用 15 兆個構成句子的單詞和標點符號的分詞器(Tokenizer)進行訓練,可想而知,這語言模型訓練的背後,勢必要耗費大量的運算和時間。
(編按:萊克表示,實驗的重點不是訓練模型將圖像中的物件和單字做配對,而是希望了解 AI 模型能否只用兒童使用的、極其少量的數據集來學習辨識。)
掌握 AI 趨勢 & 活動資訊一點都不難!訂閱電子報,每週四一起《AI TOgether》

感謝訂閱!隨時注意信箱的最新資訊
研究初步取得成功!未來的發展挑戰是什麼?
儘管研究取得了初步成功,但萊克也坦承這一方法有一定的局限性。目前的模型僅能處理有限的數據,並且在處理動作和抽象概念時還是有所困難。「它沒有學到孩子會知道的一切,這只是一個孩子在這兩年內所獲得的經驗的百分之一。我們需要更多的數據,以便更好地了解什麼是可學習的。」
萊克也表示,未來的研究將整合更多的數據和更先進的技術,以模擬兒童的學習過程,並應用於更廣泛的語言學習情境。
「如果我們能夠建立一個真正開始習得語言的模型 ,和兒童的學習方式高度相關,那麼它將為理解學習和發展開闢非常重要的應用,甚至將能幫助人類更加了解有學習障礙的孩子或兒童在學習語言的實際情況。」
現在不需綁定信用卡即可在 AWS 上體驗 Claude 3 模型!
【立即試用 Claude 3 系列模型,24 小時內免費體驗!】

【推薦閱讀】
◆ 懂 AI 加薪逾 40% 的 3 種工作!調查揭全球 AI 職缺 10 年成長飆超快,AI 技能趕快學起來

*本文開放合作夥伴轉載,參考資料:《The Register》、《MIT Technology Review》、《New York Times》,首圖由 AI 工具 Dall E 生成。
(責任編輯:廖紹伶)



