科技巨頭對 AI 聊天機器人的競賽進入了白熱化的局面,就在 OpenAI 與 Google 等廠商紛紛「上菜」時,祖克伯旗下的 Meta 也終於釋出了自家的大型語言模型 Llama 3,並透過數據宣稱,Llama 3 的表現比當前大多數人工智慧模型都要來得更好。
Meta 的全新大型語言模型 Llama 3,於今天正式向 AWS、微軟 Azure、Google Cloud 等雲端供應商合作夥伴推出,官方亦表示很快會將其放上 Hugging Face 等模型資料庫,未來使用者可以將其用於聊天機器人之類的產品,Llama 3 目前已具備提供建議、總結文本和進行創意寫作等多種用途。
根據 Meta 於官方部落格的說法,目前上線的 Llama 3 有 8B(80 億)和 70B(700 億)兩種模型參數,其複雜度和訓練資料量較過往的 Llama 2 有著重大躍進。
左踢 Google 右打 OpenAI
Meta 表示 Llama 3 在回答問題時,可以表現出更複雜的多樣性,同時更不容易拒絕回答問題或給出錯誤答案,而 AI 的推理能力也較過去提升許多。Meta 稱 Llama 3 是同時期最佳的開源大型語言模型,並且將維持開源精神,儘快交給社區進行嘗試和發展。
在 Meta 所公布的數據中,官方指出無論是 8B 或 70B 資料權重的 Llama 3,皆於多數基準測試中擊敗 Google 的 Gemma 和 Gemini、Mistral 7B 及 Anthropic 的 Claude 3 等多個資料量相似的同類模型,不過 Meta 並沒有在測試中將最強大的對手:OpenAI GPT-4 列入比較。
掌握 AI 趨勢 & 活動資訊一點都不難!訂閱電子報,每週四一起《AI TOgether》

感謝訂閱!隨時注意信箱的最新資訊
除了基準測試外,Meta 內部也開發出一套新的人類評估集(human evaluation set),包含 1,800 個提示,涵蓋 12 個關鍵使用情境,例如尋求建議、腦力激盪、分類、封閉式問答、編寫程式碼、創意寫作、擷取訊息、扮演角色/人物、開放式問答、推理、改寫與總結。
結果發現,Llama 3 70B 版本無論對上 Mistral Medium、OpenAI GPT-3.5 或 Claude Sonnet 皆得到 50% 以上勝率,但由於這套人類評估集是 Meta 自行定義的測試工具,因此外界應該對其反映出來的結果有所保留。
更大型的模組已在路上
根據官方對 Llama 3 未來的發展規劃,這套模組以後將可以理解更長的指令和資料字串,並且獲得「生成影像」或「轉錄音訊檔案」等等非純文本的回應方式。
Meta 表示參數量超過 400B、更大型的 Llama 3 已於內部開始進行訓練,團隊的近期目標是讓 Llama 3 支援多語言和多模態、理解更長的上下文語境,並繼續提升推理和編寫程式碼等核心大型語言模型能力的整體表現。
【延伸閱讀】
◆「開源模型擊敗 GPT-4」——Meta 研究員對 2024 年 AI 的 8 大預測
◆Anthropic Claude 3 Opus 在 Amazon Bedrock 上正式可用,Claude 3 家族全員到齊
*本文開放合作夥伴轉載,資料來源:《Meta》、《The Verge》。首圖來源:《Meta》。



