【祖克伯稱已贏 Google 與 Claude】Meta 大型語言模型 Llama 3 上線，但官方數據卻避戰 GPT-4

科技巨頭對 AI 聊天機器人的競賽進入了白熱化的局面，就在 OpenAI 與 Google 等廠商紛紛「上菜」時，祖克伯旗下的 Meta 也終於釋出了自家的大型語言模型 Llama 3，並透過數據宣稱，Llama 3 的表現比當前大多數人工智慧模型都要來得更好。

Meta 的全新大型語言模型 Llama 3，於今天正式向 AWS、微軟 Azure、Google Cloud 等雲端供應商合作夥伴推出，官方亦表示很快會將其放上 Hugging Face 等模型資料庫，未來使用者可以將其用於聊天機器人之類的產品，Llama 3 目前已具備提供建議、總結文本和進行創意寫作等多種用途。

根據 Meta 於官方部落格的說法，目前上線的 Llama 3 有 8B（80 億）和 70B（700 億）兩種模型參數，其複雜度和訓練資料量較過往的 Llama 2 有著重大躍進。

左踢 Google 右打 OpenAI

Meta 表示 Llama 3 在回答問題時，可以表現出更複雜的多樣性，同時更不容易拒絕回答問題或給出錯誤答案，而 AI 的推理能力也較過去提升許多。Meta 稱 Llama 3 是同時期最佳的開源大型語言模型，並且將維持開源精神，儘快交給社區進行嘗試和發展。

在 Meta 所公布的數據中，官方指出無論是 8B 或 70B 資料權重的 Llama 3，皆於多數基準測試中擊敗 Google 的 Gemma 和 Gemini、Mistral 7B 及 Anthropic 的 Claude 3 等多個資料量相似的同類模型，不過 Meta 並沒有在測試中將最強大的對手：OpenAI GPT-4 列入比較。

掌握 AI 趨勢 & 活動資訊一點都不難！訂閱電子報，每週四一起《AI TOgether》

感謝訂閱！隨時注意信箱的最新資訊

除了基準測試外，Meta 內部也開發出一套新的人類評估集（human evaluation set），包含 1,800 個提示，涵蓋 12 個關鍵使用情境，例如尋求建議、腦力激盪、分類、封閉式問答、編寫程式碼、創意寫作、擷取訊息、扮演角色／人物、開放式問答、推理、改寫與總結。

結果發現，Llama 3 70B 版本無論對上 Mistral Medium、OpenAI GPT-3.5 或 Claude Sonnet 皆得到 50% 以上勝率，但由於這套人類評估集是 Meta 自行定義的測試工具，因此外界應該對其反映出來的結果有所保留。

更大型的模組已在路上

根據官方對 Llama 3 未來的發展規劃，這套模組以後將可以理解更長的指令和資料字串，並且獲得「生成影像」或「轉錄音訊檔案」等等非純文本的回應方式。

Meta 表示參數量超過 400B、更大型的 Llama 3 已於內部開始進行訓練，團隊的近期目標是讓 Llama 3 支援多語言和多模態、理解更長的上下文語境，並繼續提升推理和編寫程式碼等核心大型語言模型能力的整體表現。

【延伸閱讀】

◆「開源模型擊敗 GPT-4」——Meta 研究員對 2024 年 AI 的 8 大預測

◆Anthropic Claude 3 Opus 在 Amazon Bedrock 上正式可用，Claude 3 家族全員到齊

◆號稱「Gemini 的後裔」！Google 悄悄推內部 AI 模型 Goose，幫工程師 coding 更快速

＊本文開放合作夥伴轉載，資料來源：《Meta》、《The Verge》。首圖來源：《Meta》。

Cookie	Duration	Description
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

【祖克伯稱已贏 Google 與 Claude】Meta 大型語言模型 Llama 3 上線，但官方數據卻避戰 GPT-4

左踢 Google 右打 OpenAI

更大型的模組已在路上

TO 會員電子報

【李牮斯專欄】AI 商業模式正在質變，台灣供應鏈準備好了嗎？

Claude Tag 哪裡不一樣？Anthropic 的「數位同事」與導入前 4 個提醒

5 大巨型 AI 交易案吸走全球創投近 60% 資金：KPMG 揭台灣新創如何站上硬體巨人肩膀突圍？

SAS Customer Intelligence 360 結合代理 AI 再次攜手遠東商銀打造「懂你」的財富管理