馬斯克推「地表最強」AI 模型 Grok 3！搶先試用的專家評價如何？

科技富豪馬斯克的 AI 公司 xAI 在台灣時間 2/28 推出最新 AI 模型 Grok 3。這款馬斯克號稱「地表最強」、與 OpenAI 的 GPT-4o 和 Google 的 Gemini 競爭的模型，具備圖像分析和問答功能，並為馬斯克的社群平台 X 提供多項服務支援。

Grok 3 究竟有多厲害？

xAI 使用位於美國孟菲斯的大型資料中心，配備約 20 萬個 GPU 來訓練 Grok 3。馬斯克在 X 直播中表示，Grok 3 使用了比前代產品 Grok 2 多出「10 倍」的運算能力，訓練資料也擴充到包含法院案件檔案等內容。

Grok 3 也推出多項新功能，包括「DeepSearch」深度搜尋工具，能夠掃描網路和 X 平台的資訊，為用戶提供問題摘要，以及線上遊戲程式設計功能、可處理更複雜問題的「大腦模式」。

此外，Grok 3 其實是一系列模型，包括 Grok 3 Reasoning 和 Grok 3 mini Reasoning ，能夠「思考」推理，類似於 OpenAI 的 o3-mini 和中國 AI 公司 DeepSeek 的 R1。

在發表的直播活動中，xAI 高層聲稱，Grok 3 在數學、科學和程式設計的基準測試中表現優於 Google 的 Gemini、OpenAI 的 GPT-4o、Anthropic 的 Claude 3.5 以及 DeepSeek 的 V3 模型。不過，《BBC》表示，目前還不清楚 Grok 3 與其他先進推理模型相比如何。

馬斯克透露，Grok 應用程式將在一週內新增語音模式，並在數週後開放企業 API 使用。此外，xAI 計劃在未來幾個月內開源 Grok 2，這符合該公司在新版本穩定後開源前代產品的政策。

OpenAI 優勢仍在？專家搶先實測評價兩極

目前，X 平台的 Premium+ 會員可優先使用 Grok 3，不過 xAI 在發表 Grok 3 前已先提供給一些 AI 研究人員和專家測試。外界透過他們的看法，了解這款最新模型的優勢與局限。

事實上，多位 AI 專家對 Grok 3 進行初步測試後，反應不一。從正面來看，著名美國電腦科學家 Lex Fridman 在搶先體驗後表示印象深刻，AI 先驅 Robert Scoble 也表達稱讚，他表示「真正需要關注的是學習速度。而 xAI 的學習速度比其他任何人都快得多。」

技術專家暨研究員 Brian Roemmele 稱讚 Grok 3 擁有「當今最好的推理引擎之一」，其表現遠超過 OpenAI 的「簡陋 PowerPoint 式推理輸出」。

然而，OpenAI 共同創辦人、前特斯拉 AI 主管 Andrej Karpathy 認為，Grok 3 的能力大約與 o1-pro 相當，能成功查詢訓練論文中的複雜資訊等任務，但它們在解決「刁鑽」的井字棋（tic-tac-toe）棋局時一樣遇到了困難。

對於 Grok 3 新導入的 DeepSearch 工具，Karpathy 表示，DeepSearch 與 Perplexity 的 DeepResearch 產品大致相同，「雖然不錯，但還沒有達到 OpenAI 最近發布的『Deep Research 』的水準。」

賓夕法尼亞大學沃頓商學院教授 Ethan Mollick 認為，雖然 Grok 3 是一個「非常紮實的前沿模型」，但尚未達到讓用戶放棄現有模型的程度。

Geometric Intelligence 創辦人、AI 評論家 Gary Marcus 則抱持更謹慎的態度指出，雖然 Grok 3 進步不少，但尚未帶來革命性突破，而 OpenAI 主要護城河是運算資源和研究規模。Mollick 則表示，在產業合作夥伴關係和企業採用方面，OpenAI 仍保持著強大的優勢。

【推薦閱讀】

◆ AI 正在創造新一代文盲工程師？用 AI 寫程式 4 重點讓你保持思考

◆ DeepSeek 帶動 Edge AI App 時代來臨！專訪簡立峰：任何因 AI 在終端加速的都會受益

◆ 為什麼台灣 92% 企業還沒用 AI？PwC 提製造、服務、運輸業轉型建議

＊本文初稿為 TechOrange 使用 AI 編撰，資料來源：《TechCrunch》、《Business Insider》、《International Business Times》、《CNN》，首圖來源：Unsplash。

Cookie	Duration	Description
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

馬斯克推「地表最強」AI 模型 Grok 3！搶先試用的專家評價如何？

Grok 3 究竟有多厲害？

OpenAI 優勢仍在？專家搶先實測評價兩極

TO 會員電子報

人才是一切，但晶片才是天花板：俄羅斯主權 AI 戰略的結構性矛盾

讓電商顧客每次造訪營收衝高 4.75 倍：百貨巨頭 Macy’s 如何用 AI 當導購？

台灣 AI 採用贏全球，產出成果卻落後一截？微軟揭企業 AI 的導入盲點

南韓砸逾 8,800 億美元打造 AI 國家隊：拆解台、日、韓的 AI 國力競賽