Search
Close this search box.

馬斯克推「地表最強」AI 模型 Grok 3!搶先試用的專家評價如何?

科技富豪馬斯克的 AI 公司 xAI 在台灣時間 2/28 推出最新 AI 模型 Grok 3。這款馬斯克號稱「地表最強」、與 OpenAI 的 GPT-4o 和 Google 的 Gemini 競爭的模型,具備圖像分析和問答功能,並為馬斯克的社群平台 X 提供多項服務支援。

Grok 3 究竟有多厲害?

xAI 使用位於美國孟菲斯的大型資料中心,配備約 20 萬個 GPU 來訓練 Grok 3。馬斯克在 X 直播中表示,Grok 3 使用了比前代產品 Grok 2 多出「10 倍」的運算能力,訓練資料也擴充到包含法院案件檔案等內容。

Grok 3 也推出多項新功能,包括「DeepSearch」深度搜尋工具,能夠掃描網路和 X 平台的資訊,為用戶提供問題摘要,以及線上遊戲程式設計功能、可處理更複雜問題的「大腦模式」。

此外,Grok 3 其實是一系列模型,包括 Grok 3 Reasoning 和 Grok 3 mini Reasoning ,能夠「思考」推理,類似於 OpenAI 的 o3-mini 和中國 AI 公司 DeepSeek 的 R1。

在發表的直播活動中,xAI 高層聲稱,Grok 3 在數學、科學和程式設計的基準測試中表現優於 Google 的 Gemini、OpenAI 的 GPT-4o、Anthropic 的 Claude 3.5 以及 DeepSeek 的 V3 模型。不過,《BBC》表示,目前還不清楚 Grok 3 與其他先進推理模型相比如何。

馬斯克透露,Grok 應用程式將在一週內新增語音模式,並在數週後開放企業 API 使用。此外,xAI 計劃在未來幾個月內開源 Grok 2,這符合該公司在新版本穩定後開源前代產品的政策。

OpenAI 優勢仍在?專家搶先實測評價兩極

目前,X 平台的 Premium+ 會員可優先使用 Grok 3,不過 xAI 在發表 Grok 3 前已先提供給一些 AI 研究人員和專家測試。外界透過他們的看法,了解這款最新模型的優勢與局限。

事實上,多位 AI 專家對 Grok 3 進行初步測試後,反應不一。從正面來看,著名美國電腦科學家 Lex Fridman 在搶先體驗後表示印象深刻,AI 先驅 Robert Scoble 也表達稱讚,他表示「真正需要關注的是學習速度。而 xAI 的學習速度比其他任何人都快得多。」

技術專家暨研究員 Brian Roemmele 稱讚 Grok 3 擁有「當今最好的推理引擎之一」,其表現遠超過 OpenAI 的「簡陋 PowerPoint 式推理輸出」。

然而,OpenAI 共同創辦人、前特斯拉 AI 主管 Andrej Karpathy 認為,Grok 3 的能力大約與 o1-pro 相當,能成功查詢訓練論文中的複雜資訊等任務,但它們在解決「刁鑽」的井字棋(tic-tac-toe)棋局時一樣遇到了困難

對於 Grok 3 新導入的 DeepSearch 工具,Karpathy 表示,DeepSearch 與 Perplexity 的 DeepResearch 產品大致相同,「雖然不錯,但還沒有達到 OpenAI 最近發布的『Deep Research 』的水準。」

賓夕法尼亞大學沃頓商學院教授 Ethan Mollick 認為,雖然 Grok 3 是一個「非常紮實的前沿模型」,但尚未達到讓用戶放棄現有模型的程度

Geometric Intelligence 創辦人、AI 評論家 Gary Marcus 則抱持更謹慎的態度指出,雖然 Grok 3 進步不少,但尚未帶來革命性突破,而 OpenAI 主要護城河是運算資源和研究規模。Mollick 則表示,在產業合作夥伴關係和企業採用方面,OpenAI 仍保持著強大的優勢

【推薦閱讀】

AI 正在創造新一代文盲工程師?用 AI 寫程式 4 重點讓你保持思考

DeepSeek 帶動 Edge AI App 時代來臨!專訪簡立峰:任何因 AI 在終端加速的都會受益

為什麼台灣 92% 企業還沒用 AI?PwC 提製造、服務、運輸業轉型建議

*本文初稿為 TechOrange 使用 AI 編撰,資料來源:《TechCrunch》《Business Insider》《International Business Times》《CNN》,首圖來源:Unsplash