Search
Close this search box.

Google 第一個「推理」AI 模型來了!為何推理模型成新趨勢?

Google 在 12/19 發布其第一款推理 AI 模型——Gemini 2.0 Flash Thinking,目前正處於實驗階段。這款模型被 Google 稱為其「推理之旅的第一步」,主打最適合多模態理解、推理以及處理程式碼,並可在程式設計、數學和物理等領域推理「最複雜的問題」。

AI 代理時代來臨!Gartner 預測,2028 年 15% 日常工作決策將由 AI 代理自主完成

>> 免費下載《2025 趨勢觀察報告》看 AI 趨勢 <<

Gemini 2.0 Flash Thinking 已在 AI Studio 提供。和 OpenAI 日前發表的 o1 推理模型類似,Google 這款模型的特點是能進行自我事實檢查,避免一般 AI 模型容易犯的錯誤──在回答問題前進行一系列提示分析,並且解釋其推理過程,經過一段時間後,模型會給出它認為最準確的答案。

Google DeepMind 首席科學家 Jeff Dean 在社群平台 X 表示,Gemini 2.0 Flash Thinking 經過訓練,能透過思考來強化推理,而當增加推理運算時間,他們看見了更好的輸出結果。

OpenAI 開出 AI 推理大賽第一槍,對手相競投入

自從 OpenAI 在 9 月發表推理模型 o1,AI 推理領域開始熱鬧起來。DeepSeek 在 11 月初發布了其首款推理模型 DeepSeek-R1,阿里巴巴的 Qwen 團隊則推出了第一個據稱挑戰 o1的「開放」模型。

Google 當然也已默默參與了這場競賽。《Bloomberg》10 月報導,Google 有多個團隊正在開發推理模型,後續也有外媒指出該公司至少有 200 名研究人員投入其中。

是什麼掀起 AI 推理風潮?

是什麼打開了推理模型的大門?原因之一,向模型投入更多的資料和運算能力來提升 AI 能力的「規模法則」已無法帶來顯著效果,促使 AI 產業尋求新的突破。

然而,並非所有人都認為推理是最好的方向。推理模型被認為有 2 個缺點:昂貴、耗電。舉例來說,在 OpenAI 的 API 中,o1 對每分析約 75 萬個單字收費 15 美元、對模型產生的每約 75 萬個單字收取 60 美元──這是 OpenAI 最新「非推理」模型 GPT-4o 成本的 6 倍。

此外,目前推理模型的可靠性、價值尚不明確。o1 被研究者指出仍出現一些錯誤,《TechCrunch》實測 Gemini 2.0 Flash Thinking 時詢問「Strawberry 中有幾個 R」,模型回答「2 個」。

加州大學洛杉磯分校電腦科學系教授 Guy Van Den Broeck 認為,目前模型並未「真正」實現推理,其能力更多取決於模型的訓練數據,這使得它們在處理未曾見過的問題時面臨限制。能解決的任務類型受限,是 AI 推理目前要克服的最大挑戰。

不過《TechCrunch》觀察,隨著時間進展,推理模型的強大市場動力,可以讓推理模型發展得更好,因為在這新一波 AI 風潮,不只是 OpenAI、DeepSeek 和 Google,還有許多創投家、研究社群投入其中。

【推薦閱讀】

ChatGPT 電話服務來了!稱語音不會拿來訓練 AI,專家怎麼看?

AI 代理究竟該如何應用?麥肯錫、埃森哲等企業使用經驗大公開

機器人真能實現人類智慧?研究揭量子運算結合 AI 能辦到

*本文初稿由 TechOrange 使用 AI 編撰,資料來源:《TechCrunch》1《TechCrunch》2《SiliconANGLE》,首圖來源:Google