Google 第一個「推理」AI 模型來了！為何推理模型成新趨勢？

Google 在 12/19 發布其第一款推理 AI 模型——Gemini 2.0 Flash Thinking，目前正處於實驗階段。這款模型被 Google 稱為其「推理之旅的第一步」，主打最適合多模態理解、推理以及處理程式碼，並可在程式設計、數學和物理等領域推理「最複雜的問題」。

AI 代理時代來臨！Gartner 預測，2028 年 15% 日常工作決策將由 AI 代理自主完成

>> 免費下載《2025 趨勢觀察報告》看 AI 趨勢 <<

Gemini 2.0 Flash Thinking 已在 AI Studio 提供。和 OpenAI 日前發表的 o1 推理模型類似，Google 這款模型的特點是能進行自我事實檢查，避免一般 AI 模型容易犯的錯誤──在回答問題前進行一系列提示分析，並且解釋其推理過程，經過一段時間後，模型會給出它認為最準確的答案。

Google DeepMind 首席科學家 Jeff Dean 在社群平台 X 表示，Gemini 2.0 Flash Thinking 經過訓練，能透過思考來強化推理，而當增加推理運算時間，他們看見了更好的輸出結果。

OpenAI 開出 AI 推理大賽第一槍，對手相競投入

自從 OpenAI 在 9 月發表推理模型 o1，AI 推理領域開始熱鬧起來。DeepSeek 在 11 月初發布了其首款推理模型 DeepSeek-R1，阿里巴巴的 Qwen 團隊則推出了第一個據稱挑戰 o1的「開放」模型。

Google 當然也已默默參與了這場競賽。《Bloomberg》10 月報導，Google 有多個團隊正在開發推理模型，後續也有外媒指出該公司至少有 200 名研究人員投入其中。

是什麼掀起 AI 推理風潮？

是什麼打開了推理模型的大門？原因之一，向模型投入更多的資料和運算能力來提升 AI 能力的「規模法則」已無法帶來顯著效果，促使 AI 產業尋求新的突破。

然而，並非所有人都認為推理是最好的方向。推理模型被認為有 2 個缺點：昂貴、耗電。舉例來說，在 OpenAI 的 API 中，o1 對每分析約 75 萬個單字收費 15 美元、對模型產生的每約 75 萬個單字收取 60 美元──這是 OpenAI 最新「非推理」模型 GPT-4o 成本的 6 倍。

此外，目前推理模型的可靠性、價值尚不明確。o1 被研究者指出仍出現一些錯誤，《TechCrunch》實測 Gemini 2.0 Flash Thinking 時詢問「Strawberry 中有幾個 R」，模型回答「2 個」。

加州大學洛杉磯分校電腦科學系教授 Guy Van Den Broeck 認為，目前模型並未「真正」實現推理，其能力更多取決於模型的訓練數據，這使得它們在處理未曾見過的問題時面臨限制。能解決的任務類型受限，是 AI 推理目前要克服的最大挑戰。

不過《TechCrunch》觀察，隨著時間進展，推理模型的強大市場動力，可以讓推理模型發展得更好，因為在這新一波 AI 風潮，不只是 OpenAI、DeepSeek 和 Google，還有許多創投家、研究社群投入其中。

【推薦閱讀】

◆ ChatGPT 電話服務來了！稱語音不會拿來訓練 AI，專家怎麼看？

◆ AI 代理究竟該如何應用？麥肯錫、埃森哲等企業使用經驗大公開

◆ 機器人真能實現人類智慧？研究揭量子運算結合 AI 能辦到

＊本文初稿由 TechOrange 使用 AI 編撰，資料來源：《TechCrunch》1、《TechCrunch》2、《SiliconANGLE》，首圖來源：Google。

Cookie	Duration	Description
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

Google 第一個「推理」AI 模型來了！為何推理模型成新趨勢？

OpenAI 開出 AI 推理大賽第一槍，對手相競投入

是什麼掀起 AI 推理風潮？

TO 會員電子報

Human-in-the-Loop 不再是黃金標準？亞馬遜揭 AI Agent 治理最大盲點

「3 成企業成功獲得 AI 投資回報，7 成企業尚未跨過應用門檻。」博弘雲端 Nextlink AI Solutions Day 與各領域專家共探零售業如何落實 AI Agent 商業價值

去完一趟 COMPUTEX，AI 就能落地嗎？導入的隱形成本藏在這裡

Anthropic 與白宮從對抗轉向合作：一場管制風波，正逼出 AI 安全新規則