宣稱媲美 OpenAI o1！中國實驗室發布「推理」模型

週三，中國 AI 研究公司 DeepSeek 推出了名為 DeepSeek-R1 的「推理」AI 模型預覽版，聲稱這是一個可與 OpenAI 的 o1 競爭的推理模型。

與大多數模型不同，推理模型會花更多時間來思考問題或查詢來進行事實檢查，有助於減少出錯。DeepSeek-R1 的特點，與 o1 類似，能夠透過任務進行推理、提前計劃並執行一系列操作來幫助模型得出答案，這個過程可能需要數十秒的「思考」時間。

這款中國 AI 模型的表現如何？

DeepSeek 表示，他們的模型表現在 AIME 和 MATH 這兩個流行的 AI 基準測試中，表現與 OpenAI 的 o1-preview 模型不相上下。然而，根據外媒《TechCrunch》，一些使用者發現 DeepSeek-R1 在處理井字遊戲和其他邏輯問題時遇到困難。此外，該模型也可能被破解，忽略安全保護措施。

值得注意的是，DeepSeek-R1 似乎會阻擋被認為過於政治敏感的查詢。在《TechCrunch》測試中，該模型拒絕回答有關中國領導人習近平、天安門廣場事件以及中國入侵台灣的地緣政治影響等問題。

報導認為，這可能是中國政府對國內 AI 計畫施壓的結果──要求模型回應必須「體現核心社會主義價值觀」。中國政府甚至提出了一份不能用於訓練模型的來源黑名單。

中國推出「推理」模型反映的 AI 發展趨勢

外媒指出，AI 發展的「擴展法則」（scaling law），也就是透過投入更多數據和運算能力來提高模型性能的理論，已受到質疑──一系列媒體報導指出，OpenAI、Google 和 Anthropic 等巨頭的 AI 模型，並沒有像以前那樣有大幅進展。也因此，業界開始關注推理模型等新的 AI 方法、架構和開發技術。其中，「推理時運算」（也稱為推理運算）成為支撐 o1 和 DeepSeek-R1 等模型的基礎。

微軟 CEO 納德拉在近期微軟 Ignite 大會演講也提到，「我們正在見證一個新的擴展法則的出現」，指的就是推理時運算。這種方法在本質上是給模型額外的處理時間來完成任務。

DeepSeek 已對中國對手造成威脅，未來還計劃開源

DeepSeek 得到了中國量化對沖基金 High-Flyer Capital Management 的支持。High-Flyer 已為模型訓練建立了自己的伺服器群集，據悉擁有 10,000 個 Nvidia A100 GPU，耗資約 1.38 億美元。

DeepSeek 表示計劃開源 DeepSeek-R1 並發布 API。值得一提的是，DeepSeek 此前推出的 DeepSeek-V2 模型已經迫使字節跳動、百度和阿里巴巴等競爭對手降低了部分模型的使用價格，甚至將某些模型完全免費開放。

＊本文初稿為 TechOrange 使用 AI 編撰，資料來源：《TechCrunch》、DeepSeek，首圖來源：DeepSeek。

Cookie	Duration	Description
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

宣稱媲美 OpenAI o1！中國實驗室發布「推理」模型

這款中國 AI 模型的表現如何？

中國推出「推理」模型反映的 AI 發展趨勢

DeepSeek 已對中國對手造成威脅，未來還計劃開源

TO 會員電子報

AI Agent 進公司誰來管？Accenture 點名 HR 扛責，PwC 示警入門職缺「資深化」

攔截消費決策最起點：房產巨頭 Zillow 布局 NotebookLM，讓 AI 化身購屋族專屬軍師

Human-in-the-Loop 不再是黃金標準？亞馬遜揭 AI Agent 治理最大盲點

「3 成企業成功獲得 AI 投資回報，7 成企業尚未跨過應用門檻。」博弘雲端 Nextlink AI Solutions Day 與各領域專家共探零售業如何落實 AI Agent 商業價值