週三,中國 AI 研究公司 DeepSeek 推出了名為 DeepSeek-R1 的「推理」AI 模型預覽版,聲稱這是一個可與 OpenAI 的 o1 競爭的推理模型。

與大多數模型不同,推理模型會花更多時間來思考問題或查詢來進行事實檢查,有助於減少出錯。DeepSeek-R1 的特點,與 o1 類似,能夠透過任務進行推理、提前計劃並執行一系列操作來幫助模型得出答案,這個過程可能需要數十秒的「思考」時間。
這款中國 AI 模型的表現如何?
DeepSeek 表示,他們的模型表現在 AIME 和 MATH 這兩個流行的 AI 基準測試中,表現與 OpenAI 的 o1-preview 模型不相上下。然而,根據外媒《TechCrunch》,一些使用者發現 DeepSeek-R1 在處理井字遊戲和其他邏輯問題時遇到困難。此外,該模型也可能被破解,忽略安全保護措施。
值得注意的是,DeepSeek-R1 似乎會阻擋被認為過於政治敏感的查詢。在《TechCrunch》測試中,該模型拒絕回答有關中國領導人習近平、天安門廣場事件以及中國入侵台灣的地緣政治影響等問題。
報導認為,這可能是中國政府對國內 AI 計畫施壓的結果──要求模型回應必須「體現核心社會主義價值觀」。中國政府甚至提出了一份不能用於訓練模型的來源黑名單。
中國推出「推理」模型反映的 AI 發展趨勢
外媒指出,AI 發展的「擴展法則」(scaling law),也就是透過投入更多數據和運算能力來提高模型性能的理論,已受到質疑──一系列媒體報導指出,OpenAI、Google 和 Anthropic 等巨頭的 AI 模型,並沒有像以前那樣有大幅進展。也因此,業界開始關注推理模型等新的 AI 方法、架構和開發技術。其中,「推理時運算」(也稱為推理運算)成為支撐 o1 和 DeepSeek-R1 等模型的基礎。
微軟 CEO 納德拉在近期微軟 Ignite 大會演講也提到,「我們正在見證一個新的擴展法則的出現」,指的就是推理時運算。這種方法在本質上是給模型額外的處理時間來完成任務。
DeepSeek 已對中國對手造成威脅,未來還計劃開源
DeepSeek 得到了中國量化對沖基金 High-Flyer Capital Management 的支持。High-Flyer 已為模型訓練建立了自己的伺服器群集,據悉擁有 10,000 個 Nvidia A100 GPU,耗資約 1.38 億美元。
DeepSeek 表示計劃開源 DeepSeek-R1 並發布 API。值得一提的是,DeepSeek 此前推出的 DeepSeek-V2 模型已經迫使字節跳動、百度和阿里巴巴等競爭對手降低了部分模型的使用價格,甚至將某些模型完全免費開放。
*本文初稿為 TechOrange 使用 AI 編撰,資料來源:《TechCrunch》、DeepSeek,首圖來源:DeepSeek。



