Search
Close this search box.

推理能力媲美 GPT-5 還免費!DeepSeek 首度將「思考融入工具使用」,讓中國成為重塑全球 AI 版圖的關鍵變數

中國 AI 新創公司 DeepSeek 近日發布 DeepSeek-V3.2、 DeepSeek-V3.2-Speciale 兩款新 AI 模型,再度憑藉極高的推理能力與「完全免費」的開源策略,直指矽谷科技巨頭 Google 與 OpenAI 的核心市場地位,試圖翻轉 AI 市場版圖。

DeepSeek 稱最新發布的 DeepSeek-V3.2 系列模型,在多項推理基準測試中的表現,已能與 GPT-5 匹敵,至於專注在數學與思考能力的 DeepSeek-V3.2-Speciale,效能更可媲美 Google 最新的 Gemini-3 Pro。

為了加速市場滲透,DeepSeek 更採取靈活的發布策略。據《Business Times》報導,這兩款新模型先前就以「實驗版」(DeepSeek-V3.2-Exp)形式釋出,隨後快速迭代為正式版,並堅持開源路線。《VentureBeat》指出,這些模型採用極為寬鬆的 MIT 許可證發布,允許開發者自由修改與部署,預期將大幅提高開發者的採用意願,同時加速技術的全球擴散。

技術亮點:首度將「思考」融入「工具使用」流程

這次 DeepSeek 的最大技術突破,在於讓模型從過去單純的「對話者」進化為能夠自主行動的「代理人(Agent)」,其中最關鍵的是引入「整合式思考」能力。DeepSeek-V3.2 是 DeepSeek 首度將「思考(Thinking)」直接融入「工具使用(tool-use)」流程的模型,讓 AI 從單純的問答機器人進化為能自主行動的 Agent,可以獨立分析數據、與環境互動,並解決複雜的旅行規劃或跨語言程式除錯等高難度任務。

透過這項技術突破,DeepSeek-V3.2 也克服傳統 AI 在調用工具時必須中斷推理的限制,讓 AI 能流暢地使用搜尋引擎、計算器與代碼執行器等外部工具,進一步模仿人類的思考過程。

DeepSeek 的低成本快速迭代能力,成為全球市場的變數

技術能力的突破,加上獨特的商業策略,讓 DeepSeek 的影響力不只來自模型技術本身,更為 AI 市場的競爭方式帶來新改變。《VentureBeat》 指出,DeepSeek 將性能媲美 GPT-5 的模型完全免費開放,提供完整權重供下載,對依賴高額 API 訂閱費的 Google 與 OpenAI 構成直接壓力。

《Bloomberg》進一步分析,DeepSeek 以低成本快速迭代的能力,使其成為全球 AI 模型競賽中的變數,證明即使在硬體出口管制下,中國 AI 仍能找到突破口。因此, DeepSeek-V3.2、 DeepSeek-V3.2-Speciale 兩款 AI 模型的出現,更像是在重塑全球 AI 產業的競爭格局,並打破「只有資本雄厚的科技巨頭才能開發高端模型」的市場邏輯。

《PYMNTS》 則強調,DeepSeek 將「推理」與「工具使用」結合的做法,標誌著 AI 正從「能聊天的系統」走向「能完成任務的實用代理人」。在這種壓力下,Google 與 OpenAI 等美國企業,勢必得重新思考其定價策略、推理能力研發速度,甚至是否需要調整開源策略,以維持既有的技術與市場領先。

專家示警:DeepSeek 模型的資安隱憂

然而,在技術與商業優勢之外,DeepSeek 也面臨安全性的考驗。近期資安公司 CrowdStrike 的研究指出,今年初推出的DeepSeek-R1 生成的程式碼存在明顯且嚴重的安全隱患,當提示詞涉及某些敏感主題時,模型產生的程式碼經常出現硬式編碼秘密(hard-coded secrets)、弱驗證機制,以及未清除的敏感資訊等高風險模式。

專家警告,由於 DeepSeek 已廣泛作為撰寫程式碼的助手使用,若大量開發者未經檢查便直接採用這些生成代碼,相關漏洞將在企業內部快速擴散、複製,形成難以修補的供應鏈風險,最終可能演變為下一個企業級資安黑洞。儘管調查是針對 DeepSeek-R1 模型,但隨著 DeepSeek 持續推出具備更強推理與工具操作能力的新版本,如何同步強化安全性,將成為企業與開發者無法忽視的關鍵課題。

DeepSeek 的高效率低成本架構、開源模式與 Agent 能力,將重新定義 AI 競賽的結構,並證明開源模型已具備與頂尖閉源模型一較高下的實力。

但與此同時, CrowdStrike 資安專家也提醒,模型能力越強、被採用得越快,潛在的風險也越高,因此企業在享受低成本、高性能 AI 的同時,也必須防範 AI 伴隨而來的資安隱憂。

*本文開放合作夥伴轉載,參考資料:《PYMNTS》《Bloomberg》《VentureBeat》《The Business Times》《TechRadar》,首圖來源:Unsplash