Search
Close this search box.

【每秒 2,000 Token 史上最快】阿聯上線 K2 Think 開源模型,爭搶中美 AI 領導地位

每秒 2000 Token 史上最快!阿聯上線 K2 Think 開源模型爭搶中美 AI 領導地位

位於阿拉伯聯合大公國境內,簡稱 MBZUAI 的穆罕默德·本·扎耶德人工智慧大學團隊,近日宣布推出全新低成本開源 AI 推理模型 K2 Think;該模型不僅號稱擁有全世界最快的處理速度,更讓阿聯成為全球 AI 競賽中的嶄新參賽者。

根據 MBZUAI 介紹,K2 Think 模型擁有 320 億個參數,即 32B 水準,若跟美國企業的旗艦基礎模型相比,雖然仍屬小巫見大巫,但卻延續了 AI 業界追求更小、更有效率的高效能模型趨勢,以驚人的處理速度獲得外界熱議。

MBZUAI 指出,K2 Think 在數學、程式碼和科學等複雜基準測試中,擁有同等甚至超越更大規模 AI 模型的實力,同時運算所需的硬體需求也來得更低。

強調速度與規模簡化,超越中美模型

K2 Think 被開發團隊稱為「世界上最快的開源 AI 模型」,能夠根據使用者的問題請求,每秒生成高達 2,000 個 Token,為典型 GPU 算力部署吞吐量的 10 倍以上。

根據 AI 效能測試網站 Artificial Analysis 的資料,目前美國企業的先進 AI 模型,如 Google 的 Gemini 2.5 Flash,其每秒 258 個 Token 處理速度,已經屬於業界領先水準,但是跟 2,000 個 Token 相較仍有極大差距。

根據筆者於 K2 Think 網站上的實地測試,該模型的輸出速度確實「快到令人覺得不可思議」,平均 Token 處理速度可以落在每秒 1,000 個以上。

配合晶圓級引擎,導入多種先進技術

深入探討 K2 Think 如此強大的原因,首先是該模型為 MBZUAI 與 G42 合作開發,後者是一家位於阿聯,但由美國科技巨頭微軟所支持的 AI 公司。

其次,K2 Think 導入了長思維鏈(Long CoT)監督式微調,以及測試階段擴展(test-time scaling)技術,讓 AI 模型在進行逐步推理時,能夠彈性分配運算資源以提升處理效能。

此外,K2 Think 所仰賴的運算硬體,為第三方 AI 供應商 Cerebras 旗下的晶圓級引擎(WSE),配合推測解碼(Speculative Decoding)技術,使得模型能夠在短短 16 秒時間內,處理最多 32,000 個 Token 的超長上下文內容。

MBZUAI 基礎模型研究所所長 Hector Liu 解釋,K2 Think 的獨特之處在於團隊將其視為「整個系統」,而非單純只是一個 AI 模型;因此跟常規的 AI 模型開源模式不同,MBZUAI 可藉由實際部署模型的方式營運,開發團隊亦會觀察如何隨時間推移,不斷改進 K2 Think 的服務品質。

筆者於 K2 Think 網站進行實地測試,該模型輸出速度確實非常快,每秒平均可達 1,000 Token 以上。

專注解決複雜問題,打破巨頭算力壟斷

另一方面,MBZUAI 表示 K2 Think 是專為解決高階問題開發,所以並沒有對日常互動進行最佳化。該模型會採用循序漸進的規劃和執行策略,處理數學證明、程式設計挑戰和科學推理等任務,這些步驟與流程跟人類專家解決結構化問題的方式完全一致。

因此在模型效能的基準測試中,K2 Think 於數學方面幾乎領先所有開源模型,其 AIME 2024 得分為 90.83、AIME 2025 得分為 81.24,至於 HMMT 2025 得分為 73.75。

MBZUAI 顧問 Alexandru Voica 直言,K2 Think 是現今面對複雜數學基準測試中,表現最為頂級的開源 AI 模型,然而,其參數規模卻僅有 OpenAI 與 DeepSeek 等同類競品的零頭,但整體效能卻可以與他們互相抗衡。

Alexandru Voica 說,若 AI 業界還是有人認為,唯有頂級模型才具備解決艱難問題的能力,那麼阿聯團隊開發的 K2 Think,顯然將顛覆並糾正這種觀念。

Alexandru Voica 將 K2 Think 視為全球 AI 技術的轉捩點,並指出過去 AI 業界大多信仰,只要讓模型規模變得更大,各種進展就會自然發生,但是這卻導致擁有算力資源的科技巨頭越來進步,其他人反而裹足不前,K2 Think 的誕生將有望打破這種局面。

擺脫石油經濟轉型,AI 成阿聯全新希望

地處阿聯的 MBZUAI 基礎模型研究所,事實上在 2025 年 3 月才正式成立,並成為該國「人工智慧 2031」的戰略核心,強調知識主權與開放研究。

MBZUAI 校長 Eric Xing 對媒體表示,K2 Think 僅使用 2,000 塊專用 AI 晶片進行訓練,遠遠少於美國企業、實驗室的硬體設備數量,這代表阿聯確實有能力,透過有限的資源實現 AI 發展目標,樹立「後規模時代」的新標竿。

近來,阿聯試圖將自己定位為 AI 領域的全球領導者之一,希望藉此強化地緣政治影響力,進一步實現經濟多元化,擺脫對石油出口的依賴。然而,微軟對 G42 的投資與合作,卻仍引來了美國政府的審查,並懷疑 G42 跟中國擁有過於密切的關係。

換句話說,即便 K2 Think 確實成為阿聯極為重要的突破,可是在美國、中國於 AI 領域二元對立的情況下,阿聯的 AI 產業想達到相同規模和水準,顯然還有很長的路要走。

徹底開源可商業利用,瞄準 AI 空白市場

目前 K2 Think 模型已經透過 Apache 2.0 授權正式開源,允許外界將其部署於商業環境、學術研究及幾乎任何合法領域。同時,K2 Think 的開源也不僅僅是權重,包含訓練資料、微調程式碼、推理工具和基礎架構等亦全數開放。

無論是個人或商業公司,即刻起都能自由獲取 K2 Think 的程式碼、訓練集和權重參數等資料,並於下載後任意修改,再將模型部署到商業應用程式之中,所有成本通通都是免費。

MBZUAI 基礎模型研究所執行董事 Richard Morton 說,對於人類大腦而言,推理是所有思考過程的基礎,只要有效利用 K2 Think,未來許多團隊、企業,全都無須動用上千人,耗費多年去思考某個特定問題,或者進行某種臨床實驗之類的任務,借助 AI 的力量,各種工作的時間將會獲得大幅壓縮。

Richard Morton 也強調,K2 Think 將能幫助那些無法取得美國 AI 技術的市場,順利導入人工智慧應用,並增廣先進 AI 科技的全球性覆蓋,透過更少的資源消耗,達成更多的目標任務。

【推薦閱讀】

◆ 微軟將鉅資投入 AI 晶片群實現「自給自足」,與 OpenAI 關係生變?
◆ 【開源 AI 更省錢嗎】研究揭 Token 消耗最高達 10 倍,企業選擇該注意什麼?
◆ 瑞士國家級 AI 模型 Apertus 登場——完全開源,對抗巨頭壟斷

*本文開放合作夥伴轉載,參考資料:《VentureBeat》《CNBC》,首圖來源:Google Gemini、Microsoft Copilot

(責任編輯:鄒家彥)