隨著 AI 持續蓬勃發展,台灣市場對於繁體中文模型的技術需求也在日益增長。近日,跨國 AI 公司 iKala 宣布推出繁體中文驗證集 TMMLU+,協助國內企業在開發繁體中文大語言模型時,可以使用 TMMLU+ 作為模型驗證的工具,藉此讓 AI 應用更加貼近本地需求。
iKala 的繁體中文驗證集 TMMLU+ 於 2023 年 10 月著手開發,並於 2024 年春天正式送交 AI 語言模型學術會議 COLM(Conference on Language Modeling)進行審查。
COLM 是由來自 DeepMind、Meta、微軟及常春藤等,各大 AI 領域的知名學者共同創立,為世界上極具公信力的 AI 組織。
在 COLM 的評審過程中,iKala AI 團隊特別針對繁體中文的字形及用法等特色進行詳細說明,大大加深了評審委員的印象,有效提升 TMMLU+ 的論文評價,使其在激烈的競爭中脫穎而出,獲得前 10% 的高分。
iKala 表示,自生成式 AI 技術崛起以來,各國都致力於發展各種大語言模型(LLM),台灣亦有不少企業正著手發展繁體中文 AI 模型,但有鑒於各國語言的差異性,台灣特有的文化和用字習慣,例如「8+9」、「北車」或台語等,使繁體中文大語言模型在建構的過程中,也需要專屬驗證集才能進行調校,藉此幫助開發者獲得更精準的 AI 應用成果。
繁體中文驗證集 TMMLU+ 是基於聯發科所推出的框架 TMMLU,透過社群媒體資料進行更深入的擴展,涵蓋更多台灣本地用語和人文背景,因此更貼近繁體中文的詞語情境和表達方式。
iKala 指出,由於這款驗證集形式開源,所以目前已獲得多家台廠採用,紛紛透過 TMMLU+ 進行大語言模型評測,為台灣科技業提供可靠且統一的驗證標準。
iKala 共同創辦人暨執行長程世嘉表示,作為來自台灣的跨國 AI 公司,他們致力於解決困難但充滿意義的 AI 難題,並以實際的商業價值和應用場景作為最終目標。程世嘉非常感謝 AI 團隊成員們的努力,讓 iKala 有機會被國際看見,也感謝聯發科引領台灣 AI 開源技術推進發展。
【延伸閱讀】
◆ 回答得比 GPT-4o 更好!繁中 AI 模型 TAME 正式發表,精準解釋買東西「很盤」定義
*本文訊息、圖片由 iKala 提供。新聞稿 / 產品訊息提供,可寄至:[email protected],經編輯檯審核並評估合宜性後再行刊登。首圖來源:Unsplash



