長問科技深耕 AI 語音領域,致力提供在地化語音技術,支援台語、客語等多方言辨識與應用。為滿足語音 AI 辨識服務對於 GPU 算力的需求,長問科技選用兩台麗臺科技的 WinFast GS4850T 伺服器再各搭配 8 張 NVIDIA RTX PRO™ 6000 Blackwell Max-Q Workstation Edition GPU,不僅獲得穩定且高效的算力支援、加速模型迭代速度,更實現語音辨識正確率達 90%。目前,長問科技協助金融業成功打造安全、高效的金融語音解決方案,促進無障礙互動體驗,也協助公部門客戶打造智能市民熱線,更快速回應市民諮詢。
長問科技總經理陳又碩表示,隨著語音 AI 辨識服務的應用範疇擴大,長問科技對於 GPU 算力設備產生新需求。在推論(Inference)部分,長問科技透過演算法降低算力成本,讓客戶能以較少的算力達到最佳效果,降低 AI 導入的門檻;在訓練(Training)部分,則是持續增加算力採購,因為長問科技除了訓練國語、台語、英語、客語的基礎模型(Foundation Model),還助力客戶訓練企業內部的語音辨識模型,降低 AI 幻覺問題,「所以我們採購兩台麗臺科技提供的 WinFast GS4850T 伺服器,搭配各 8 張 NVIDIA RTX PRO 6000 Blackwell Max-Q Workstation Edition GPU,透過這樣的算力訓練一個原生且支援台灣在地語音的國、台、英、客語基礎模型,從模型訓練再到部署至客戶端,僅僅需要一個月的時間。」
陳又碩進一步說明,長問科技運用麗臺科技與 NVIDIA 解決方案訓練一個名為「TB2」的模型,並在效能上取得顯著突破,「一張 RTX PRO 6000 Blackwell Max-Q 可以支援 60 線的通話,並在一秒內回應,讓客戶能以一張 GPU 補足六張 GPU 的應用,大幅降低導入成本。同時,RTX PRO 6000 Max-Q 提供更快速的反應力,過去模型將語音轉成文字需花費 7 秒,由 NVIDIA 算力支持的模型可以實現講話一秒內,便開始出現文字,讓使用者即時接收語音辨識結果。」
NVIDIA RTX PRO 6000 Blackwell Max-Q Workstation Edition 採用 NVIDIA Blackwell 架構,整合第五代 Tensor 核心,並加入 FP4 精確度和 DLSS 4 多畫格生成技術支援,加速本地大型語言模型、全新 AI 模型原型設計。同時,NVIDIA RTX PRO 6000 Blackwell Max-Q Workstation Edition 配備 96 GB GDDR7 記憶體,讓應用程式執行速度更快,可處理更大、更複雜的資料集。憑藉 AI 效能達 3511 TOPS、RT 核心效能達 333 TFLOPS、單精度效能達 110 TFLOPS 這些領先業界的應用規格,NVIDIA RTX PRO 6000 Blackwell Max-Q Workstation Edition 也助力企業開創 AI、資料科學和繪圖處理的新潛能。

「地端導入」模式確保企業的核心數據資料不外流

陳又碩強調,不同於需要將數據、資料回傳雲端的語音方案,長問科技協助客戶將在地化 AI 語音技術導入企業領域(Domain),建立專屬的企業語音辨識系統,這種地端導入模式,可以確保企業的核心數據資料不外流,並解決金融與公部門最關心的資安疑慮。
聚焦實際案例,已有金融業者運用長問科技的語音 AI 系統,設置專屬外撥機器人,當判斷用戶具有意願、意圖呈現正向,再轉接至真人客服進一步說明,為企業過濾前面 95% 以上的無效電話,提升行銷精準度與案件成功率。同時,長問科技幫助台灣通訊業者的客服中心導入語音 AI 辨識解決方案,支援核身、產品導覽、外撥等場景;也助力公部門運用 AI 語音技術,依照民眾通話的關鍵字貼標籤、分級,大幅增強工作效率,並支援 1999 熱線以及音檔轉文字與全資料庫快速搜尋,能夠協助客服中心全天候回應需求。
以 3 大核心技術架構支援語音 AI 辨識系統
陳又碩分享,長問科技的技術架構是以華語、台語、客語、英語為核心,整合客戶專有詞彙,訓練出高精準客製化語音模型,提供客戶語音 AI 系統,「針對大型客服中心,長問提供MRCPv2 語音資源控制協定,可以結合通訊系統和語音辨識、語音合成、LLM;對於採用中小型交換機、客服中心方案的業者,也可以協助透過 RESTful API 整合,快速導入語音辨識及語音合成功能,實現客服與通訊系統的智能化;針對語音質檢的應用,則提供批次處理類似網路磁碟機的架構,協助客戶以最簡單的方式處理語音資料。」
「語音這件事情會變得越來越重要,並且徹底改變我們與機器互動的形式,」陳又碩觀察,生成式 AI 蓬勃發展,正在為在地化語音的應用帶來加乘效果,趨於成熟和普及的 AI Agent 技術,也將會輔助人類透過語音或是更直覺的方式處理工作任務。
展望下一階段發展,陳又碩認為在 AI 語音領域,機器人應用逐漸開始起步,並且朝口語化的溝通方式發展。這時,若想讓 AI Agent 在企業環境中發揮作用,關鍵第一步就是讓大型語言模型理解使用者所講的內容,特別是企業專用的術語,而透過長問科技在地化基礎模型,將能夠加速企業 AI Agent 的落地,陳又碩表示,「針對資安面向,我們則採用嚴格防護標準 TLS 確保客戶數據安全,同時將 AI 幻覺降至最低,目標為企業打造一個穩健、智能的語音應用平台。」



