加拿大影院公司 IMAX 宣布與杜拜新創公司 Camb.ai 合作,利用 AI 語音模型翻譯其原創內容,包括紀錄片,以拓展全球市場。
影音內容消費持續成長,非英語內容需求攀升
根據普華永道(PwC)的報告,2023 年娛樂和媒體產業的規模成長了 5%,達到 2.8 兆美元。預計未來五年,該產業將持續擴張,複合年均增長率將近 4%,達到 3.4 兆美元。
即使在英語系市場,例如美國、英國、澳洲和加拿大,非英語內容的需求也正在快速成長。Netflix 去年就曾表示,過去三年,其在英國的非英語內容觀看次數成長了 90%。
Camb.ai 提供 AI 配音和語音翻譯服務,支援 140 種語言
Camb.ai 的 AI 配音和語音翻譯服務,已被應用於澳洲網球公開賽、歐洲歌唱大賽和美國職業足球大聯盟等體育賽事。該公司提供 Boli 模型進行語音轉文字翻譯,並使用 Mars 模型進行語音模擬。這些模型可透過 Camb.ai 的 DubStudio 平台使用,該平台支援 140 種語言,包括網路上數據量較少的低資源語言。
Camb.ai 共同創辦人兼技術長 Akshat Prakash 表示:「像 OpenAI 和 Anthropic 這樣的公司,對社會有不同的願景。他們試圖建立非常水平的模型,可以涵蓋廣泛的任務。……我們根本不必這樣做。我們的某些模型不到 1 億個參數,而且超級專精。」
Prakash 曾是蘋果(Apple)的工程師,參與開發 Siri 的 AI 和機器學習模型。他去年與父親 Avneesh Prakash 共同創立了 Camb.ai。
Camb.ai 採用三層架構,提供 AI 翻譯服務
Camb.ai 採用「三層」架構提供 AI 翻譯服務,包含 Boli 和 Mars 模型的基礎層、託管這些 AI 模型的基礎設施層,以及前端的 DubStudio 平台。
與其他 AI 模型不同的是,Camb.ai 的 Boli 模型會接收輸入的語音單位,產生翻譯後的文字,並保留語氣上的細微差別。Prakash 表示,Boli 生成文字後,Mars 會使用相同的音訊輸入訊號,將文字轉換成語音,以捕捉原始音訊的表現,包括環境音,例如在體育賽事中,觀眾歡呼的背景音。
Prakash 表示,Camb.ai 的技術可以同步進行多達 10 種語言的語音翻譯,延遲時間為 20 到 30 秒,串流和轉播的延遲時間為 30 到 40 秒,足以涵蓋翻譯的延遲。
IMAX 將分階段推出 AI 翻譯,降低翻譯成本
IMAX 將分階段推出 AI 翻譯,從高資源語言開始。在內部測試 Camb.ai 的技術後,IMAX 決定將其應用於原創內容。
IMAX 全球總裁 Mark Welton 表示:「雖然我們的合作才剛起步,但我們將繼續合作,以更好地探索其潛力,以及如何最好地幫助我們前進。」
Welton 指出,AI 翻譯的部署,將有助於節省翻譯成本,但並未透露具體數字。
Camb.ai 完成種子輪募資,持續擴大團隊
Camb.ai 目前擁有 50 名員工。今年 2 月,該公司在由 Courtside Ventures 領投的種子輪募資中,獲得了 400 萬美元的資金。Prakash 表示,該公司即將完成更大規模的 pre-A 輪募資,以擴大業務範圍和團隊規模。
*本文開放合作夥伴轉載,資料來源:《TechCrunch》首圖來源:Unsplash。



