從熱門的虛擬助理到語音合成工具,語音技術在過去一年取得進展,不只 OpenAI 的 ChatGPT、微軟的 Copilot、Google 的 Gemini 陸續搭載語音模式,尋找 AI 下一機會點的投資者也將大量資金投入 AI 新創公司。語音正在迅速成為新的 AI 戰場。
根據 PitchBook,開發語音 AI 技術的新創在 2024 年籌集超過 3.98 億美元的創投資金。近日,運用 AI 軟體複製聲音的新創 ElevenLabs ,更宣布新一輪融資籌到 1.8 億美元,估值來到 33 億美元──這一數字是其一年前的 3 倍。
雖然 AI 語音不是新技術,但工具變得更複雜、用途更廣泛──從即時音訊轉錄,到文字提示生成合成聲音。調研機構 Gartner 預測,到 2027 年,40% 生成式 AI 解決方案將是多模態的,結合文字、圖像和音訊功能,這代表像 AI 語音技術如高品質音訊生成,將扮演關鍵角色。
AI 語音的浪潮正慢慢襲來。風險投資公司 Balderton 投資者 Sivesh Sukumar 表示,即時語音處理領域的最新突破,開闢了新的使用案例,例如虛擬助理、客服支援,和語音驅動的生產力工具。他表示,ElevenLabs 和 OpenAI 等公司正走在 AI 語音前沿,而 ElevenLabs 的即時轉錄 API 技術,實現人與 AI 之間極低延遲的互動,更有望推動更多採用。
不斷擴大的 AI 語音生態系
語音 AI 仍屬新興領域,目前尚無成熟巨頭,而新創公司正積極探索如何為企業與消費者量身打造語音技術。其中,熱門話題「AI 代理」和語音技術的交集,成為商機之一。
PlayAI 是一家開發文字轉語音模型、AI 語音代理平台的 AI 新創,去年 11 月募集了 2,100 萬美元的種子輪資金。其聯合創始人 Hammad Syed 觀察,語音 AI 正在成為主流,並將成為人們和技術互動的關鍵介面──人們可以和語音代理交談,就像跟另一人一樣。
同樣看中語音 AI 的創投 Kindred Ventures 創辦人 Steve Jang 表示,創投正在尋找 AI 的下一件大事,而他們將語音 AI 視為一個技術堆疊。從其觀點來看,吸引他們的新創首先有專門和基礎的模型;第二,有基礎設施服務和工具,能提供 AI 模型的存取和整合;第三,最重要的是有開闊的垂直應用空間。從第三點來看,不難想像語音 AI 技術為何獲得市場青睞。
除了垂直應用潛力大,AI 語音吸引市場的另一原因在於,語音是容易賺錢的類別。風險投資公司 Headline 普通合夥人 Jonathan Userovici 表示,「你可以根據結果來定價,因此它很容易營利,」提供非常多的收入來源,更容易獲得投資回報。
除了技術突破、具有「錢」景,消費者的媒體接收習慣轉變也是關鍵。《Business Insider 》報導,越來越多消費者喜歡透過音訊接收資訊。語音 AI 平台 PersuAIsion 讓用戶練習各種真實世界對話,例如求職、初次約會,其創辦人 Sukumar 就觀察到,消費者對於語音控制和聲音介面的需求持續成長。
Sukumar 表示,如果 OpenAI 能夠抓住消費者語音代理的商機,就會有機會成為下一個 Siri;未來,語音 AI 的發展也將更著重與個人裝置的互動,甚至推動更好的電子商務體驗。
市場尚未出現主導市場的 AI 助理
外媒觀察,儘管語音 AI 越來越受歡迎,但還未形成一股強大的力量。根據 Air Street Capital 對於 2024 年 AI 現況分析,部分原因在於先進實驗室很少觸碰這領域,可能是擔心語音生成功能的濫用風險,例如深度偽造,或未經授權的語音複製技術。
科技巨頭雖然順應語音 AI 的發展趨勢,但也步步為營。市場研究公司《eMarketer》分析,儘管語音助理是消費者最重要的裝置 AI 功能之一,但尚未有大型科技公司推出主導市場的 AI 助理──亞馬遜優化 Alexa 的 AI 計畫已延至 2025 年;蘋果雖然為 Siri 增加 ChatGPT 功能,但其他生成式 AI 功能進展緩慢抵銷了消費者的興奮感;Google 雖然將 Nano 設定為 Pixel 手機的預設 AI,但可能會勸退注重隱私的用戶。
究竟誰會在語音 AI 中勝出,仍是未知數。但是 Air Street Capital 創辦人兼合夥人 Nathan Benaich 表示,取代像 ElevenLabs 這樣的新創可能會很有挑戰性,因為這些公司已經被廣泛採用,並且多年來一直在為企業用戶優化他們的工具。
【推薦閱讀】
◆ OpenAI 再推 AI 代理「Deep Research」!有何特色、適合誰使用?
*本文開放合作夥伴轉載,資料來源:《Business Insider》、《Bloomberg》、《VentureBeat》、《eMarketer》,首圖來源:OpenAI。



