Search
Close this search box.

自認比 OpenAI 強!ElevenLabs 提供對話式 AI 開發能力

打造對話式 AI 的完整管道

ElevenLabs 是一家提供人工智慧語音複製及文字轉語音 API 的新創公司,近日推出了建構對話式 AI 機器人的功能。公司指出,整合知識庫及處理客戶中斷是打造對話式 AI 的兩大難點,這也是他們決定構建完整管道的原因。用戶可透過該公司的開發者平台,從選擇範本或建立新項目開始,設定客服角色的主要語言、第一則訊息及系統提示,並可自訂語音語調、回應長度及對話的創意程度(回應溫度)。此外,用戶能加入自有的知識庫(如文件或文字區塊),甚至整合自訂的大型語言模型(LLM)。平台支援多種開發工具,包括 Python、JavaScript 和 Swift,並提供 WebSocket API,以便用戶進行更進階的自訂。

潛在競爭對手與未來計劃

目前,ElevenLabs 雖然尚未將語音轉文字 API 作為獨立產品提供,但未來有望將以這種形式推出,並進一步擴展市占率,成為 Google、微軟及亞馬遜等語音轉文字 API 提供商的潛在競爭對手。該公司還將與 AssemblyAI、Deepgram 和 OpenAI 的 Whisper 等專業語音處理服務相競爭。ElevenLabs 正利用其既有的文字轉語音技術管道開發語音轉文字能力,以增強其對話式 AI 產品的完整性和市場吸引力。

與 OpenAI 的競爭優勢

ElevenLabs 認為他們客製化能力高,切換大型語言模型相當靈活,兩者都是相較於 OpenAI 即時對話 API 的主要優勢。ElevenLabs 允許開發者調整多種變量,如語音穩定性、身份驗證標準和對話長度,並支援整合多樣化的知識來源,讓用戶能創建更符合特定需求的對話代理,有望在對話式 AI 領域市場中佔據一席之地。

*本文開放合作夥伴轉載,資料來源:《TechCrunch》,首圖來源:ElevenLabs