
【我們為什麼挑選這篇文章】你是否曾用過手機、Line 或其他通訊軟體線上開會或通話?,結果音質既差又頓?最近 Google 推出的 Lyra 在GitHub上開放原始碼了!Lyra 提供編碼與解碼器功能,讓音訊傳遞可以在保有高品質下「瘦身」傳輸! Google 還同時用 Lyra與 Opus、Speex 做實測,比較後發現甚至在 3 kbps 條件下,Lyra 的語音通訊清晰度也很驚人!(責任編輯:孫敬)
本文經 AI 新媒體量子位(公眾號 ID:QbitAI)授權轉載,轉載請連繫出處
作者: 量子位
3 kbps 也能清晰通話的神器 Lyra,開放原始碼了!
Lyra 是 Google 公司推出的一款不懼低頻寬的聲音編碼、解碼器,用來實現隨時隨地高品質通話。
3 kbps 是什麼概念?
換算成生活中常見的單位,等於 0.375 KB/s。
對比來看更加直觀,Skype 官網給出的通話最低速度是 30 kbps,頻寬要求整整高出了 10 倍。

Lyra 利用機器學習模型,將原始聲音壓縮到 3 kbps,即使沒有高速網絡,也能得到自然清晰的語音。
它的架構與傳統的編解碼器類似,分為編碼器和解碼器兩部分:

編碼器以 40 毫秒為單位,從語音中獲得特徵,進行壓縮後通過網路傳輸。
解碼器利用機器學習模型,能使用最少的數據量重建語音,將特徵轉換成完整的聲音波形,以進行播放。
頻寬要求低、效果更好
在 Lyra 之前,聲音編解碼器的位元速率越低,語音的清晰度就越差,而且機械感很重。
傳統的音樂編碼、解碼器使用的是數字訊號處理技術,而 Lyra 則依賴其強大的訊號重建能力。
由於 Lyra 無需逐個處理訊號,因此無需高頻寬,而且在保持低位元錯誤率的同時,還能提供高質量的聲音輸出。

Google 還使用 Lyra 與 Opus、Speex,在6 kbps 和 3 kbps 的情況下,對同一聲音的壓縮品質進行對比測試。

結果顯示:
在 3 kbps 的情況下,Lyra 性能優於現有的其他編碼、解碼器;
在 8 kbps 的情況下,其性能優於 Opus,同時降低了超過 60 % 的頻寬;
甚至,Lyra 在 3 kbps 情況下的語音清晰度,也優於 6 kbps 情況下的 Opus。

Google 認為 Lyra 可能有廣泛的應用前景,比如:降低聲音文件大小,以存儲大量語音;節省手機電量;以及緩解網路擁堵等。
已在 GitHub 開放原始碼
現在,Lyra 已經在 GitHub 上開放原始碼。

Lyra 使用 Bazel 建構框架,並且使用 C++ 編寫代碼,以保證速度、效率和可操作性。
這一版本支援用戶在 Linux 上開發和測試,還針對 64 位 ARM Android 平台進行了性能優化,使它不僅能在雲端服務器上運行,而且還可以在手機上實際運行和訓練。
此外,Lyra 還為開發人員提供了編碼和解碼所需的工具。
Google 工程師 Andrew Storus 和 Michael Chinen 表示:「很高興看到開放原始碼社區的創造力能體現在 Lyra 上,以開發更多獨特、有影響力的應用。」
(本文經 AI 新媒體量子位 授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈只需 3 kbps 就能清晰通話,這個谷歌音頻工具開源了! 〉;首圖來源:Unsplash。)
更多實用工具推薦
上班族自學 Python、機器學習寶典!Kaggle 全新免費課程教你快速入門,且馬上能應用



