谷歌的 AI 實驗室 DeepMind 宣布目前正在開發一款 AI 技術,目標是自動為影片生成配樂和對話。
DeepMind 表示,這項技術可以幫助電影製作人、檔案管理員和其他需要處理視訊內容的人。它還可以為未來生成式人工智慧的應用奠定基礎,例如自動創建電影和電視節目。
透過 「V2A 技術」 ( video-to-audio 的縮寫,「視訊到音訊」), Deepmind 可以使用人工智慧來理解影片內容,再依據這些內容生成配樂和對話。此技術會參考視訊中的畫面、人物和語氣,來創建合適的聲音效果。例如,V2A 技術接收到一段水下游泳的影片後,可能就會生成水聲、海洋生物的聲音和輕鬆愉快的音樂。如果接收到的是一段動作片,可能就會生成爆炸聲、槍聲和緊張的音樂。
DeepMind 表示,以 V2A 技術自動生成配樂和對話,可節省時間和金錢。依據視訊的內容生成合適的聲音效果,也能提高影片的品質。此外,V2A 技術還能為未來生成式人工智慧的應用奠定基礎。不過 DeepMind 也表示,V2A 技術尚處於開發階段,無法為所有類型的影片生成高品質的音訊。若遭不當使用,也可能會促成虛假資訊的流通。因此,DeepMind 在與領先的創作者和電影製作人合作改進 V2A 技術之餘,也會確保在向公眾發布 V2A 技術之前進行嚴格的安全評估和測試。

*本文開放合作夥伴轉載,資料來源:《TechCrunch》,Unsplash。



