Search
Close this search box.

美中 AI 影片生成戰升溫:字節、快手如何將短影音平台優勢,轉化為內容商業化利器?

中國生成式 AI 產業被認為已跨過商業化關鍵門檻,開始對矽谷造成壓力。《Crypto Briefing》報導,相較於美國企業仍多停留在展示影片、候補名單或測試階段,中國 AI 公司已將影片生成工具推進至實際商業運作,建立在超過 5 億用戶日常使用的產品生態之上,創造數億美元年營收。

從多個開發者與使用者評比來看,儘管 OpenAI、Google 與 Anthropic 在大型語言模型與程式碼生成領域仍具主導地位,但在影片生成工具方面,其產品在品質與易用性上已落後於中國競爭者。不過,《Financial Times》補充,Google 的 Veo 3 仍具競爭力,只是在開發者使用上受到更多安全與內容限制。

中國影片生成領域加速商用,美國工具受限於內容審查

中國 AI 產業總產值已突破 5,000 億人民幣,這一數字已不再單純由投機資金推動,而是建立在實際應用之上。字節跳動推出 Seedance 2.0,為首個可生成電影級 1080p 影片、並支援四模態輸入的模型,能同時接收文字、圖片、音訊與影片作為提示,生成高品質影像內容。該模型在測試中已超越多個競爭對手,並已實際部署於 TikTok 與抖音生態系中,服務龐大的內容創作與消費場景。

《Financial Times》提及,中國公司在使用受版權保護素材方面更為積極。AI 生成內容創業公司 Director AI 創辦人 Ben Chiang 表示,他們測試過的多數美國模型,在影片生成方面表現並不理想。他認為,美國較嚴格的內容審查限制了工具能力,常導致輸出效果不夠寫實。

Director AI 主要使用快手開發的 Kling 模型,同時也會根據任務與成本,在字節跳動的 Seedance 2.0 與新創公司 MiniMax 的海螺模型之間切換使用。Ben Chiang 表示:「關鍵在於品質,以及模型對提示詞的理解與執行能力。」他補充,近期技術的進步讓工具更容易使用,特別是在音訊同步與語音穩定性方面的提升。

隨著技術持續進步,創作者的製作流程也發生變化。獨立 AI 電影製作人與剪輯師 George Won 表示 Seedance 2.0 大幅改變了他的創作方式。他說:「它能處理較大幅度的鏡頭角度變化與快速運動,同時仍能保留角色的臉部細節與光影對比。相較之下,多數 AI 模型在高速運動場景中容易出現畫面不穩或漂移的現象。」

這類內容生成能力也引發外界對版權的關注。字節跳動曾因允許使用者在未取得授權的情況下,生成包含電影漫威及動畫南方四賤客內的角色影片,而面臨涉嫌侵權的法律威脅。字節跳動表示,將加強相關保護措施。多位開發者與創作者指出,相較之下,中國模型在內容限制上較為寬鬆,因此實際使用起來更為便利。Ben Chiang 表示,美國工具經常在生成過程中直接拒絕請求,僅提示違反使用條款,但不會提供進一步說明。

5.15 億生成式 AI 用戶成長中,中國短影音平台握資料數據優勢

《Financial Times》指出,這場競爭之所以值得企業關注,不僅在於生成影像的逼真度提升,更在於影片生成正在重塑廣告與電商內容的生產成本。Firework 執行長 Vincent Yang 表示,已有零售商要求為產品頁生成多達 10 萬支影片,使每個商品都能擁有專屬內容,針對不同客群產出多版本素材。

在此基礎上,中國平台的優勢來自更完整的生態系整合。像字節跳動與快手這類公司,並非僅停留在模型訓練,而是直接嵌入社群媒體與電商場景,形成難以複製的商業循環。《Crypto Briefing》提及,中國已有超過 5.15 億人使用生成式 AI 工具,使相關企業能持續累積數據與應用回饋,進一步放大規模優勢。

而在技術層面,智譜 AI 的 GLM-5 擁有 7440 億參數,除了模型規模之外,更關鍵的是其被視為中國 AI 產業邁向 GPU 自主化的重要進展。在美國對 NVIDIA 高階晶片出口限制的背景下,中國 AI 實驗室被迫提升運算效率,並發展不同的技術路線。隨著美中在晶片供應與 AI 監管上的對立升高,「去中心化算力」等討論也逐漸浮現。在硬體受限的環境下,中國企業持續推進技術與基礎設施替代方案,使外界更加關注未來算力架構的可能變化。

*本文開放合作夥伴轉載,資料來源:《Crypto Briefing》《Financial Times》,圖片來源:Unsplash