NVIDIA 近期被指控在訓練 AI 時,未經授權使用了大量受版權保護的內容。據 404 Media 報導,這家市值達兩兆四千億美元的公司要求員工從 YouTube、Netflix 以及其他資料集下載影片,用於訓練 NVIDIA 的商業 AI 模型,包括 Omniverse 3D 世界生成器、自動駕駛車系統和數位人類技術。
NVIDIA 辯稱合法,YouTube 明確反對
NVIDIA 回應表示,公司行為完全符合版權法的規定和精神。NVIDIA 發言人強調,知識產權法保護的是具體的表達形式,而非事實、概念、數據或訊息。因此,NVIDIA 認為此行為相當於個人學習和使用來自其他來源的知識以創作自己的作品。然而,YouTube 並不認同這個觀點,指出使用 YouTube 內容來訓練 AI 模型「明顯違反」平台的條款。這一立場最初是在今年 4 月OpenAI 被指控未經許可使用 YouTube 影片訓練其 Sora 文字生成影片模型時提出的,Runway AI 最近也遭受到類似的指控。
內部爭議與高層決策
NVIDIA內部的一些員工認為公司行為可能有倫理和法律方面的爭議,但管理階層選擇忽視他們的擔憂。NVIDIA研究副總裁Ming-Yu Liu回應稱,「這是高層的決定」,並表示公司已獲得「全面批准」可使用這些資料。然而,這一做法在公司內部仍然被視為「未解決的法律問題」,計劃在以後處理。
利用資料集訓練 AI,規避檢測手段
除了從 YouTube 和 Netflix 下載內容外,NVIDIA 還要求員工使用電影預告片資料集 MovieNet、內部的遊戲影片庫和 GitHub 上的資料集(如 WebVid 和 InternVid-10M)進行訓練。其中一些資料集僅限於學術用途,如 HD-VG-130M,其包含了 1.3 億個YouTube影片,但NVIDIA 無視這些限制,堅持認為這些資料集可用於商業 AI 產品。
為了避開 YouTube 的檢測,NVIDIA 使用虛擬機(VMs)和輪換 IP 地址等技術來下載內容。一名 NVIDIA 員工建議使用第三方 IP 地址輪換工具,但另一名員工回應說,通過 Amazon Web Services(AWS)重啟虛擬機實例即可獲得新的公共IP地址,因此目前沒有問題。
NVIDIA 這些行為與科技行業中常見的「快速行動,打破常規」的態度相似,這種態度曾導致Facebook(現Meta)在隱私問題面臨重大麻煩。
*本文開放合作夥伴轉載,資料來源:《ENGADGET》首圖來源:《Unsplash》
立即報名 8/27【Google Cloud 核心基礎架構】線上課程




