Google 開發 AI 文字浮水印技術
Google 近日推出 SynthID Text,這項技術能夠為 AI 生成的文本添加浮水印,以便識別這些內容的來源,偵測文字是否為 AI 生成。
SynthID Text 的運作原理
當 AI 模型生成文本時,會根據一定的機率選擇下一個字詞。SynthID Text 就是在這個過程中插入一些特殊的標記,這些標記不會影響文本的語義,但卻可以作為一個隱藏的「浮水印」。當我們想要檢測一段文本是否由AI生成時,就可以通過分析這些標記來判斷。
Google 也表示,SynthID Text 自今年春天以來一直與其 Gemini 模型集成,不會影響文字生成的品質、準確性或速度,甚至可以處理經過裁剪、解釋或修改的文字。
SynthID Text 的優勢與限制
SynthID Text 的優點是能夠有效標記 AI 生成的文本,這些文字即使經過 AI 修改或翻譯,也能夠識別。而且,浮水印的存在不會影響文本的品質和可讀性。不過,SynthID Text 在處理短文本、翻譯文本或回答事實性問題時效果可能不佳。此外,如果 AI 模型本身經過特殊優化,可能還是有辦法繞過這種水印技術。
同業趨勢與未來展望
現在錯假資訊猖獗,其中許多以假亂真的資訊便是由 AI 生成。據歐盟執法機構的報告,到了 2026 年,可能就有高達 90% 的線上內容是合成的。而根據 AWS 的一項研究,由於人工智慧翻譯器的廣泛使用,網路上可能多達 60% 的句子都是人工智慧生成的。不過浮水印技術的推出,有望扭轉錯假資訊和相關詐欺橫行的亂象。
除了 Google 之外,OpenAI 其實也一直在積極研究類似的技術,只是出於技術和商業考量推遲了發布。事實上,未來可能很快就會有法律機制迫使開發商採取行動,在產品和服務中加入類似的工具和功能。例如:中國政府已對人工智慧生成的內容強制添加浮水印,加州也希望採取同樣手段。
SynthID Text 可從 AI 平台 Hugging Face 和 Google 更新的 Responsible GenAI Toolkit 下載。公司也表示,正在進行 SynthID Text 浮水印工具的開源計畫。
*本文開放合作夥伴轉載,資料來源:《TechCrunch》,首圖來源:<a href="http://Photo by <a href="https://unsplash.com/@pawel_czerwinski?utm_content=creditCopyText&utm_medium=referral&utm_source=unsplash">Pawel Czerwinski</a> on <a href="https://unsplash.com/photos/google-sign-fpZZEV0uQwA?utm_content=creditCopyText&utm_medium=referral&utm_source=unsplash">UnsplashUnsplash。



