
【為什麼我們要挑選這篇文章】科技與技術的應用有好也有壞。以「換臉」聞名的 Deepfake 就曾因為遭到濫用,導致許多女性明星因「假 A 片」受害。
現在這個 AI 算法又誕生了另一項更具爭議的 App,號稱輸入任何女性圖片都能完成「一鍵脫衣」輸出假裸照。雖然這個應用上線沒多久就下架了,但卻餘震猶存,而這些遭到濫用的技術,是怎麼產生的?(責任編輯:藍立晴)
「《科技報橘》徵才中!跟我們一起定位台灣產業創新力 >> 詳細職缺訊息
快將你的履歷自傳寄至 [email protected]」
上週,又一 AI 偏門應用 DeepNude 爆出,一鍵直接「脫掉」女性的衣服,火爆全球。
應用也很容易上手,只需要給它一張照片,即可藉助神經網路技術,自動「脫掉」衣服。原理雖然理解門檻高,但是應用起來卻毫不費力,因為對於使用者來說,無需任何技術知識,一鍵即可獲取。
DeepNude 處理的圖片有明顯人工痕跡
據發布者表示,研發團隊是個很小的團隊,相關技術顯然也還很不成熟,多數照片(尤其是低分辨率照片)經過 DeepNude 處理後,得出的圖片會有人工痕跡;而輸入卡通人物照片,得出的圖片是完全扭曲的,大多數圖片和低分辨率圖片會產生一些視覺偽像。
當然,目標「圖片」還是各種女性,較早曝光這一應用的科技媒體 Motherboard 表示,他們通過幾十張的照片測試,發現如果輸入《體育畫報泳裝特輯》(Sports Illustrated Swimsuit)的照片,得到的裸體照片最為逼真。
這一應用瞬間引發了社區的各類聲討,表示是對 AI 利用的反例。
連吳恩達也出面發聲,聲討這一項目。
該應用在一片討伐聲中很快下線,但是,餘震猶存。
尤其是對這一應用背後技術的探討還一直在持續。
本週,一個名為「研究 DeepNude 使用的圖片生成和圖片修復相關的技術和論文」的 GitHub 升至一周熱榜,獲得了不少星標。
項目創始人顯然對於這一項目背後的技術很有研究,提出了其生成需要的一系列技術框架,以及哪些技術可能有更好的實現效果。文摘菌(本文作者)在此進行轉載,希望各位極客在滿足技術好奇心的同時,也可以正確使用自己手中的技術力量。
以下為原文內容和來源【傳送門】
接下來我會開源一些 image/text/random-to-image 的神經網路模型,僅供學習交流之用,也歡迎分享你的技術解決方案。
Image-to-Image Demo 圖片到圖片demo
DeepNude 軟體主要使用 Image Inpainting for Irregular Holes Using Partial Convolutions 中提出的 Image-to-Image 技術,該技術有很多其它的應用,比如把黑白的簡筆劃轉換成色彩豐富的彩圖,你可以點擊連結在瀏覽器中嘗試 Image-to-Image 技術。
在左側框中按照自己想像畫一個簡筆劃的貓,再點擊 pix2pix 按鈕,就能輸出一個模型生成的貓。
Deep Computer Vision in DeepNude
- 論文 NVIDIA 2018 paper Image Inpainting for Irregular Holes Using Partial Convolutions and Partial Convolution based Padding.
- 代碼 Paper code partialconv。
在 Image_Inpainting(NVIDIA_2018).mp4 影片中左側的操作界面,只需用工具將圖片中不需要的內容簡單塗抹掉,哪怕形狀很不規則,NVIDIA 的模型能夠將圖片「復原」,用非常逼真的畫面填補被塗抹的空白。
可謂是一鍵 P 圖,而且「毫無 PS 痕跡」。該研究來自 Nvidia 的 Guilin Liu 等人的團隊,他們發布了一種可以編輯圖片或重建已損壞圖片的深度學習方法,即使圖片穿了個洞或丟失了像素。這是目前 2018 state-of-the-art 的方法。
Pix2Pix(need for paired train data)
DeepNude 通常使用這種 Pix2Pix 技術。
- 論文 Berkeley 2017 paper Image-to-Image Translation with Conditional Adversarial Networks.
- 主頁 homepage Image-to-Image Translation with Conditional Adversarial Nets
- 代碼 code pix2pix
- Run in Google Colab pix2pix.ipynb
Image-to-Image Translation with Conditional Adversarial Networks 是柏克萊大學研究提出的使用條件對抗網路作為圖片到圖片轉換問題的通用解決方案。
CycleGAN(without the need for paired train data)
- 論文:Berkeley 2017 paper Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks
- 代碼:code CycleGAN
- Run in Google Colab cyclegan.ipynb
CycleGAN 使用循環一致性損失函數來實現訓練,而無需配對數據。換句話說,它可以從一個域轉換到另一個域,而無需在源域和目標域之間進行一對一映射。
這開啟了執行許多有趣任務的可能性,例如照片增強,圖片著色,樣式傳輸等。您只需要源和目標數據集。
未來
可能不需要 Image-to-Image。我們可以使用 GAN 直接從隨機值生成圖片或從文本生成圖片。
Obj-GAN
微軟人工智慧研究院(Microsoft Research AI)開發的新 AI 技術 Obj-GAN 可以理解自然語言描述、繪製草圖、合成圖片,然後根據草圖框架和文字提供的個別單詞細化細節。
換句話說,這個網路可以根據描述日常場景的文字描述生成同樣場景的圖片。
StoryGAN
進階版神筆:只需一句話、一個故事,即可生成畫面
微軟新研究提出新型 GAN——ObjGAN,可根據文字描述生成複雜場景。他們還提出另一個可以畫故事的 GAN—— StoryGAN,輸入一個故事的文本,即可輸出「連環畫」。
當前最優的文本到圖片生成模型可以基於單句描述生成逼真的鳥類圖片。然而,文本到圖片生成器遠遠不止僅對一個句子生成單個圖片。給定一個多句段落,生成一系列圖片,每個圖片對應一個句子,完整地可視化整個故事。
現在用得最多的 Image-to-Image 技術應該就是美顏 App了,所以我們為什麼不開發一個更加智慧的美顏相機呢?
(本文經合作夥伴 大數據文摘 授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈一键“脱”衣应用DeepNude迅速下线,来看看它涉及的图像修复技术〉。)
延伸閱讀
【博弈論解析】為什麼漢堡王總開在麥當勞旁邊?一次了解「霍特林法則」的巨大影響力!
【我們被 AI 騙了】盤點 AI 的作弊紀錄,難道現在人類連「作弊技巧」都輸了嗎?
AI 大神吳恩達最新 TensorFlow 課程來啦,初學者也能快速掌握!



