
【我們為什麼挑選這篇文章】
Google 這個新算法真的太厲害!沒有受過專業攝影訓練的人也沒關係,每一幅經過處理過後的圖,都像專業攝影師拍的一樣,真的可以稱呼 Google 一聲專業 p 圖大師了。
(責任編輯:謝秉芸)
想拍出專業級的照片,又沒有單反、沒學過專業的攝影教學? Google 最新研發的照片處理黑科技將成為你的救星!這項基於深度學習的技術能夠將 Google Street View 的全景照片處理成以假亂真的專業照片,40% 被處理過的高分照片在「圖林測試」中獲得了專業人士的認可。一起來看看!
機器學習在有著明確目標定義的領域有非常強大的應用。在那些黑白分明的任務中,機器學習大有用武之地,比如正確地識別出圖片內容,或是提供一段靠譜的翻譯。然而,在許多缺少客觀衡量標準的領域,機器學習的應用仍然十分有限。比如說,一張照片是否符合審美,這就是一個相當主觀的評判了。
為了探究機器學習帶有主觀性質任務的能力,我們設計了一個實驗性深度學習系統來進行藝術創作。這一系統模擬了專業攝像師的工作流程,以 Google Street View 的全景圖為素材,對它們進行裁剪、處理,創作出符合審美標準的照片,我們的虛擬照相師「前往」了阿爾卑斯山,黃石公園等地,拍攝了 4 萬多張全景照片,許多最後處理過的作品甚至達到了專業水準。
模型訓練
儘管我們可以用 AVA 之類的數據庫來訓練「審美」模型,但不假思索地用這樣的模型來提高照片質量往往是東施效顰,比如說會把照片 p 得過度飽和。另一方面,用監督學習來學習審美的多方面特質則需要一個標記好的數據庫——這樣的數據庫實在是太難收集了。
我們的方法所需的只是一個專業級的照片集,不需要處理前後對比圖,也不需要額外的標籤。我們的模型可以自動把「審美」這一概念分解成多個方面的指標,每一個指標都是通過與「反面例子」的對比得到的,而這些反面例子則是通過某一項圖片處理生成的。通過讓這些圖片處理技術處於「半正交」狀態,我們可以分步在構圖,飽和度/HDR,和燈光效果等方面提升圖片的質量。

一張全景圖(a)被裁剪成了(b),在(c)中進行了飽和度和 HRD 強度處理,而在(d)中進行了燈光效果處理。每一步都是由「審美」的某一維度指導的。
我們用傳統的濾鏡製作出在飽和度、HDR 和構圖上有缺陷的「反面教材」。我們也用到了一個燈光處理的操作。這些「反面教材」是通過對專業照片進行濾鏡的隨機組合得到的。在訓練中,我們使用了 GAN,用一個生成模型來處理「反面教材」,用一個區分模型來辨別處理過的照片和它們的原圖。
結果展示
Google street view 的一些創新點如下。正如你看到的,受機器學習訓練過的美圖濾鏡會有很奇幻的效果(本里的一些插圖已經可見一斑)。



為了判斷我們的算法是多麼的成功,我們設計了一個「圖靈測試」的實驗:我們將我們的創作與其他不同質量的照片混合在一起,並將它們展示給幾位專業攝影師。他們被要求給每張照片的質量分類,定義如下:
1:隨便拍拍,沒考慮構圖和光線等技術。
2:在沒有攝影背景的普通大眾裡算是還不錯的照片。沒有什麼脫穎而出的藝術感。
3:半專業攝影。很好的照片,顯示出清晰的藝術感。攝影師在成為專業人士的正確軌道上。
4:專業攝影。
在下圖中,每條曲線都顯示專業攝影師給某一預測分數範圍內的圖像打出的評分。對於具有高預測分數的創作,它們收到的大約 40% 的評分是「半專業」到「專業」級別。

未來發展方向
Google 的 Street View 全景照片是我們這個項目的測試源。在不久的將來這項技術或許就將幫助你在實際生活中拍出專業級的照片了。我們在這裡收集了更多用這項技術處理過的照片。你可以點開這些照片,並和 Google Street View 的原圖進行對比。如果是你的話,你會這樣處理這些照片嗎?
(本文經合作夥伴大數據文摘授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為〈機器也有品味:谷歌最新算法讓街景圖具有專業攝影師審美〉。)
延伸閱讀
會讀、聽和識別的 AI 還是不夠聰明!Google 和 MIT 要統合這些能力,讓 AI 更像人
【快來看 AI 學走路!】Google AlphaGo 模擬人走路,滾帶跑各種淒慘摔法都摔不死他
【朕說不給,你不能要】Google 重金收購印度機器學習公司,就是要搶光所有數據人才



