有兴趣的读者可以试试用谷歌的这个AI去打消微软的AI打出来的马赛克,不过在进行这个“以子之矛,攻彼之盾”的游戏前,不妨先看看谷歌的这个解码AI到底“超强”在哪里。

谷歌上载在预印本网站arXiv上的论文详细先容了这个算法的事理和效果。
不才图中,右列是名人照片未经模糊化的原图,左列是被打码后的照片,分辨率仅有8x8像素。
而中间是谷歌的AI解码处理后的效果,分辨率达到32x32像素,提升了16倍。

左起:马赛克版、谷歌AI还原版、原图

常日情形下,马赛克是难以打消的。
这是由于在打码过程中,原图的信息会经历不可逆的丢失。
根据奈奎斯特采样定理,如果这个采样频率比原始数据的频率的 2 倍还要低,那么一定产生不可逆的数据丢失。

谷歌宣告超强马赛克清除技能靠AI的脑补来还原图像

以往最常见的马赛克去除方法是插值。
我们可以把每一个像素想象成一个特定颜色的小格子,这些特定的颜色可以用特定的数值代表。
一张图片便是由无数这样的小格子组成的。
而最常见的马赛克手段,便是把那个区域的数字都取周围数字的均匀数。

而所谓的插值,便是把这块被取并均值的区域再进行放大,比如放大200%的话,原来被打码区域里的一个小格子就会被2x2四个格子取代,剩下的任务便是再重新添补这4个格子的颜色。
我们可以通过取周围多少个格子颜色的加权均匀值来添补每个格子,取的周围格子数越多,还原效果也就越好。
当然,这种解码手段末了呈现的效果并不能令人满意。

2016年,得克萨斯大学的一个团队推出了一个名为Torch的反马赛克,不过Torch的事理是识别而非复原。
也便是说,Torch可以匹配出被打马赛克图片符合或者相似的原图。

谷歌大脑的这个算法思路与Torch一脉相承,只是技能上更进一步。
开拓者们通过深度学习让机器产生“遐想”,以“预测”的办法为被马赛克的色块增加细节,提升像素倍数,从而得出更清晰的画面。
比起“还原”,还不如说这是AI靠强大的学习和打算能力“脑补”出了原图。

这种“脑补”基于两项核心工具。
第一项工具调节网络(conditioning network),是一个CNN(卷积神经网络),通过向系统展示海量人物面部照片来进行演习,让系统影象学习到具有代表性的面部特色。
另一项工具优先网络(prior network)是一个PixelCNN,让系统基于之前的演习,预测哪些细节可以作为高分辨率照片的特色,并根据概率优先原则,从所有可能的原图中找到最有可能匹配的细节,对高分辨率照片进行添补。

演习机器还原寝室照片所用的样本示例

目前,该系统“还原”出的人脸照片的稠浊率是10%。
在“还原”场景图片方面,该系统的表现可能会更好一些,其稠浊率可以达到28%。
50%的稠浊率意味着完备复原,可以以假乱真。

“还原”人脸稠浊率为10%,“还原”场景稠浊率为28%。

从运用角度来看,该系统最大的打破在于能够让8x8像素的模糊图片变得清晰一些,只管离通过识别面部验证职员身份还有一段间隔,但对付通过“还原“分辨图片中工具的位置、确定事物大概面貌以及确认某人是否在现场来说已经足够了,这将为犯罪刑侦带来更大的帮助。

而Google近水楼台先得月,可能会将该技能率先运用在自家SNS社交网站“Google+”的图片上传上,即在用户上传照片时将其低像素压缩,识别出图片中的关键信息,然后再启动这项AI技能,将图片提高分辨率进行“还原”。
这种办法可以帮助用户节省流量。