最近涌现的换脸视频可以说是人脸交流技能的一个打破,人工智能把A的面部关键信息记录下来,如下图所展现出的嘴巴、鼻子、眼睛等信息,并且将这种信息反复重修和自我改进,终极可以完备自主地天生一张A的脸,并仿照它的大部分表情。下一步,当然就很大略,只要把这张脸再贴到任意一个视频中的B的身体上,“换脸”就完成了。这个技能的核心在于可以复制一张脸。
将表情从五官拿下来
AI换脸的实质是把人的五官形象和表情分开。表情是五官在不同感情下的形象,更多也是指五官的“动作”。一个人的五官和表情总是一体的、难以分割。然而AI换脸技能的涌现,正在见告我们五官形象和表情是可以分离的。
AI换脸的过程为:人工智能预先剖析好视频里面的五官的形状和位置;你供应照片后,人工智能再剖析照片中的五官形状和位置;然后再把照片中五官的形状和位置,与视频比拟着进行合并。人脸互换一样平常可以用于视频合成、供应隐私做事、肖像改换或者其他有创新性的运用。
最早的人脸互换是通过特色点匹配来提取一张脸中例如眉毛、眼睛等特色信息然后匹配到另一张人脸上。如今,只要有足够多的图像数据,AI就能让一个编码器把一个人脸压缩成一个代码和两个解码器,一个解码器可以还原原始人脸,另一个可以天生新的人脸,下图展示了一位女性换脸前后的比拟图,旁边两个人的姿势完备同等,只是脸部特色发生了变革,如果只看右图,我们很丢脸出这是天生的假图。
无学习 不AI
谷歌的AlphaGo由于学习了大量专业棋手棋谱,然后又从自我对弈中持续学习和提高,因此降服了人类天下冠军。微软小冰由于学习了大量互联网上的盛行语,才能用既时尚、又活泼的谈天办法与用户互换。这些被宣扬为人工智能的范例运用大多都拥有深度学习的技能根本,这彷佛也符合人类认知的特点——人的聪慧离不开终年夜成人过程里的不间断学习。
当然,机器目前的主流学习方法和人类的学习办法还存在很大的差别。比如,目前的打算机视觉系统在看过成千上万张自行车的照片后,很随意马虎辨别出什么是自行车,什么不是自行车,这种须要大量演习照片的学习办法只管看上去还比较笨拙,但反不雅观人类,给一个三四岁的小孩子看一辆自行车之后,再见到哪怕外不雅观完备不同的自行车,小孩子也十有八九能做出那是一辆自行车的判断。也便是说,人类的学习过程每每不须要大规模的演习数据。
文章摘选自《知识便是力量》