量子位 宣布 | 公众年夜众号 QbitAI
看着这样一张抽象的人脸素描,你能猜出真人长什么样吗?
现在,有一只GAN,不仅能够完美打破次元壁,复现真实人脸:
△左:素描;右:CSAGAN天生
乃至不画嘴,也不会天生无嘴怪人。效果真实,画面高清,连脸上的皱纹,都刻画得清清楚楚。
比较之下,Pix2pix这样的著名选手黯然失落色。困难模式下切实其实AV画质。
制造如此神奇邪术的GAN,名叫CSAGAN,即有条件的自把稳力机制天生对抗网络(conditional self-attention generative adversarial network)。出身于中科大类脑智能技能及运用国家工程实验室。
世上的GAN万万万,CSAGAN为什么这么秀?
两大窍门CSAGAN的独特之处,是在保持面部构造不确实的同时,天生高质量的人脸图像。
首先立功的,是条件自把稳力模块(CSAM)。
在模型框架中,研究职员采取了掩码残差单元(MRU),并在末了一个MRU之前加入了条件自把稳力模块。
条件自把稳力机制能够建模人脸不同区域之间的长期依赖关系,也便是说,纵然素描图里没画清楚鼻子嘴巴,CSAGAN一样能天生五官完好的一张脸。
MRU和条件自把稳力模块的输入是处理过的黑白线条图。
△稀疏线条图的密集间隔场表示
给定来自上一层的线条图和特色图,条件自把稳力模块会以自把稳力机制打算输出新的特色图。
而另一个窍门,是多尺度鉴别器。它能担保天生的人脸具有更加完全的构造和真实的纹理。
鉴别器由不同深度的子网组成,深度不同,末了一层吸收域的大小自然也不一样。最深子网络末了一层中的吸收域和捕获全局构造的全体图像大小同等。这些子网在前几层彼此共享权重。
这样,大尺度鉴别器会把稳面部整体构造的完全性,而小尺度鉴别器则专注于细节,增强天生面部图像的真实感。
△末了一排是真实照片
中科大团队这篇论文的第一作者,是来自中国科学技能大学类脑智能技能及运用国家工程实验室的Yuhang Li。
论文的通讯作者,是该实验室的陈雪锦副教授。陈老师专注于打算机图形学、打算机视觉研究,在中科大读博期间,师从沈向洋教授,2010年从耶鲁大学打算机系博士后出站。
论文的其余两位作者,是中科大信息科学技能学院实行院长吴枫教授和该实验室副主任查正军教授。
传送门
论文地址:
https://arxiv.org/abs/1910.08914
— 完 —
诚挚招聘
量子位正在招募编辑/,事情地点在北京中关村落。期待有才华、有激情亲切的同学加入我们!
干系细节,请在量子位"大众年夜众号(QbitAI)对话界面,回答“招聘”两个字。
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技能和产品新动态