量子位 宣布 | 公众年夜众号 QbitAI
从茫茫的一片白,到细细勾勒出建筑的轮廓。
雕梁画栋悄悄的构建,飞檐区分出天和地。
正前方道路悄悄显现,雪地由模糊变得清晰,道路通向的,则是庄严的大殿。
统统都像梦里一样平常,宫殿犹如电影镜头那样显现,刚开始模糊抽象,定睛一看却是实景,绘画风格十分独特。
这个AI名叫LearningToPaint,作者是北大信息科学技能学院大三学生黄哲威(hzwer)。
同样的效果,还可以涌如今照片上:
“复现”名家油画也可以:
从大面积的花瓶、花朵,到勾勒细节的花瓣,梵高的作品就这样演绎出来。
印象派的也ok:
光影粗略勾勒,描述出一个高度马赛克状态的日出,之后补充细节,水面、云霞、船上的桅杆依次涌现。
这个AI的思路非常写意派,就像“画马”一样,粗略勾勒出马的形态,之后便能迅速的补充每个细节,画面形象也因此在屏幕上活过来了。
写意派绘画AI的出身
不仅这个AI会画画,它的作者也会画画。黄哲威的灵感,正是来自于学习绘画的经历。
小时候学素描的时候,他以为素描老师便是画技高超的大佬,无论是描述静物还是人物画像,老师都能画得惟妙惟肖。
然而,纯挚画得像并不虞味着画得好。
后来,当他看到毕加索、丢勒等画家的作品时才创造,绘画大师们根本无需刻意“画得像”,而是只用寥寥数笔,就能勾勒出景物的实质,描述出生动的形象。
那AI能不能这样画呢?
不让AI一个像素一个像素的添补,而是教他们像人类一样一笔一划的绘画。让AI学会在连续的动作空间上作决策,每步决定一个笔画的形状,位置,颜色等参数。如果还能限定笔画数量,是不是就能像大画家们一样,用大略的几笔就能画出景物的灵魂呢?
为了实现这样一个AI,黄哲威和差错选定了深度确定策略梯度 (DDPG) 算法。
和GAN有些类似,DDPG也是一个“精神分裂”的算法,分为两个网络:
策略网络Actor,卖力画画,是一个面向评委果画师,为了得到评委果高评价不断进步;
代价网络Critic,卖力当评委,Actor画出的每一笔他都要做出评价,力求成为一个客不雅观、中立、公允的评委老师,终极目标是帮助Actor画出一个最像原图的画。
因此,在这样一个“精神分裂”的状态下,AI学会了对自己严格哀求。
△ DDPG
纵然增加了许多改进,原版DDPG算法的效果依然不理想,经由大量演习的AI,依然很难画出像样的笔画。
末了,黄哲威把DDPG改造成了一个基于模型的方法。
△ Model-based DDPG
他想到,可以预演习一个神经网络作为笔画渲染器,帮助AI完成对绘画过程的建模。
改造之后,演习速率和表现都有了大大的提高。
全体网络的构造长这样,利用了带有梯度惩罚的WGAN(WGAN with gradient penalty),用来度量画和目标的相似度:
FC指的是全连接层,除了末了一个全连接层的输出向量,策略网络Actor和代价网络Critic采取了同样的构造。
Conv指的是卷积层,GAP指的是全局均匀池化层。
神经渲染器,由几个全连接层和子像素卷积层(Sub-Pixel)组成,可以天生各种不同种类的笔画。
有了网络构造之后,就可以在包括MNIST、SVHN、CelebA和ImageNet等各个有名数据集上演习了。演习的过程实际上是AI不断考试测验绘画,不断改进自身策略的过程,不须要标注数据,也不须要人类的绘画履历。
以CelebA为例,演习须要一张 GPU,10小时预演习笔画渲染器,40小时演习AI,统共要画百万张画。
在线Demo,你也能让AI画画LearningToPaint的代码和CelebA上演习好的模型已经开源,Colab上还有一个在线Demo,不会写代码的同学也可以试用。
只要依次点每一行开头的▶️符号运行,运行到Training之前的部分,AI就可以画出一张川普头像。
把第五行中的地址换成任意一张你喜好的图片,接着连续运行到第八行,就可以看到AI画出这张图。
当然,由于显示窗口是正方形的,如果上传的是非正方形图片会被压缩,建议裁剪之后再放上来,或者也可以把第七行的512×512改成你想要的尺寸。
如果运行到第7行,问你要不要重新做一个视频:
File 'video.mp4' already exists. Overwrite ? [y/N]
就在后面的框框里输入y表示yes。
比如,我们试了试让AI画新垣结衣小姐姐:
最近由于巴黎圣母院事宜又火起来的《刺客信条》中的主角:
乃至抽象版《复联4》的海报,海报上的字都能辨识:
其余,你还可以设定逼迫AI用不同形状的画笔来绘制,比如只许画圆:
或者只许画三角形:
信息学竞赛选手黄哲威
虽然黄哲威现在还是本科在读,但是他在高中的时候便是信息学竞赛选手,打仗CS领域有相称长的韶光了。黄哲威对量子位说,自己的算法博客hzwer.com日均有上万浏览量。
2013年,他被保送到福建省顶尖高中福建师大附中,从高一开始打仗信息学竞赛,终极进入第32届全国信息学竞赛福建省队,得到全国赛银牌,也得到了北京大学本一线录取的机会。
进入北大信科一年后,他得到了ICPC区域赛金牌,还成为了旷视科技智能打算组(IC组)的演习生,之后参加了NIPS 2017的Learning to Run比赛,利用Actor-Critic Ensemble算法得到了第二名。
传送门论文:
Learning to Paint with Model-based Deep Reinforcement Learning
Zhewei Huang, Wen Heng, Shuchang Zhou
https://arxiv.org/abs/1903.04411
GitHub:
https://github.com/hzwer/LearningToPaint
作者撰写的先容文章:
https://zhuanlan.zhihu.com/p/61761901
Demo:
https://colab.research.google.com/github/hzwer/LearningToPaint/blob/master/LearningToPaint.ipynb
— 完 —
诚挚招聘
量子位正在招募编辑/,事情地点在北京中关村落。期待有才华、有激情亲切的同学加入我们!
干系细节,请在量子位"大众号(QbitAI)对话界面,回答“招聘”两个字。
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技能和产品新动态