他们做了个有无限想象力的画画AI无论给它多扯淡的描述它都能给你画出来牛掰了

希望大家看完故事多点“在看”，喜好的话也点个分享和赞

这样事儿君的推送才能连续涌如今你的订阅列表里

才能连续跟大家分享每个开怀大笑或拍案惊奇的好故事啦~

大家可能还记得，去年7月份，我们先容了一个叫GPT-3的措辞模型。

这个模型是由人工智能公司OpenAI研发的，它能根据一段话自动写出语录、小说和论文，让环球科技圈大为愉快，称它是“能窥见未来的AI”。

前几天，OpenAI又发布了新模型，叫做DALL-E，以艺术家达利和机器人瓦力合体命名。

它和GPT-3一样极其强大，仅仅通过一段自然措辞，就能天生对应图片。

这里的“自然措辞”，指的是人们平常说的话（和编程措辞相区分），无论这段话的内容有多扯淡，DALL-E都能把图做出来。

比如，“一个穿着芭蕾舞裙的小萝卜在遛狗”，这话够扯淡吧，但DALL-E能画。

或者，“一个熊猫宝宝穿着睡衣开车”，它也能画。

“一根戴墨镜的小黄瓜弹钢琴”，也没问题。

DALL-E便是这样一个图片转笔墨的模型，它利用了GPT-3中120亿个参数版本，可以完备无中生有，制造出原来不存在的图片。

它也可以让两个不相关的东西领悟成一张图，以合理的形式涌现。

比如说，“牛油果”和“扶手椅”，这两个东西没有一点关系，但输入“一个有着牛油果形状的扶手椅”，DALL-E能输出看上去很像的椅子。

虽然这些椅子看着就知道坐起来不舒畅，但是，创意十足啊。

类似离奇的东西，还有“五边形的绿色马桶”。

天下上该当没有这样的东西，但DALL-E能做出来，而且看上去很真实。

DALL-E还能将植物、动物和其他东西的纹理投射到三维实体上。

“正方体的刺猬”

“正方体的火焰”

“球体的云朵”

（个中一个看上去彷佛冰淇淋球，馋了）

DALL-E还能在一张图中做出两个以上的东西，输出很像照片的图。

“桌上放一堆薯片”

“桌上放一堆闹钟”

不过有时，DALL-E会理解得太片面，比如“桌上放一堆高尔夫球杆”，球杆彷佛没受地心引力影响。

DALL-E也能掌握两个物体在一张图中的位置。

比如，“一本小红书放在大绿书上”，这句话DALL-E是能理解的。

DALL-E还有一点很厉害，是它能理解一句话中多个重点，并且精确地呈现出来。

“一个刺猬宝宝，戴着蓝帽子和红围巾，穿着绿上衣和黄裤子。
” 根据这句话，它须要让服装和颜色逐一匹配，放在刺猬身上精确的位置。

大部分情形下，它出的图和笔墨描述是同等的。

当然，这并不是百分百精确。
随着重点的增多，DALL-E的准确率会低落。

比如下图，该当穿着“绿裤子”的企鹅，在好几处没穿裤子，或者颜色穿错了。

不过，仅仅写一句话，就能收成一堆插图也是够厉害的。
DALL-E画的不少图挺好看的，未来设计师的用度也省了……

OpenAI的研究职员创造，DALL-E还能掌握图中的拍摄视角。

它知道如何生产出正面、背面、侧面，以及俯视、仰视的图，乃至包括鱼眼镜头的图。

输入“山顶上，一只猫头鹰的背影图“，一张媲美野外拍照的照片就涌现了。

或者，“山顶上，一只猫头鹰的超近间隔照”，各种细节维妙维肖。

狐狸的高视角拍摄和低视角拍摄，看上去也很逼真。

（再提醒一下，这些动物是不存在的，图是DALL-E自己做出来的）

DALL-E还能让不同的图案涌如今各种日常用品上。

OpenAI认为这是未来商业发展的方向，可以让企业探索不同的产品观点，不用生产就能看到效果。

“有着蓝色梨子图案的扑克牌”

“有着粉色南瓜图的地毯”

“有着白色茄子图的钱包”

（额，个中两个意外的鬼畜…）

有时候，DALL-E能制造出很故意思的效果，比如“有着粉色茄子的广告牌”，

涌现了一个奇怪的图案……

“屋子的一壁，有着一副黑茄子的墙画”。
这，这又是个啥……

不过，DALL-E中最可笑、最故意思的功能，是让动物和非动物结合，生产出稀奇古怪的图片。

看了往后让人疑惑，自己的想象力还没有一个AI强大。

“用牛油果做成的孔雀”，嗯？

“用大蒜做成的蜗牛”，嗯？？

“本体是扫帚的猫”

(猫咪委曲）

“由披萨做成的袋鼠”

（意外的得当！
）

“由竖琴做成的蜗牛“

“本体是墨西哥卷饼的猪“

“竖琴做成的猪“

“小提琴做成的企鹅“

“由开瓶器做成的刺猬”

服你

最搞笑的是“坦克做成的猪”，这坦克根本没法开吧(＠_＠;)

让鬼畜更上一层楼的，是动物与动物合体，天生图画。

“长得很像乌龟的长颈鹿”

“长得很像凤凰的猫”

“长得很像鸡的龙”？？？

还有，天下名画“长得像水母的熊猫”……

大家可以去OpenAI的官网看，这样鬼畜的儿童画还有很多。

DALL-E的功能如此稀奇古怪，OpenAI研发它的目的是为了什么呢？

实在，研究便是研究，是为了拓展未来的边界，让AI达到更强大的功能。

OpenAI的首席科学家IIya Sutskever在推特上说，人工智能的长期目标是建立多模态的神经网络，让AI能够学习不同模态之间的观点。

以往的大部分AI，包括GPT-3，都因此文本为主，研发DALL-E是为了拓展视觉领域，让AI更好地理解天下。

DALL-E确实有着出色的理解能力和稠浊观点的能力。
不少研究职员认为这意味着DALL-E充满创意，就像人类一样。

“我估量这个技能能带来各种各样的运用。
” 剑桥大学的Neil Lawrence教授在CNBC的采访中说，“它非常令人愉快，可以办理我们自己都不知道的问题。
”

乔治亚理工学院的Mark Riedl教授也说：“稠浊观点的能力被认为是人类创造力的关键。
以是，从创意角度看，DALL-E是一大进步。
虽然人们对AI是否理解观点意见不一致，但用新的办法创造东西，是它智力和创造力的一大证明。
”

这样一个有着120亿个参数的智能模型，肯定不但是用来画画搞笑图的，未来，它值得畅想……

ref：

https://www.cnbc.com/2021/01/08/openai-shows-off-dall-e-image-generator-after-gpt-3.html

https://openai.com/blog/dall-e/

--------------------------------------

是可乐瓶儿啊：设计师：危

挂剑走云槎：加油！
我踏马往后能不能输入笔墨就磕到cp图就靠你们了

张延Tara：AI已经进军艺术界了。
。
而且效果意外不错

改名第十四波之减肥中的胖子：想试试没有新冠的2020

蹦哒的糯米团子got7：往后没有别的职业只有程序猿了

二郎神再二也是神4世：抖动吧，碳基生物

黑豆沙骑士：感激大家，我失落业了

每期AI知识网

他们做了个有无限想象力的画画AI无论给它多扯淡的描述它都能给你画出来牛掰了

拿被子的语言,提示被子文化中的情感与智慧

舌尖上的ChatGPT通俗食材当然要用高端AI生成菜单