希望大家看完故事多点“在看”,喜好的话也点个分享和赞
这样事儿君的推送才能连续涌如今你的订阅列表里
才能连续跟大家分享每个开怀大笑或拍案惊奇的好故事啦~
大家可能还记得,去年7月份,我们先容了一个叫GPT-3的措辞模型。
这个模型是由人工智能公司OpenAI研发的,它能根据一段话自动写出语录、小说和论文,让环球科技圈大为愉快,称它是“能窥见未来的AI”。
前几天,OpenAI又发布了新模型,叫做DALL-E,以艺术家达利和机器人瓦力合体命名。
它和GPT-3一样极其强大,仅仅通过一段自然措辞,就能天生对应图片。
这里的“自然措辞”,指的是人们平常说的话(和编程措辞相区分),无论这段话的内容有多扯淡,DALL-E都能把图做出来。
比如,“一个穿着芭蕾舞裙的小萝卜在遛狗”,这话够扯淡吧,但DALL-E能画。
或者,“一个熊猫宝宝穿着睡衣开车”,它也能画。
“一根戴墨镜的小黄瓜弹钢琴”,也没问题。
DALL-E便是这样一个图片转笔墨的模型,它利用了GPT-3中120亿个参数版本,可以完备无中生有,制造出原来不存在的图片。
它也可以让两个不相关的东西领悟成一张图,以合理的形式涌现。
比如说,“牛油果”和“扶手椅”,这两个东西没有一点关系,但输入“一个有着牛油果形状的扶手椅”,DALL-E能输出看上去很像的椅子。
虽然这些椅子看着就知道坐起来不舒畅,但是,创意十足啊。
类似离奇的东西,还有“五边形的绿色马桶”。
天下上该当没有这样的东西,但DALL-E能做出来,而且看上去很真实。
DALL-E还能将植物、动物和其他东西的纹理投射到三维实体上。
“正方体的刺猬”
“正方体的火焰”
“球体的云朵”
(个中一个看上去彷佛冰淇淋球,馋了)
DALL-E还能在一张图中做出两个以上的东西,输出很像照片的图。
“桌上放一堆薯片”
“桌上放一堆闹钟”
不过有时,DALL-E会理解得太片面,比如“桌上放一堆高尔夫球杆”,球杆彷佛没受地心引力影响。
DALL-E也能掌握两个物体在一张图中的位置。
比如,“一本小红书放在大绿书上”,这句话DALL-E是能理解的。
DALL-E还有一点很厉害,是它能理解一句话中多个重点,并且精确地呈现出来。
“一个刺猬宝宝,戴着蓝帽子和红围巾,穿着绿上衣和黄裤子。” 根据这句话,它须要让服装和颜色逐一匹配,放在刺猬身上精确的位置。
大部分情形下,它出的图和笔墨描述是同等的。
当然,这并不是百分百精确。随着重点的增多,DALL-E的准确率会低落。
比如下图,该当穿着“绿裤子”的企鹅,在好几处没穿裤子,或者颜色穿错了。
不过,仅仅写一句话,就能收成一堆插图也是够厉害的。DALL-E画的不少图挺好看的,未来设计师的用度也省了……
OpenAI的研究职员创造,DALL-E还能掌握图中的拍摄视角。
它知道如何生产出正面、背面、侧面,以及俯视、仰视的图,乃至包括鱼眼镜头的图。
输入“山顶上,一只猫头鹰的背影图“,一张媲美野外拍照的照片就涌现了。
或者,“山顶上,一只猫头鹰的超近间隔照”,各种细节维妙维肖。
狐狸的高视角拍摄和低视角拍摄,看上去也很逼真。
(再提醒一下,这些动物是不存在的,图是DALL-E自己做出来的)
DALL-E还能让不同的图案涌如今各种日常用品上。
OpenAI认为这是未来商业发展的方向,可以让企业探索不同的产品观点,不用生产就能看到效果。
“有着蓝色梨子图案的扑克牌”
“有着粉色南瓜图的地毯”
“有着白色茄子图的钱包”
(额,个中两个意外的鬼畜…)
有时候,DALL-E能制造出很故意思的效果,比如“有着粉色茄子的广告牌”,
涌现了一个奇怪的图案……
“屋子的一壁,有着一副黑茄子的墙画”。这,这又是个啥……
不过,DALL-E中最可笑、最故意思的功能,是让动物和非动物结合,生产出稀奇古怪的图片。
看了往后让人疑惑,自己的想象力还没有一个AI强大。
“用牛油果做成的孔雀”,嗯?
“用大蒜做成的蜗牛”,嗯??
“本体是扫帚的猫”
(猫咪委曲)
“由披萨做成的袋鼠”
(意外的得当!
)
“由竖琴做成的蜗牛“
“本体是墨西哥卷饼的猪“
“竖琴做成的猪“
“小提琴做成的企鹅“
“由开瓶器做成的刺猬”
服你
最搞笑的是“坦克做成的猪”,这坦克根本没法开吧(@_@;)
让鬼畜更上一层楼的,是动物与动物合体,天生图画。
“长得很像乌龟的长颈鹿”
“长得很像凤凰的猫”
“长得很像鸡的龙”???
还有,天下名画“长得像水母的熊猫”……
大家可以去OpenAI的官网看,这样鬼畜的儿童画还有很多。
DALL-E的功能如此稀奇古怪,OpenAI研发它的目的是为了什么呢?
实在,研究便是研究,是为了拓展未来的边界,让AI达到更强大的功能。
OpenAI的首席科学家IIya Sutskever在推特上说,人工智能的长期目标是建立多模态的神经网络,让AI能够学习不同模态之间的观点。
以往的大部分AI,包括GPT-3,都因此文本为主,研发DALL-E是为了拓展视觉领域,让AI更好地理解天下。
DALL-E确实有着出色的理解能力和稠浊观点的能力。不少研究职员认为这意味着DALL-E充满创意,就像人类一样。
“我估量这个技能能带来各种各样的运用。” 剑桥大学的Neil Lawrence教授在CNBC的采访中说,“它非常令人愉快,可以办理我们自己都不知道的问题。”
乔治亚理工学院的Mark Riedl教授也说:“稠浊观点的能力被认为是人类创造力的关键。以是,从创意角度看,DALL-E是一大进步。虽然人们对AI是否理解观点意见不一致,但用新的办法创造东西,是它智力和创造力的一大证明。”
这样一个有着120亿个参数的智能模型,肯定不但是用来画画搞笑图的,未来,它值得畅想……
ref:
https://www.cnbc.com/2021/01/08/openai-shows-off-dall-e-image-generator-after-gpt-3.html
https://openai.com/blog/dall-e/
--------------------------------------
是可乐瓶儿啊:设计师:危
挂剑走云槎:加油!
我踏马往后能不能输入笔墨就磕到cp图就靠你们了
张延Tara:AI已经进军艺术界了。。而且效果意外不错
改名第十四波之减肥中的胖子:想试试没有新冠的2020
蹦哒的糯米团子got7:往后没有别的职业只有程序猿了
二郎神再二也是神4世:抖动吧,碳基生物
黑豆沙骑士:感激大家,我失落业了