我当时正在兴头上,于是便急速注册了NovelAI的用户,输入了他给的这段代码。原图我就不放了,放了号就没了,我只能说:
画面很逼真,效果很哇塞。
实际上,2022年10月的第二个星期的的确确是属于AI绘画的——一个名为NovelAI的网站悄然上线。对付这个AI模型,真正故意思的是它的素材——NovelAI所利用的数据紧张来自两处,一部分来自国外的著名二次元网站Danbooru,另一部分则采集自分外渠道—站的成色十分清楚——都不是什么正经的地方。
TMD……这帮洋人程序员,果真是懂人性的。
虽然NovelAI利用技能手段从这两个网站上扒数据进行学习的事情引起了不小的舆论风潮乃至法律轇轕,但毫无疑问的是,NovelAI成功了。
NovelAI大得胜利之后,国内外的诸多游戏/科技媒体纷纭都在通报着一个:AI已经学会画涩图了。
本着“体验前沿科技成果,紧跟技能发展潮流”的精神,局长开始了为期三天的AI画图之旅。
三天后,我好了,除了精神有些萎靡。但,我逐渐理解了统统。
我的AI绘画体验
我选择体验的AI绘画平台是NovelAI。缘故原由很大略,由于它的演习素材实在是“给了我一个无法谢绝的情由”。
唯一的不敷便是须要费钱且有点贵——先交80块钱作为会员,它会送你1000个点券,然后还可以再花80块钱买10000个点券——每出一张图就要花至少5个点券,看样子倒是不贵,但若是想天生一个没有瑕疵、满意的作品,每每须要调度好几次。均匀下来,末了天生一张足够满意的图可能须要几十上百个点券。
10000个点券虽然看上去还挺多,实际上一点也不经用。
对这种收费模式,我的朋友表示:NovelAI的这个买卖做的好,让我们这些用户自掏腰包帮他们演习模型。我觉得她内涵我,但我没有证据。
正式进入之后,就可以开始操作了。
所谓的操作,实在便是输入恰当的Prompt(提示词)从而实现预期的效果。
莎士比亚说过“一千个不雅观众眼里有一千个哈姆雷特”,在AI作图上也是如此,人们的恶意见意义各有不同,以是prompt的内容也五花八门。但总而言之,prompt无非便是一些大略的描述,比如“黑长直的头发,戴眼镜,打湿的白衬衣,紧身牛仔裤”等等......
由于命令AI天生满意的图片每每须要极度详细且冗长的prompt,因此网友们便将promt戏称为“咒语”,调度/输入prompt的过程则被称为“念咒”“施法”或“吟唱”。
一个AI绘图平台竟然能在这个灵气稀薄的末法时期里催生出满地的邪术师,霍格沃茨看了都得高呼行家。
除此之外,Prompt的内容还可以分成两类,一类是“你希望实现的效果”,被称为“Positive Prompt”(正咒),另一类则是“你不肯望实现的效果”——Negative Prompt(反咒)——之以是会涌现“反咒”,紧张还是由于现阶段的AI模型开拓得还不算完备,一旦碰着须要精确表达且构造形状繁芜的东西就会急速抓瞎。用户们必须想尽办法来肃清掉那些可能毁掉画面效果的瑕疵。
比如,当你须要你须要画面中的人物“用手撩着头发”的时候,AI就常常做出一些令人感到迷惑的东西。
不过,虽然这些离谱的bug暂时还没有被改动,但人们显然已经学会了用“反咒”或者其他办法“乱来”过去——
比如我就常常哀求AI把人物的手隐蔽起来,反正只要看不见就不能说有问题。
除了精细的人物之外,NovelAI在风景、场景上的表现也是可圈可点。这个画质虽然肯定比不过顶级的插画师的手艺,但用在一些对画面并不太讲究的地方还是没什么问题的。
比较之下,海内某大厂开拓的AI模型就显得有点尴尬了。
在自然景物的呈现上,国产AI模型表现出了极致的效果,选择输出“写实主义”风格的作品时,效果基本已经有了靠近照片级的真实感,可以说是吊打NovelAI。但一旦哀求其绘制人物肖像,一种莫名其妙的诡异觉得便显示了出来。
不过这并不算什么大问题,NovelAI团队之前是做“AI续写小说”的,在模型搭建的过程中自然会对文学类措辞以及影视、动漫形象有更深刻的理解,加上演习素材也大多来自动漫形象或分外渠道,以是在人物表现力上自然会更强。
“AI作图”背后是什么?如今,AI已经开始渗透到了各行各业——“人工智能”,这个起源于1956年的观点,在近70年的发展史中先后经历了两次起伏,终极在2006年深度学习算法打破后开始进入了新的一轮高潮——2017年以来,AI研究开始呈现爆发趋势,“算力,算法,数据”成为了本轮AI大潮的紧张动力。
以NovelAI为例,供应算力的各种硬件设备当然是最最根本的,联网版本的NovelAI就不多说了,单机版的NovelAI极度依赖于电脑显卡的性能——而GPU正好便是如今最主流的“算力引擎”之一——说实话,这几年显卡算是彻底火了,前几年是用显卡挖比特币,现在是用显卡画画。
除了算力,数据也是极为主要的。NovelAI的作品之以是有极为浓厚的二次元和游戏CG风格,正是由于其演习所利用的素材绝大多数都来自于D站和P站——当然,这也阐明了为什么NovelAI天生的图片总有点离谱。
末了则是算法——这可以说是AI的灵魂所在,也便是为什么能做到“从笔墨天生图像”。目前来看,最热门、最受欢迎的便是Diffusion model(扩散模型),市情上绝大多数须要通过“吟唱”来绘画的AI平台用的都是这个。
Diffusion model的事理很故意思,大略来说便是不断地“加密”一张图片(添加噪点),直到这张图片变成彻底人鬼莫辨的模糊样子。然后,人们再让AI模型考试测验着一步步地将其还原成为最初的样子。
要知道,当加密过程结束后,末了得到的东西是一张已经完备模糊的图片。而当AI模型能够从这样的一团混沌中解析出来精确的图片,也就意味着AI节制了“无中生有”的能力。
不过,如果只有diffusion model,那顶多也便是一个天生图像的工具,我们还不能为所欲为地“召唤”自己想要的画面——我们只须要一个东西将笔墨和Diffusion model连接起来,而目前,担当这个连接器的东西叫CLIP(Contrastive Language-Image Pre-training)——
粗暴点说,它相称于是一个给AI看的“儿童识字图册”,让AI把笔墨和干系的图像对应起来。
因此,全体AI绘画过程大概是这样的:当我们输入了一大串Prompt“咒语”,CLIP就会产生一个相应的结果“A”(学名叫“表征”)。与此同时,diffusion model里也会随机天生一张图片,而CLIP也会给一个相应的结果“B”。然后,通过不断地皮算A和B的相似程度,让A和B无限靠近,终极就能够实现“A=B”,也便是让我们输入的描述和电脑天生的结果千篇一律。
大略来说,当前AI的事情事理堪称是“大力失事业”——开拓职员输入海量的数据,算法平台将根据这些数据来演习模型,终极形成AI技能工具。
全体AI家当链基本可以分为三段:根本层、技能层、运用层。
根本层是数据和算力,包括AI芯片、AI根本举动步伐和数据以及做事;技能层则紧张指的是基于根本层所开拓的算法模型,模型会根据软件框架对数据进行学习,终极得到人工智能技能;运用层则是根据不同场景来利用这些人工智能技能。
在AI领域,中美两国基本上代表了环球最高水准。
AI根本举动步伐领域,随着技能进步,AI算力的基石也发生了改变。在过去,x86做事器是主流,但现在AI芯片、GPU、FPGA、ASIC等芯片为核心的做事器成为了主力——浪潮、华为、曙光、新华三都是海内领先的AI根本举动步伐供应商。如果连续深挖,我们会创造AI根本举动步伐的底层实在还是芯片。事实上,百度、华为、阿里、寒武纪等海内头部科技企业现在都在依托自身的技能和业务上风在布局AI芯片的研发:华为的升腾910芯片是环球单芯片打算密度最大的芯片,寒武纪的思元370运用了最新的小芯片(也叫芯粒,chiplet)技能,功耗大幅度降落,算力也不差。
但须要把稳的是,GPU/FPGA/ASIC这些是目前AI芯片行业的主流,GPU仍旧是首选,而全天下最强的GPU厂商则是美国的英伟达。
再结合一下最近的新闻,啧啧,你看看,是不是统统都串联起来了。
我只能说:这棋局,大得很呐!
“AI作图”会消灭谁?
其余,只要谈到AI,有一个问题是绕不开的:AI会取代人类吗?
我无意于解答这个问题,在这里,我们先聊一件往事:
大家都知道,2015年前后,正是中国互联网经济发展最快的时候。在北京的西二旗、杭州的滨江区、深圳的南山区,到处都是满怀创业激情亲切的新兴互联网企业。
那几年,双十一购物节每一年的发卖额都要在上一年的根本上进行一场大跳跃,而这统统的背后的原动力,则是中国互联网用户数量的暴涨。
用户在暴涨,意味着做事用户的各类也要暴涨——比如某个著名电商平台页面上的海报。尤其是当如今大数据和算法日益强势,首页上推广的产品逐渐变得千人千面,做海报这件事开始变得越来越难——无数种商品,无数个用户,意味着这个电商平台必须要输出数以亿计的海报。
虽然这些海报很大略,无非便是“产品图+广告语+背景素材”的排列组合,但如果靠人来进行操作,且不说设计师们会不会被累到猝去世,光是付给设计师团队的人为便是一笔巨大的本钱。
于是,AI登场了——这家企业退出了一个名叫“鲁班”的AI设计师,一秒钟可以制作8000张海报,一天韶光制作4000万张海报——不仅能做到超高产量,还能知足千人千面的需求。
这便是AI杀入创作领域后所展示出来的力量——事实上,“鲁班”的涌现的确使得一批设计师失落去了事情,但仍旧有相称数量的设计师并没有被冲击到。
之以是这些人没有被“鲁班”所取代,是由于他们节制了或许机器永久无法节制的东西——创意。
从之前对NovelAI操作的先容中我们会创造,全体操作过程非常“傻瓜”——只要会打字就可以了——但重点从不在于打字,而是“打什么字”——如果你不知道如何表达你的艺术创意,如果你不知道如何让AI按照你的指令呈现效果,那么即便没有AI,拿起画笔的你也依旧没有什么竞争力。
说白了,在当前这个阶段,AI依旧只是一种听命于人类指令的机器。严格意义上,这只能算是“弱AI”
现阶段的AI只是帮助人们省略掉了那些重复劳动的环节,真正决定产品的质量的,依旧是看你能够做出何等水平的指令。
因此,本日仍旧没有被“鲁班”取代的设计师,大多数都已经摸索出了一条和“鲁班”和蔼相处的道路——
设计师卖力调教“鲁班”,鲁班卖力设计和输出海报图片。AI作图真的会消灭谁吗?我的意见是:在生产力的革命里,被消灭的永久只是掉队的生产关系。PS:彩蛋:星海娘~
参考资料:科创板系列—— AI家当链全景图,中国安然从起因到争议,在 AI 天生艺术元年聊聊 AI,少数派AI绘画很酷,可是..事理是什么?,庐中漫游,碎光