为什么利用MJ的时候总是画不出来自己想画的内容,而且画出来的内容和描述词完备驴唇不对马嘴。

图片来源网络

我问这些兄弟们的描述词是怎么写的。

好家伙,不问不知道,一问直接给我看懵了!

硬核教你4招玩透AI绘图真实感爆棚

要么是直接用中文绘画,要么便是不知道从哪包罗来的SD的提示词,一堆奇奇怪怪的参数全都往上填。

别说画出来的内容跟想的不一样了,这些能画出来东西都已经是相称不随意马虎了。

前段韶光我看了国外一个大佬总结的一个MJ利用手册,内容相称硬核。

但由于是全英文并且内容实在太长,以是潜心学习了良久才看完。

恰好借着这次机会来给兄弟们分享几条贼实用的MJ利用技巧,条条干货,耐心看完!

(以下演示图片全部来源于AI天生)

1、不要用绘画风格来代替绘画类型

很多人在利用MJ绘画真实风格的作品时,常常会利用 “realistic” 或者 “photorealistic” 一类的词汇。

想以此来让MJ画出自己想要的风格。

但实际上,这类词汇是一个绘画风格的术语,不仅不适用于MJ画真实的照片,反而会揠苗助长,画出更差的效果。

如果你想用MJ画出真实感的照片,就不要利用绘画风格的术语,而是利用拍照术语。

比如相机品牌或焦距这些,这样的词汇更能让MJ天生具有照片效果的图像。

举个例子,如果你想画一张真实感的自然风光照片。

缺点的Prompt:

“A landscape with mountains and a lake,photorealistic.”

精确的Prompt:

“A landscape with mountains and a lake, Nikon D850, 24mm f/1.4 lens, natural lighting, golden hour.”

下面这个Prompt利用了详细的相机型号(Nikon D850)、镜头规格(24mm f/1.4)、光芒条件(自然光照、黄金时分)等拍照专业术语。

终极呈现出来的效果就更靠近真本色感的自然风景照片。

2、MJ的偏见

MJ进行模型演习时,会从互联网上获取对应的图片和笔墨描述。

而笔墨描述因此英文形式进行提取的,比如一个男人的照片,对应的文本描述可能便是“man”。

但是天下上除了利用英语的国家,还有几十亿的非英语措辞国家。

这些国家的人在上传图片时不会利用英语来给图片打标签。

于是就导致了MJ不仅不会识别英语之外的措辞,而且当你输入“man”想画一个男人时,MJ总是会画出一个英美长相和穿着的男人。

这便是MJ的偏见。

这种偏见还存在于很多地方,比如“nurse” 方向于天生女性, “terrorist” 方向于天生深色皮肤的阿拉伯样子的人。

以是当你想要画某些特定人物的图片时,务必要提前指明人物的国籍或者种族。

其余在利用阿川AI的时候,如果输入的是中文,请务必点击右上角翻译功能,翻译成英文后,再提交任务。

3、代入AI的视角

MJ作为一款AI绘画工具,它理解事物的思维办法和我们对付天下的认知是完备不同的。

我们输入一段文本,它对付这段文本的理解,紧张是来源于互联网上存在的那些照片。

比如我们输入“bird”,MJ对付这个单词的理解可能是鹰、知更鸟、鹦鹉、乌鸦、火烈鸟乃至是企鹅等等。

那终极MJ画出来的效果可能便是随机结合了这些动物特色的一个合成图像。

以是我们须要暂时放下自己的思维习气和条件假设。

考试测验从一个“傻乎乎”的、对三维物理天下、历史或科学一无所知的机器的视角来更好地理解和利用AI。

比如你想画一幅“未来城市”的图片。

缺点的办法是直接输入:

“画一个未来的城市,有高科技感的建筑和翱翔的汽车。

这种提示词依赖于AI对“未来”、“高科技”和“翱翔的汽车”这些观点的理解。

但是AI对付这些观点的理解可能和我们对付这些观点的理解不同。

以是终极出来的效果就可能和我们的想法有所差距。

那代入AI的视角,我们就可以转而利用更详细、更描述性的措辞。

比如:

“画一个有着类似玻璃和金属材料的高塔、天空中有类似小型飞机的车辆、街道上有多彩灯光和屏幕的城市景象。

这样的话就不是依赖AI对“未来”或“高科技”的主不雅观理解,而是供应了详细的、可以直接阐明的细节。

那终极AI天生的图片就会更准确,更符合我们的想象。

4、词不在多而在准

很多人利用MJ时总喜好凑一大堆词,但实际上由于CLIP的标记上限是77,以是MJ能够吸收到的单词量也是有限的。

我们可以粗略的把MJ单词上限算作是50个,也便是说,我们输入给MJ的单词量不要超过50个。

超过50个的话,那Prompt最开始的部分就有可能被截断,导致MJ绘图时丢失主要内容。

那如果一段Prompt内容过长,该当怎么样缩减长度呢?

4个方法:

1)减少赘述

比如须要画一位在夜晚的神秘森林中穿着未来风格盔甲的女战士。

ChatGPT或者很多人写的提示词大概长这样:

"想象一个未来天下中的女战士,她穿着由未来科技制成的盔甲,这种盔甲闪耀着金属的光泽,并带有高科技元素。
女战士站在一个充满神秘色彩的森林中,是在夜晚,周围树木葱郁,月光透过树梢照射下来,给场景增长了一种神秘感。
她的表情武断,眼神中透露出年夜胆和聪慧。
在这个场景中,还该当有一种未来感和神秘感的领悟,呈现出一种既科幻又奇幻的氛围。
"

这个提示词虽然详细,但过于的冗长和繁芜。

而且很可能会超过AI系统处理的标记限定,太多的细节也可能会让AI难以捕捉紧张元素。

那我们就可以提取这个画面的关键视觉元素,去掉冗余的描述,末了凝练成这样:

"未来风格女战士,夜晚神秘森林,金属盔甲,武断表情,月光下的科幻奇幻氛围。
"

2)去掉无意义的标记

像“a”和“the”这些冠词常日不会对MJ理解Prompt的紧张内容产生太大影响。

乃至有些时候还会对图像的某些细节或构成产生一定影响,比如图像中某物体的涌现或位置。

所以为了避免引起一些不必要的混乱或细微变革,在输入Prompt的时候可以直接省略这类单词。

比如:

"A small child holding a bright red balloon"

简化后变成:

"child holding red balloon"

两者的提示词对付MJ的理解天生效果险些是完备一样的。

同样,除了这些冠词之外,还有:

连词:比如 "and", "but", "or"。

介词:比如 "in", "on", "under"。

助动词:比如 "is", "are", "was"。

量词:比如 "some", "many", "few"。

这些实在大多数情形下与“a”和“the”一样,对付MJ理解天生图像险些没有什么浸染。

当提示词数量达到上限的时候,可以优先考虑去掉这些无意义的标记。

4)修正单词顺序

如果你想让MJ强调某个细节,没必要在这个细节上利用太多的修辞,只须要改动一下单词的位置。

MJ具有很明显的从左到右的倾向性。

Prompt中的第一个描述词会对最终生成的画面产生最强烈的影响,而末了一个描述词对画面的影响最弱。

以是我们可以把单词的顺序当成是一种MJ增加权重的规则。

比如:

恶劣的南极风景,广角镜头,超现实主义数字绘画,蒸汽尾迹,电影氛围,繁华的未来城市

繁华的未来城市,广角镜头,超现实主义数字绘画,蒸汽尾迹,电影氛围,恶劣的南极风景

只是把“恶劣的南极风景”和“繁华的未来城市”这两个元故旧换了一下位置,终极出图的效果侧重点就涌现了很大的差别,且明显倾向于开头的元素。

以是,如果想突出强调某个画面元素时,可以用调换顺序的办法来代替增加权重词,以减少冗余的描述。

好了,篇幅有限,由于原文实在太长,估计全部分享出来怎么也得几万个字,以是本日就先分享这几条。

如果还想学习更多的MJ利用技巧,别忘了留言点赞,咱们下次连续分享!