在前五节课的讲解中,我们已经对Stable Diffusion有了一定的理解。作为一种强大的天生模型,Stable Diffusion能够根据正向提示词和反向提示词以及其他参数天生高质量的图像。在本节课中,我们将重点先容Stable Diffusion的一些根本参数,以帮助大家提高图像天生的质量和效率。
一、外挂VAE模型VAE
VAE,全称为Variational Autoencoder,中文译为变分自编码器。它可以在天生AI图片时对颜色和线条产生影响,即可以微调天生图片的颜色。有时候我们天生的图颜色比较冷、不鲜艳,这时可以利用VAE模型进行调度。纵然没有安装VAE模型,仍旧可以运行Stable Diffusion。现在的Stable Diffusion模型基本都内置了默认的VAE。当然,根据不同情形,有的Stable Diffusion模型作者也会推举利用特定的VAE模型。
VAE 差异
通过上图可以看出,未利用VAE和利用VAE模型在颜色上存在一定差异。因此,在出图时须要根据详细情形进行选择。
二、CLIP终止层数CLIP
CLIP是一种通过提示词与天生图片的干系性来勾引天生的方法。在处理图像和文本关联性时,我们利用文本编码器的倒数第二层信息,也便是默认值2,由于它包含了丰富的特色信息,可以帮助我们更好地理解提示词与天生图片的干系性。例如,如果提示词是"1girl, yellow hair, blue eyes",CLIP过程就会根据这些提示词天生一张黄头发蓝眼睛的女孩的图片。不过须要把稳的是,这个“CLIP终止层数”的设置可能须要根据实际需求进行调度。因此,通过适当调度CLIP终止层数,我们可以优化模型的性能,使其更好地理解和相应文本提示。
CLIP值在0,2,4,6,8,10,12的差异
如果你对上文的理解还不足清晰,可以通过不雅观察上图来加深理解。从图中可以看出,当值越大时,AI会更方向于自由发挥,忽略一些提示词。因此,建议将默认值设置为2。
三、正向提示词和反向提示词正向提示词和反向提示词
正向提示词和反向提示词是一种用于掌握天生图像内容的工具。正向提示词是你想在天生的图像中涌现的元素或者特性。而反向提示词则相反,它是你不肯望在天生的图像中涌现的元素或特性。
灰色头发,蓝色眼睛,不是双马尾的女孩
在正向提示词写:1girl,grey hair,blue eyes,(1女孩,灰色头发,蓝色眼睛)反向提示词写:twintails,(双马尾),天生的图片都是灰色头发蓝色眼睛的女孩子,并且不是双马尾辫子。
四、迭代步数(Steps)迭代步数
在Stable Diffusion中,“迭代步数”是一个关键参数,它决定了AI将你的提示词描述绘制出来所须要的步骤数量。我们所看到的图片闪烁的过程,实际上是在进行每一步的迭代。每一次迭代都会对上一步天生的图片进行微调,以更好地知足我们的提示词哀求。
10,20,30,40,50,60迭代步数的图片
在相同的提示词下,迭代步数越大,细节越丰富。然而,并非迭代步数越大越好。当迭代步数超过20后,基本没有明显差异了。此外,迭代步数越大,对显卡的包袱就越重。因此,推举将迭代步数设置在20到30之间。
五、采样方法(Sampler)1.6版本后共计30个采样器
在更新后的Stable Diffusion 1.6版本中,采样器的选择范围已经扩展到了30种。这些采样器中有新的、淘汰的,有出图质量高但用时长的,也有出图速率快但质量一样平常的,乃至有在极低步数就可以出图的。
大略来说,采样器决定了如何进行随机采样,不同的采样器会对结果产生影响。例如,Eular a采样器的特点是天生很有创意的构图。然而,对付新手来说,可能会对这些采样方法的差异感到困惑。因此,在这里我将推举两种采样器:DPM++ 2M Karras和Euler。这两种采样器出图质量高且稳定。
六、宽高、批次数和单批数量宽高、批次数和单批数量
这个不难明得,便是出图的宽度和高度,默认512,总批次数和单批数量便是一次天生几批图,每批多少张,默认为1。
七、提示词勾引系数 (CFG Scale)在Stable Diffusion中,"提示词勾引系数"(CFG Scale)是一个比较主要的参数。可以把它想象成是一个调节器,决定了天生的图像与输入提示词的匹配程度。如果这个系数设置得过高,那么天生的图像可能会变得过于强调某些特色,而忽略了其他的细节,这可能会导致图像的质量低落。
提示词勾引系数值为1,3,5,7,9,11,13,20,30的出图
如图所示,值过高过低都会影响出图的质量,常日来说,将提示词勾引系数设置在7到11之间是一个不错的选择。
八、随机数种子 (Seed)随机数种子 (Seed)
在Stable Diffusion中,"随机数种子"(Seed)是每张图片的唯一编码。默认值为-1,天生的图片会随机分配一个种子。如果你喜好某张图片,可以将其种子值填入随机数种子框中,这样下次天生的图片就会与之前一样。这方便进行二次创作,点击骰子按钮会将值设置为-1,点击绿色按钮会将上次天生的图片随机种子填写到随机数种子框中。
九、图片信息图片信息
天生的图片下方会显示很多英文信息,包括利用的正向提示词、反向提示词、步数和采样器、随机数种子等信息。
十、插件和脚本插件和脚本
在Stable Diffusion中,我们可以安装多个扩展插件和赞助脚本来增强其功能。个中,Tiled Diffusion和Tiled VAE是一个插件,它能够将图片放大至6K分辨率,非常实用。AnimateDiff则是一个动画插件,可以天生动态的图片。
而ControlNet插件则是最为著名的一个。通过这个插件,我们可以掌握图片的姿势、表情,乃至每一根手指的骨骼。该插件的作者是张吕敏,他是一位医学专业的学生,目前正在斯坦福大学攻读博士学位。只管他是医学专业出身,但他在大学期间就揭橥了多篇在ICCV、CVPR、ECCV等顶级会议上的著作。此外,他还是一位非常有才华的软件开拓者,开拓的Style2Paints和YGOPro2(牌佬惊呼不已)都受到了广大用户的热烈欢迎。最近,他还开拓了AI绘画工具Fooocus,这款工具与Stable diffusion WebUI和midjourney一样便捷易用,未来可期。
结束语好了,亲爱的看官们,如果你以为这篇文章对你有所帮助,那不妨动动小手,给煜煌点个赞、关注一下、转发收藏吧!
毕竟,点赞关注不迷路,煜煌会持续为大家奉上更多精彩内容哦!
如果你还没有关注煜煌的微信公众号【煜煌阁】,那就赶紧去关注吧,煜煌在此谢过啦,我们下期再见!
!
!
❤❤❤
原神-甘雨AI图