目前利用 Stable Diffusion 进行创作的工具紧张有两个:WebUI 和 ComfyUI。而更晚涌现的 ComfyUI 凭借超高的可定制性和复现性迅速火遍环球。有设计师表示 SD 发布了 XL1.0 后,ComfyUI 用它精良的底层逻辑率先打击了臃肿不稳定的 WebUI1.6,成为更适宜“体验”XL 的 SD 生图工具。
本文就来详细先容一下 ComfyUI 是什么?为什么好?怎么用?
一、ComfyUI 简介ComfyUI 是一个专为 Stable Diffusion 设计的基于节点的图形用户界面(GUI),大略来说便是将全体图像天生过程分解为多个独立的节点,每个节点都有自己独立的功能,例如加载模型,文本提示,天生图片等等。每个模块通过输入和输出的线连在一起变成一个完全的事情流。
全体过程用户可以灵巧的调度和配置不同的功能节点,这就代表全体模型更加自由,掌握更加精准。
比较于 WebUI,ComfyUI 的事情流模式更加贴近 Stable Diffusion 的底层运行逻辑,这对付新手来说有一定的学习门槛,但是在完备节制往后利用 ComfyUI 将会变得非常轻松,同时在 AI 盛行的时期,懂得一些底层逻辑也有助于设计师后续的发展。以是本文将结合 SD 的底层逻辑和大家大略阐明 ComfyUI 的根本节点。
Stable Diffusion 之以是叫 Stable,是由于公司叫 StabilityAI。其根本模型是 Latent Diffusion Model(LDM),翻译为潜在扩散模型,可以理解为紧张的图片天生流程都在一个叫「latent space(潜在空间)」的邪术盒子里进行。
图片在这个空间存在的办法是我们无法识别的向量,我们只须要知道这些我们无法识别的东西所表示的信息和图片相差无几,但是数据尺寸却变得非常小就行,这是一个类似于压缩的过程,以是在这个空间中进走运行可以大大缩小运行内存。
这个过程可以大略理解为,向潜在空间输入文件,数据经由处理天生图片并输出。
以文本生图为例,我们现在来阐明全体流程中包含的节点及浸染。
输入文件包含了我们熟知的常规内容:文本和图片,也就对应着 Text2Image 和 Image2Image。但是文本内容打算机是无法理解的,以是我们须要将文本转换为打算机能够理解的信息,这个过程利用了 Clip 模型。(图片的转换是利用了 VAE 模型)
熟习 WebUI 的朋友可以知道,掌握模型实际天生部分的模型是 KSampler(采样器),在这个中我们可以掌握迭代次数,种子数等等。而这个步骤就发生在潜在空间中。
我们在前面的内容可以知道,潜在空间的内容不是人类可以读取的内容,文本的输入须要转换,同样图片的输出也须要转换,这个过程同样利用了 VAE 模型。
这便是最根本的文生图过程,现在再回看 ComfyUI 的根本模型是不是会清晰很多。
而全体事情流的运行由大模型掌握,以是在事情流以 CheckPoint 节点加载扩散模型为出发点,CheckPoint 节点还会供应适当的 VAE 和 Clip 模型。但这并不影响事情流中利用自己选择的 VAE 和 Clip 模型。
到这里我们就已经完备理解了一个最根本的文生图过程和相对应的 ComfyUI 节点,更多进阶内容大家都可以更加深入的探索。
三、与 WebUI 的差异作为现在最火爆的两大创尴尬刁难象,WebUI 开箱即用,基本功能完好,社区也有很多的插件支持,入门比较大略,适宜新手,但是可定制性轻微差点,很多作品不随意马虎传播复现,利用 API 进行操作也有一定的难度。
ComfyUI 虽然出来的晚一点,但是它的可定制性很强,可以让创作者搞出各种新奇的玩意,通过事情流的办法,也可以实现更高的自动化水平,创作方法更随意马虎传播复现,发展势头特殊迅猛。两者比拟有非常多显著的差别。
1. ComfyUI 对显卡比较友好
纵然是 GPU 小于 3G 的情形下也能正常事情。它占用的显存更少,在相同显存条件下能够天生更大尺寸的图像。同时,Mac 电脑也能顺利运行 ComfyUI(建议 M1 以上的电脑利用),虽然依旧达不到 Windos 的运行效率,但这也给 Mac 用户供应了一个可以利用 SD 生图的机会。而 WebUI 近乎抛弃了 12G 显存以下的用户,显存利用效率较低,更不提 Mac 用户。
2. ComfyUI 运行效率极大的提高
设计师通过 ComfyUI 和 Automatic1111 WebUI 运行了一批 20 张图像,以查看每张图像的总韶光。这些图像基于 Stable Diffusion 1.5 模型,分辨率为 512x768。作为参考,利用的是 RTX 3060(12GB VRAM)。末了的结果如下
WebUI 要花费 ComfyUI 两倍多的韶光,这是一个相称大的差距。当你利用 SD 天生视频渲染每一帧时这种韶光差异会更加明显。
3. ComfyUI 可以实现实时预览
用户能够即时看到天生结果。这归功于节点拼接的高自由度,你可以在任何一个位置插入图片天生的功能节点,这样就可以在你想要预览图片的位置实时预览图片天生效果。
4. ComfyUI 可以完备实现事情流的复用
ComfyUI 的事情流可以单独作为 Json 文件保存,你可以通过下载的事情流文件直策应用空想效果的事情流,也可以在这份文件上进行任意的修正和添加。值得把稳的是,通过 ComfyUI 天生的图片原文件也保留着事情流数据,也便是说,你只要下载社交媒体上设计师上传的图片原文件拖拽放入 ComfyUI 中,事情流会被急速复现。
5. 与 WebUI 共通模型
WebUI 与 ComfyUI 实质都是利用 Stable Diffusion 大模型进行生图,只是利用办法不同,以是如果你是 WebUI 的老用户,你可以直接将 WebUI 中利用的模型与 ComfyUI 共通,过程非常大略,后面会提到。
四、利用技巧在这里为新手的设计师供应一些你一定会用到的利用技巧:
1. ComfyUI Manager
ComfyUI 是完备通过节点组成,以是下载不同的节点是最开始就会碰着的问题。ComfyUI Manager 作为一个节点,你可以将它看作一个插件,它可以下载险些所有你能利用到的节点,并且供应了更新、管理自定义节点等等的功能。下载了它险些即是你不会再通过 Github 安装节点。
安装完成 ComfyUI Manager 后,重启 ComfyUI,在右边可以找到一个「manager」点击就可以进入插件界面。
个中有两个最常用的功能便是搜索安装节点和一键安装事情流中的所有缺失落节点。
ComfyUI Manager:github.com/ltdrdata/ComfyUI-Manager
2. 将 WebUI 中的模型导入 ComfyUI
用过 WebUI 的设计师该当已经下载了很多自己顺手的模型,这些模型在 ComfyUI 中也是通用的,以是我们只须要共享这些模型就可以利用
详细流程如下:
在 ComfyUI 目录中,有一个 extra_model_paths.yaml.example 文件,将其重命名为 extra_model_paths.yaml打开该文件,找到 base_path:path/to/stable-diffusion-webui/,将路径更换为你的 WebUI 的路径,例如 base_path:D/StableDiffusion/stable-diffusion-webui/末了重启 ComfyUI,你就可以在 Load Checkpoint 中的 Ckpt_name 中找到五、安装链接如果你利用的是 Windows 平台且为 N 卡用户,只须要在项目主页的 Release 页面下载作者供应的“官方整合包”
https://github.com/comfyanonymous/ComfyUI/releases
如果你是 Mac 用户可以参考以下文章
https://zhuanlan.zhihu.com/p/666047912
结语设计是一门不断发展的艺术和科学。保持对新技能、新方法的好奇心,是我们一直向上走的助力。但只管 AI 可以供应很多帮助,设计的核心仍旧是人类的情绪和体验。确保设计作品能够与用户产生情绪共鸣,始终保持人性化的触感。希望我们能够连续发挥创造力和想象力,利用 AI 和其他新技能,创造出更多俏丽、有用且故意义的设计作品。
欢迎关注「58UXD」的微信公众年夜众号: