那么,有没有能在自己家里电脑上就能大略支配的AI运用呢?还真有!
实在ChatGPT和Stable Diffusion都有开源版本,可以非常大略的在本地支配,不过ChatGPT对付机器的算力配置以及存储哀求都比较高,门槛不低,而且模型小了体验很一样平常,而Stable Diffusion就灵巧多了,虽然要想跑爽还是须要强一点的CPU、显卡和大内存、大显存的,但是最低只须要集成显卡就可以跑!
本日在这里我就给大家先容一下最大略、最省事的AMD显卡AI跑图教程!
目前AI绘画基本上都是基于Github上的Stable Diffusion模型进行的(还有个付费的Midjourney),可以进行“文生图”、“图生图”等等神奇的功能,完备开源且免费,各种网上教的“AI绘画班”以及收费的“AI绘画工具”,不能说全都是骗人吧,至少绝大多数都是智商税,最繁芜的支配和模型演习部分已经有无数大神做好了事情,只要机器配置知足哀求,按着教程走就可以玩起来了!
那么大概须要什么样的配置呢?在发布之初,Stable Diffusion的配置哀求还比较高,至少须要16GB以上的内存、主流级的CPU、10GB以上显存的N卡,这个哀求不说挡住了99%,至少也挡住了90%的用户,毕竟以老黄的抠门程度来看,当时只有3060和3080、3090这几张卡能运行,而且3060还是空有显存,算力残废,在那会跑图很是费劲。但是经由一年韶光不断迭代升级,目前Stable Diffusion已经支持从N卡、A卡乃至I卡,独立显卡到集成显卡,Windows、Linux乃至MacOS各种操作系统,硬件哀求也低了很多,大概配置如下:
CPU:主流平台,原则上性能越强越好(非必须,如果不用显卡CPU硬跑也可以,但是真的很慢一张1-10分钟不等)
内存:越大越好
显卡:显存越大越好,独立显卡须要4GB以上显存,集成显卡须要16GB以上内存(集成显卡最好是Radeon 680M/780M,性能强些)
硬盘:最好是SSD
操作系统:Windows 11/10 21H2及之后版本,显卡驱动越新越好
说白了,如今的Stable Diffusion对硬件的哀求已经很低了,只要不是N年前的上古电脑,5年内的中高端电脑,乃至这两年的一些条记本电脑,独显只要有4G显存(狂牛!
),集显只假如6800H/7840HS集成的Radeon 680M/780M以上,都可以跑(老APU的Vega也行,但是慢),与高端显卡的差异紧张还是速率方面,本身只是输出图片的话对GPU性能哀求不是特殊高,但是对显存哀求比较高。
目前SD对显存的哀求大致区分4档:4G、4-8G、8-12G以及12G以上,越大的显存跑图韶光越短,毕竟模型体积不小,如果能一次加载进显存中,就能大大减小加载模型的韶光,否则只能多次加载,出图很慢——当然,显卡性能太差也弗成,比如Intel的核显,虽然Iris Xe核显最高可以划分8GB内存用作显存,但是性能实在是太弱鸡,跑图速率就弗成,还不如用CPU硬跑,而AMD的集成显卡Radeon 680M/780M就轻松很多。
那么什么显卡得当呢?从跑图的角度出发,由于本身瓶颈紧张还是在显存上,显卡核心的优先级不是那么主要(当然还是越快越好),紧张还是优先选显存大的!
当然,最快的显卡无疑是RTX4090 24GB了,不论是核心性能还是显存容量,都是民用市场绝对最强的存在,以至于太强被禁了......(PS:虽然听说老黄要出 二次阉割的RTX4090D来绕过监管,但是本日又听说还要封禁......总之不要抱太大希望)
那么如今能买到的卡皇是谁呢?是Radeon RX7900XTX 24GB!
从跑图和AI运用的角度来说,同样拥有24GB海量显存的RX7900XTX也是相称精良的,尤其是双11时候RX7900XTX一度降到6000出头的价格,以显存/价格来打算的话相称超值!
(当然由于最近的禁令风云,新任卡皇RX7900XTX也有被抢购+涨价的趋势,且买且珍惜)
【蓝宝石(Sapphire)RX 7900 XTX 24G】蓝宝石(Sapphire) AMD RADEON RX 7900 XTX系列 台式机电竞游戏独立显卡 RX 7900 XTX 24G 超白金【行情 报价 价格 评测】-京东
【讯景RX-79XMERCB9】讯景(XFX)AMD RADEON RX 7900 XTX 24GB 外洋版Pro 电竞游戏独立显卡【行情 报价 价格 评测】-京东
【瀚铠RX 7900XTX】瀚铠(VASTARMOR)AMD RADEON RX 7900XTX超合金旗舰版 OC 24GB GDDR6 电竞游戏设计智能学习电脑独立显卡【行情 报价 价格 评测】-京东
除此之外,再低一档便是A卡的二哥Radeon RX7900XT了,20GB显存同样具有精良的AI性能,双11时候价格一度降到5000出头,比拟同价位的N卡只有12G显存的4070TI,那真是不论核心性能还是显存上都大大掉队了。
再往下的选择就多了,16GB显存有3000多的RX7800XT,12GB显存有2000出头的RX6750GRE,都是同价位性价比最高的存在——不是N卡不给力,实在是老黄的显存给得太抠门了,如今打游戏都不太够,哪里还给你跑AI的空间?连RTX4080都涨回9000了!
虽然RTX4080跑图速率确实也很快,但是这个价格已经完备失落去性价比了!
这里我测试利用的是蓝宝石Sapphire Radeon RX7900XTX 24GB超白金,目前最好的RX7900XTX非公版之一,最近蓝宝石又重开了京东自营,这下买起来放心多了。
对付Stable Diffusion确当地支配,这里有三套方案,效率依次提高,先说说最大略的:
整合包一键启动!
(最省事,效率也相对较低)
这里要首先感谢B站大佬秋葉aaaki的个人空间-秋葉aaaki个人主页-哔哩哔哩视频,感谢大佬为大家带来了“绘世”一键整合包,直接下载适宜A卡的整合包就可以轻松开始AI绘画了!
详细步骤如下:
①下载整合包,地址在【AI绘画】Stable Diffusion A卡专用整合包(DirectML) - 哔哩哔哩;
②解压到英文目录位置,保险起见最好是放在某个盘根目录下;
③找到这个萌萌哒的图标:A启动器.exe,双击运行!
④启动器在联网状态下会自动更新,第一次启动还会提示启用Windows系统的长文件名支持,按照提示选择确定即可。其余还会须要安装微软.net 6.0运行库,如果是联网状态启动器会跳转干系网页自动下载,如果是离线状态的话可以在这里下载,拷到须要跑图的机器上安装即可。
⑤统统顺利的话就可以见到绘世启动器的主界面了!
⑥先不要焦急点击右下角的“一键启动”,由于默认设置不一定能跑起来,先来到第二页“高等选项”中,针对自己机器的配置轻微调度下:
个中,天生引擎可以选CPU和GPU两种,CPU便是硬跑啦,真的很慢,一张512×512的图大约须要3-5分钟不等,当然如果CPU足够强的话也不算慢,比如用7950X跑一张只须要1分钟,然而这个水平连Radeon 780M集成显卡都不如......以是还是用显卡吧!
显存优化选项根据显卡的显存情形设置,Radeon 680M/780M集成显卡建议设置成“低显存”,4-8G显存建议选择“中等显存”,8-12G建议选择“仅SDXL中等显存”,12G以上就选“无优化”即可,压线的显存容量比如8G、12G建议向下选一档,例如8G显存就选“中显存”,不然爆显存的话会报错。
Cross-Attention优化方案建议保持默认或者选择“自动”。
别的选项可以不动,设置完成后就可以点击“一键启动”了!
⑦正常启动后就会自动打开Stable Diffusion的Automatic111 UI界面,看起来是不是有点繁芜?实在只大略天生图片玩玩的话很大略,上面那个大输入框是正面提示词,只管即便用英文,也便是想天生图片的关键词,大致上分为质量掌握和内容哀求两类,比如“best quality”之类的便是掌握质量的,而“girl,long leg”之类的便是卖力内容的,这里就可以只管即便发挥自己的想象力填写了,如果默认的模型里有干系内容,UI会提示的;
第二个大框里便是反向关键词,便是不想在图里涌现的内容了,这里有个万能的负向关键词:
lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry
(来自秋葉aaaki 大神的教程)
粘进反向提示词的框里,基本能知足90%的须要了。
填好关键词之后(实在不填也能出图,但是啥质量就不好说了),接下来点击阁下硕大的橙色“天生”按钮,稍等几秒~几十秒就会天生一张图啦!
关于关键词的选择,有很多教程,乃至还可以让ChatGPT帮你出,个人推举魔咒百科词典,利用起来比较方便,直接选择得当的关键词复制即可。
默认是512×512大小精度,做个头像什么的足够用了,如果要大图须要改一下下面的大小参数,但是天生韶光也是成倍增长的。
⑧想要天生其他风格的图片怎么办?默认的绘世启动器只带了基本的Stable Diffusion个中1套模型,只能知足基本的文生图需求,更多的需求就要增加不同的模型了:
绘世启动器里带了很多模型的链接,而且是海内镜像速率很快,关于额外的模型和其他参数怎么利用,这就说来话长了,有须要的可以自行搜教材和干系材料摸索。不过总体来说,如果只是考试测验一下神奇的AI画图的话,前面①~⑦的步骤就足够了!
再进一步?
须要解释的是,大佬制作的一键整合包紧张是为了我等小白用户利用,兼容性上非常好,但是基于PyTorch的模型效率很一样平常,再加上Windows的各种拖后腿,完备无法发挥出显卡的真实性能,因此这里再供应剩余2套方案的大致素材供参考:
Microsoft Olive速率起飞!默认绘世启动器带的模型效率一样平常,因此微软与AMD互助推出了Olive工具,可以把市情上大量基于PyTorch演习的模型转换为ONNX,基于DirectML来运行,效率提升不少,基本上可以使A卡达到同价位N卡的AI画图效率,但是这种方法就不能用绘世启动器来一键支配了,须要单独安装Git、Python和Anaconda或者Miniconda,这些都是比较好找的开拓工具,能够自己支配这些工具的人大概也不须要我这篇教程,因此我只供应个思路,详细可以看这篇文章。
经由Olive优化之后,RX7900XTX可以跑出大约18-20it/s的速率,天生一张标准512×512图从原来的10秒旁边提升到2-3秒旁边,提升了3-5倍,还是相称可不雅观的!
(原文里还是早一点版本的模型,如今绘世启动器里带的模型用RX7900XTX跑一张图大约在3-5it/s旁边)
须要解释的是,之前在网上搜到的AMD显卡跑图效率,基本都是旧驱动跑的,效率很一样平常,而且没有区分度,最高真个独立显卡RX7900XTX和集成显卡RX780M速率差别不大,都在1.X it/s徘徊,这明显不符合常理,一方面是当时Stable Diffusion的DirectML支持还不足完善,另一方面是老驱动对AI画图优化不足,毕竟这个东西才出来刚满一年。不过在今年11月初,AMD放出了新版的23.11.1驱动,驱动里重点解释了对AI画图功能的优化,紧张便是利用DirectML在Stable Diffusion以及Lightroom、DaVinci等生产力软件上的性能,涵盖RDNA2以来的所有6000、7000系列独立显卡以及600、700M集成显卡。因此前面也说了,驱动要越新越好,毕竟最近1年来AI技能迭代速率,已经有点目不暇接了。
即便是不该用olive优化,新驱动在Windows+DirectML环境下,依然利用绘世启动器,就可以得到大约2-3倍的提升,利用RX7900XTX 24GB显卡时,一张512×512的出图韶光从原来的大约30-50秒提升到10-15秒旁边,效果非常明显!
当然,还是比不过利用Olive进行优化后的性能,此时性能直追同价位N卡!
但是如果我说,这还不是A卡跑AI的完全性能呢?要想彻底开释性能,后面还有一招!
而想要彻底开释显卡的性能,就得抛弃效率低下的Windows,改用效率极高的Linux了。在Linux下,装好Python+Anaconda或者Miniconda,支配Stable Diffusion,抛弃效率低下的DirectML改用ROCm跑CUDA,可以完备开释显卡的性能!
这块的支配就太繁芜了,小弟也没能力考试测验,这里供应大神的教程供参考。
根据文章中的说法,一张RX7900XT 20GB天生512×512的图大约须要1.4秒,相较于上面的Olive方案又大约快了1-2倍旁边,如果把默认的绘世启动器DirectML效率算作1x的话,Olive方案效率大约是3~5x,ROCm效率大约是8~10x,还是相称可不雅观的!
不过从普通用户来说,一张图10秒还是一张图2秒,差异都不是太大!
大概对集成显卡和低端显卡用户意义比较大吧,重点还是创意和模型的利用,毕竟电脑只是工具,最主要的还是如何利用它!