太简单了全免费最简单省事的3分钟上手 AMD 显卡 AI 跑图教程

那么，有没有能在自己家里电脑上就能大略支配的AI运用呢？还真有！
实在ChatGPT和Stable Diffusion都有开源版本，可以非常大略的在本地支配，不过ChatGPT对付机器的算力配置以及存储哀求都比较高，门槛不低，而且模型小了体验很一样平常，而Stable Diffusion就灵巧多了，虽然要想跑爽还是须要强一点的CPU、显卡和大内存、大显存的，但是最低只须要集成显卡就可以跑！

本日在这里我就给大家先容一下最大略、最省事的AMD显卡AI跑图教程！

须要什么配置？

目前AI绘画基本上都是基于Github上的Stable Diffusion模型进行的（还有个付费的Midjourney），可以进行“文生图”、“图生图”等等神奇的功能，完备开源且免费，各种网上教的“AI绘画班”以及收费的“AI绘画工具”，不能说全都是骗人吧，至少绝大多数都是智商税，最繁芜的支配和模型演习部分已经有无数大神做好了事情，只要机器配置知足哀求，按着教程走就可以玩起来了！

那么大概须要什么样的配置呢？在发布之初，Stable Diffusion的配置哀求还比较高，至少须要16GB以上的内存、主流级的CPU、10GB以上显存的N卡，这个哀求不说挡住了99%，至少也挡住了90%的用户，毕竟以老黄的抠门程度来看，当时只有3060和3080、3090这几张卡能运行，而且3060还是空有显存，算力残废，在那会跑图很是费劲。
但是经由一年韶光不断迭代升级，目前Stable Diffusion已经支持从N卡、A卡乃至I卡，独立显卡到集成显卡，Windows、Linux乃至MacOS各种操作系统，硬件哀求也低了很多，大概配置如下：

太简单了全免费最简单省事的3分钟上手 AMD 显卡 AI 跑图教程

CPU：主流平台，原则上性能越强越好（非必须，如果不用显卡CPU硬跑也可以，但是真的很慢一张1-10分钟不等）

内存：越大越好

显卡：显存越大越好，独立显卡须要4GB以上显存，集成显卡须要16GB以上内存（集成显卡最好是Radeon 680M/780M，性能强些）

硬盘：最好是SSD

操作系统：Windows 11/10 21H2及之后版本，显卡驱动越新越好

说白了，如今的Stable Diffusion对硬件的哀求已经很低了，只要不是N年前的上古电脑，5年内的中高端电脑，乃至这两年的一些条记本电脑，独显只要有4G显存（狂牛！
），集显只假如6800H/7840HS集成的Radeon 680M/780M以上，都可以跑（老APU的Vega也行，但是慢），与高端显卡的差异紧张还是速率方面，本身只是输出图片的话对GPU性能哀求不是特殊高，但是对显存哀求比较高。

目前SD对显存的哀求大致区分4档：4G、4-8G、8-12G以及12G以上，越大的显存跑图韶光越短，毕竟模型体积不小，如果能一次加载进显存中，就能大大减小加载模型的韶光，否则只能多次加载，出图很慢——当然，显卡性能太差也弗成，比如Intel的核显，虽然Iris Xe核显最高可以划分8GB内存用作显存，但是性能实在是太弱鸡，跑图速率就弗成，还不如用CPU硬跑，而AMD的集成显卡Radeon 680M/780M就轻松很多。

那么什么显卡得当呢？从跑图的角度出发，由于本身瓶颈紧张还是在显存上，显卡核心的优先级不是那么主要（当然还是越快越好），紧张还是优先选显存大的！

当然，最快的显卡无疑是RTX4090 24GB了，不论是核心性能还是显存容量，都是民用市场绝对最强的存在，以至于太强被禁了......（PS：虽然听说老黄要出二次阉割的RTX4090D来绕过监管，但是本日又听说还要封禁......总之不要抱太大希望）

那么如今能买到的卡皇是谁呢？是Radeon RX7900XTX 24GB！
从跑图和AI运用的角度来说，同样拥有24GB海量显存的RX7900XTX也是相称精良的，尤其是双11时候RX7900XTX一度降到6000出头的价格，以显存/价格来打算的话相称超值！
（当然由于最近的禁令风云，新任卡皇RX7900XTX也有被抢购+涨价的趋势，且买且珍惜）

【蓝宝石（Sapphire）RX 7900 XTX 24G】蓝宝石(Sapphire) AMD RADEON RX 7900 XTX系列台式机电竞游戏独立显卡 RX 7900 XTX 24G 超白金【行情报价价格评测】-京东

【讯景RX-79XMERCB9】讯景（XFX）AMD RADEON RX 7900 XTX 24GB 外洋版Pro 电竞游戏独立显卡【行情报价价格评测】-京东

【瀚铠RX 7900XTX】瀚铠（VASTARMOR）AMD RADEON RX 7900XTX超合金旗舰版 OC 24GB GDDR6 电竞游戏设计智能学习电脑独立显卡【行情报价价格评测】-京东

除此之外，再低一档便是A卡的二哥Radeon RX7900XT了，20GB显存同样具有精良的AI性能，双11时候价格一度降到5000出头，比拟同价位的N卡只有12G显存的4070TI，那真是不论核心性能还是显存上都大大掉队了。

再往下的选择就多了，16GB显存有3000多的RX7800XT，12GB显存有2000出头的RX6750GRE，都是同价位性价比最高的存在——不是N卡不给力，实在是老黄的显存给得太抠门了，如今打游戏都不太够，哪里还给你跑AI的空间？连RTX4080都涨回9000了！
虽然RTX4080跑图速率确实也很快，但是这个价格已经完备失落去性价比了！

怎么玩？

这里我测试利用的是蓝宝石Sapphire Radeon RX7900XTX 24GB超白金，目前最好的RX7900XTX非公版之一，最近蓝宝石又重开了京东自营，这下买起来放心多了。

对付Stable Diffusion确当地支配，这里有三套方案，效率依次提高，先说说最大略的：

整合包一键启动！
（最省事，效率也相对较低）

这里要首先感谢B站大佬秋葉aaaki的个人空间-秋葉aaaki个人主页-哔哩哔哩视频，感谢大佬为大家带来了“绘世”一键整合包，直接下载适宜A卡的整合包就可以轻松开始AI绘画了！

详细步骤如下：

①下载整合包，地址在【AI绘画】Stable Diffusion A卡专用整合包（DirectML） - 哔哩哔哩；

②解压到英文目录位置，保险起见最好是放在某个盘根目录下；

③找到这个萌萌哒的图标：A启动器.exe，双击运行！

④启动器在联网状态下会自动更新，第一次启动还会提示启用Windows系统的长文件名支持，按照提示选择确定即可。
其余还会须要安装微软.net 6.0运行库，如果是联网状态启动器会跳转干系网页自动下载，如果是离线状态的话可以在这里下载，拷到须要跑图的机器上安装即可。

⑤统统顺利的话就可以见到绘世启动器的主界面了！

⑥先不要焦急点击右下角的“一键启动”，由于默认设置不一定能跑起来，先来到第二页“高等选项”中，针对自己机器的配置轻微调度下：

个中，天生引擎可以选CPU和GPU两种，CPU便是硬跑啦，真的很慢，一张512×512的图大约须要3-5分钟不等，当然如果CPU足够强的话也不算慢，比如用7950X跑一张只须要1分钟，然而这个水平连Radeon 780M集成显卡都不如......以是还是用显卡吧！

显存优化选项根据显卡的显存情形设置，Radeon 680M/780M集成显卡建议设置成“低显存”，4-8G显存建议选择“中等显存”，8-12G建议选择“仅SDXL中等显存”，12G以上就选“无优化”即可，压线的显存容量比如8G、12G建议向下选一档，例如8G显存就选“中显存”，不然爆显存的话会报错。

Cross-Attention优化方案建议保持默认或者选择“自动”。

别的选项可以不动，设置完成后就可以点击“一键启动”了！

⑦正常启动后就会自动打开Stable Diffusion的Automatic111 UI界面，看起来是不是有点繁芜？实在只大略天生图片玩玩的话很大略，上面那个大输入框是正面提示词，只管即便用英文，也便是想天生图片的关键词，大致上分为质量掌握和内容哀求两类，比如“best quality”之类的便是掌握质量的，而“girl,long leg”之类的便是卖力内容的，这里就可以只管即便发挥自己的想象力填写了，如果默认的模型里有干系内容，UI会提示的；

第二个大框里便是反向关键词，便是不想在图里涌现的内容了，这里有个万能的负向关键词：

lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry

（来自秋葉aaaki 大神的教程）

粘进反向提示词的框里，基本能知足90%的须要了。

填好关键词之后（实在不填也能出图，但是啥质量就不好说了），接下来点击阁下硕大的橙色“天生”按钮，稍等几秒~几十秒就会天生一张图啦！

关于关键词的选择，有很多教程，乃至还可以让ChatGPT帮你出，个人推举魔咒百科词典，利用起来比较方便，直接选择得当的关键词复制即可。

默认是512×512大小精度，做个头像什么的足够用了，如果要大图须要改一下下面的大小参数，但是天生韶光也是成倍增长的。

⑧想要天生其他风格的图片怎么办？默认的绘世启动器只带了基本的Stable Diffusion个中1套模型，只能知足基本的文生图需求，更多的需求就要增加不同的模型了：

绘世启动器里带了很多模型的链接，而且是海内镜像速率很快，关于额外的模型和其他参数怎么利用，这就说来话长了，有须要的可以自行搜教材和干系材料摸索。
不过总体来说，如果只是考试测验一下神奇的AI画图的话，前面①~⑦的步骤就足够了！

再进一步？

须要解释的是，大佬制作的一键整合包紧张是为了我等小白用户利用，兼容性上非常好，但是基于PyTorch的模型效率很一样平常，再加上Windows的各种拖后腿，完备无法发挥出显卡的真实性能，因此这里再供应剩余2套方案的大致素材供参考：

Microsoft Olive速率起飞！

默认绘世启动器带的模型效率一样平常，因此微软与AMD互助推出了Olive工具，可以把市情上大量基于PyTorch演习的模型转换为ONNX，基于DirectML来运行，效率提升不少，基本上可以使A卡达到同价位N卡的AI画图效率，但是这种方法就不能用绘世启动器来一键支配了，须要单独安装Git、Python和Anaconda或者Miniconda，这些都是比较好找的开拓工具，能够自己支配这些工具的人大概也不须要我这篇教程，因此我只供应个思路，详细可以看这篇文章。

经由Olive优化之后，RX7900XTX可以跑出大约18-20it/s的速率，天生一张标准512×512图从原来的10秒旁边提升到2-3秒旁边，提升了3-5倍，还是相称可不雅观的！
（原文里还是早一点版本的模型，如今绘世启动器里带的模型用RX7900XTX跑一张图大约在3-5it/s旁边）

须要解释的是，之前在网上搜到的AMD显卡跑图效率，基本都是旧驱动跑的，效率很一样平常，而且没有区分度，最高真个独立显卡RX7900XTX和集成显卡RX780M速率差别不大，都在1.X it/s徘徊，这明显不符合常理，一方面是当时Stable Diffusion的DirectML支持还不足完善，另一方面是老驱动对AI画图优化不足，毕竟这个东西才出来刚满一年。
不过在今年11月初，AMD放出了新版的23.11.1驱动，驱动里重点解释了对AI画图功能的优化，紧张便是利用DirectML在Stable Diffusion以及Lightroom、DaVinci等生产力软件上的性能，涵盖RDNA2以来的所有6000、7000系列独立显卡以及600、700M集成显卡。
因此前面也说了，驱动要越新越好，毕竟最近1年来AI技能迭代速率，已经有点目不暇接了。

即便是不该用olive优化，新驱动在Windows+DirectML环境下，依然利用绘世启动器，就可以得到大约2-3倍的提升，利用RX7900XTX 24GB显卡时，一张512×512的出图韶光从原来的大约30-50秒提升到10-15秒旁边，效果非常明显！
当然，还是比不过利用Olive进行优化后的性能，此时性能直追同价位N卡！

但是如果我说，这还不是A卡跑AI的完全性能呢？要想彻底开释性能，后面还有一招！

ROCm+Linux，彻底开释！

而想要彻底开释显卡的性能，就得抛弃效率低下的Windows，改用效率极高的Linux了。
在Linux下，装好Python+Anaconda或者Miniconda，支配Stable Diffusion，抛弃效率低下的DirectML改用ROCm跑CUDA，可以完备开释显卡的性能！
这块的支配就太繁芜了，小弟也没能力考试测验，这里供应大神的教程供参考。

根据文章中的说法，一张RX7900XT 20GB天生512×512的图大约须要1.4秒，相较于上面的Olive方案又大约快了1-2倍旁边，如果把默认的绘世启动器DirectML效率算作1x的话，Olive方案效率大约是3~5x，ROCm效率大约是8~10x，还是相称可不雅观的！
不过从普通用户来说，一张图10秒还是一张图2秒，差异都不是太大！
大概对集成显卡和低端显卡用户意义比较大吧，重点还是创意和模型的利用，毕竟电脑只是工具，最主要的还是如何利用它！

每期AI知识网

太简单了全免费最简单省事的3分钟上手 AMD 显卡 AI 跑图教程

AI帮世界上最孤独植物找对象

喷鼻香蕉自己用软件画的哦你想考试测验一下吗