手把手教你让图像措辞AI图片不再是纸片人。

视频加载中...

如果我见告你这个视频中的人物、声音、动作，乃至说话的文本，全部是由AI自动天生，你相信吗？

这是制作这个视频所利用的唯一一张图片（由AI天生）：

这是说话的文本（由ChatGPT天生）：

这是结合上面的两个来天生视频（由D-ID天生）：

好，下面就来详细先容一下如何实现这个视频的制作。

1、要想让人像说话，首先，你须要得到一张人像的图片。

这个人像你可以用AI天生，也可以利用自己的照片（请勿利用他人照片，这很可能涉及肖像权和伦理问题）。

下面来先容一下如何利用AI来天生图片：

目前利用比较多的文本到图像是通过稳定扩散模型（stable diffusion) 实现,以下简称SD,同样的海内也有比较好的AI绘图模型可以利用，比如头条的#头条AI绘画解锁漫画大片#等……

如果你选择利用SD，则须要本地支配此模型，详细支配教程网上有很多，这里就不做先容了。
支配完毕后，再在webui上输入你想要得到的图像的提示词，之后调度参数，点击天生，便可以得到一张由AI天生的图片。

由于想要让人像动作须要脸部在镜头里比较完全（偏头和侧身都会导致表情天生的偏差），以是这里天生图片时最好搭配controlnet插件掌握图像中人物姿势。

2、得到人物图片后，你就可以准备人物说话的语音文本了。
这个文本可以你自己来写，也可以通过文本对话模型来天生（例现在朝火热的ChatGPT）,这里就不做赘述了。

3、得到图像和语音的文本后，你就可以前往D-ID网站来天生视频了。

你可以利用自己供应的人像，也可以利用网站供应的人物头像，然后输入语音文本，添加得当的停顿点，选择措辞类型和人声模型就可以导出了。
如果你不喜好网站供应的语音模型，也可以自己录音，或去其他网站天生（例如微软Azure或者Narakeet等，实在这几个网站都是相互互助的，语音模型也相差不大）。

把稳，D-ID免费账户每14天只供应20积分的视频制作上限（每15秒花费1积分），因此如果你对这方面需求比较大，则须要付费升级账户。

4、在完成视频制作后，如果想要给视频添加字幕，可以利用剪映，自动识别视频中的语音来天生匹配的字幕。

好了，到这里，你的视频就制作完成了，接下来便是上传到头条给大家分享了[狗头]。

末了，给大家供应几个可供controlnet绑定姿势的图片。
原创不易，转载请注明出处，感激大家的支持和鼓励，再见！

每期AI知识网