视频加载中...

如果我见告你这个视频中的人物、声音、动作,乃至说话的文本,全部是由AI自动天生,你相信吗?

这是制作这个视频所利用的唯一一张图片(由AI天生):

这是说话的文本(由ChatGPT天生):

手把手教你让图像措辞AI图片不再是纸片人。

这是结合上面的两个来天生视频(由D-ID天生):

好,下面就来详细先容一下如何实现这个视频的制作。

1、要想让人像说话,首先,你须要得到一张人像的图片。

这个人像你可以用AI天生,也可以利用自己的照片(请勿利用他人照片,这很可能涉及肖像权和伦理问题)。

下面来先容一下如何利用AI来天生图片:

目前利用比较多的文本到图像是通过稳定扩散模型(stable diffusion) 实现,以下简称SD,同样的海内也有比较好的AI绘图模型可以利用,比如头条的#头条AI绘画解锁漫画大片#等……

如果你选择利用SD,则须要本地支配此模型,详细支配教程网上有很多,这里就不做先容了。
支配完毕后,再在webui上输入你想要得到的图像的提示词,之后调度参数,点击天生,便可以得到一张由AI天生的图片。

由于想要让人像动作须要脸部在镜头里比较完全(偏头和侧身都会导致表情天生的偏差),以是这里天生图片时最好搭配controlnet插件掌握图像中人物姿势。

2、得到人物图片后,你就可以准备人物说话的语音文本了。
这个文本可以你自己来写,也可以通过文本对话模型来天生(例现在朝火热的ChatGPT),这里就不做赘述了。

3、得到图像和语音的文本后,你就可以前往D-ID网站来天生视频了 。

你可以利用自己供应的人像,也可以利用网站供应的人物头像,然后输入语音文本,添加得当的停顿点,选择措辞类型和人声模型就可以导出了。
如果你不喜好网站供应的语音模型,也可以自己录音,或去其他网站天生(例如微软Azure或者Narakeet等,实在这几个网站都是相互互助的,语音模型也相差不大)。

把稳,D-ID免费账户每14天只供应20积分的视频制作上限(每15秒花费1积分),因此如果你对这方面需求比较大,则须要付费升级账户。

4、在完成视频制作后,如果想要给视频添加字幕,可以利用剪映,自动识别视频中的语音来天生匹配的字幕。

好了,到这里,你的视频就制作完成了,接下来便是上传到头条给大家分享了[狗头]。

末了,给大家供应几个可供controlnet绑定姿势的图片。
原创不易,转载请注明出处,感激大家的支持和鼓励,再见!