AI语音业界最强的AI声音克隆软件GPTSoVITS一键包加教程

【AI语音】业界最强的AI声音克隆软件GPT-SoVITS，一键包加图文教程

中文批量离线ASR工具，这里的ASR模型，如果你是中文，达摩和whisper都可以，如果是英文，最好用whisper，经由测试，openai的whisper综合效果最好。
第二步，演习集格式化除了第一个参数“实验/模型名”自行命名外，其他都默认，然后按照下图闭眼点就行了

【AI语音】业界最强的AI声音克隆软件GPT-SoVITS，一键包加图文教程

最后记得点“开启一键三连”第三步，微调演习“每张显卡的batch_size” 这个参数根据自己的显存来选择，12G显存设置8旁边，其他根据自己显存调度。
演习总轮数，第一个建议设置10，第二个15。
也可以根据自己的需求调度，不要太高，声音素材是关键。
否则演习再多轮也没意义。

【AI语音】业界最强的AI声音克隆软件GPT-SoVITS，一键包加图文教程

按照序号，先演习SoVITS，右侧有提示信息，结束后，再演习GPT。
这俩演习都很快，显卡好的，分分钟就完成了。
第四步，推理按照下图步骤，先刷新模型路径，然后选择你演习的模型名称（模型选择后面数字最大的那个，也便是最新的模型），两个都要选

【AI语音】业界最强的AI声音克隆软件GPT-SoVITS，一键包加图文教程

最后记得勾选“是否开启TTS推理WebUI”稍等少焉，TTS推理启动后，会跳转到新的webUI推理页面第五步，TTS语音合成

【AI语音】业界最强的AI声音克隆软件GPT-SoVITS，一键包加图文教程

选择你的模型，参考语音找一段你之前演习用的素材，3-10秒，不要太长，也不要太短。
可以下拉选择，如果下拉没有显示，就在数字4的位置手动选择。
然后勾选数字5的“开启无参考文本模式无参考文本时该选项无效”在数字6的位置输入你要转换的笔墨，末了合针言音。

一键包下载：https://pan.baidu.com/s/1mulxy1ticeYBOaQu_Kamng?pwd=7879

每期AI知识网