【AI语音】业界最强的AI声音克隆软件GPT-SoVITS,一键加图文教程

中文批量离线ASR工具,这里的ASR模型,如果 你是中文,达摩和whisper都可以,如果是英文,最好用whisper,经由测试,openai的whisper综合效果最好。
第二步,演习集格式化除了第一个参数“实验/模型名”自行命名外,其他都默认,然后按照下图闭眼点就行了

【AI语音】业界最强的AI声音克隆软件GPT-SoVITS,一键包加图文教程

最后记得点“开启一键三连”第三步,微调演习“每张显卡的batch_size” 这个参数根据自己的显存来选择,12G显存设置8旁边,其他根据自己显存调度。
演习总轮数,第一个建议设置10,第二个15。
也可以根据自己的需求调度,不要太高,声音素材是关键。
否则演习再多轮也没意义。

AI语音业界最强的AI声音克隆软件GPTSoVITS一键包加教程

【AI语音】业界最强的AI声音克隆软件GPT-SoVITS,一键包加图文教程

按照序号,先演习SoVITS,右侧有提示信息,结束后,再演习GPT。
这俩演习都很快,显卡好的,分分钟就完成了。
第四步,推理按照下图步骤,先刷新模型路径,然后选择你演习的模型名称(模型选择后面数字最大的那个,也便是最新的模型),两个都要选

【AI语音】业界最强的AI声音克隆软件GPT-SoVITS,一键包加图文教程

最后记得勾选“是否开启TTS推理WebUI”稍等少焉,TTS推理启动后,会跳转到新的webUI推理页面第五步,TTS语音合成

【AI语音】业界最强的AI声音克隆软件GPT-SoVITS,一键包加图文教程

选择你的模型,参考语音找一段你之前演习用的素材,3-10秒,不要太长,也不要太短。
可以下拉选择,如果下拉没有显示,就在数字4的位置手动选择。
然后勾选数字5的“开启无参考文本模式 无参考文本时该选项无效”在数字6的位置输入你要转换的笔墨,末了合针言音。

一键包下载:https://pan.baidu.com/s/1mulxy1ticeYBOaQu_Kamng?pwd=7879