.:. 草榴社區 » 技術討論區 » 一分钟 复制你的声音  AI声音克隆GPT-SoVITS轻松复克你喜欢的声音
本頁主題: 一分钟 复制你的声音  AI声音克隆GPT-SoVITS轻松复克你喜欢的声音字體大小 寬屏顯示 只看樓主 最新點評 熱門評論 時間順序
weichaong


級別:新手上路 ( 8 )
發帖:142
威望:17 點
金錢:274 USD
貢獻:0 點
註冊:2022-02-10

一分钟 复制你的声音  AI声音克隆GPT-SoVITS轻松复克你喜欢的声音

【小白教程】GPT-SoVITs-v2从零开始训练声音克隆教程

GPT-SoVITS是一个开源的声音克隆项目,该语音合成工具结合了GPT模型和SoVITS变声器技术,仅需通过少量的样本数据实现高质量的语音克隆和文本到语音转换。 该工具特别适用于需要快速生成特定人声的场景,可以帮助用户在没有或只有少量目标说话人语音样本的情况下,训练出能够模仿该说话人声音的模型。,支持中、英、日、韩、粤物种语种,现在1分钟的参考音频就能训练出很好的效果。跟着这个教程操作一遍你也能配出你想要的声音了




 

找到软件包解压在没有中文路径的文夹内。
找到go-webui.bat 双击运行,
 

稍等片刻即可启动webUI界面 .

直接到语音切分工具项目,
 

在音频自动切分输入路径。框内。填上想要复刻声音的音频的路径.。没有音频的话现做一个。
打开微信小程序,搜出配音神器这个小程序,做出一个没有杂音的纯声音。

 

随便找段文子粘帖进来,然后选择一个你喜欢的声音,点合成。不是会员有字数限制,一次不能超过一千字。合成后下载到电脑上。
回到软件,把合成好的音频路径复制粘帖框内。输出路径默认不用动,这些数值不懂就不要改它们,保持默认就行。点击开启语音切割。就会把音频切成一段一段的。切好的音频在这个output\slicer_opt文件夹里。这个音频纯没有杂音直接到到第三步离线批量asr。
 

找到刚切割好的音频文件夹右键复制文件夹地址。粘贴到文件夹路径内,有引号的把前后的引号删掉。其它不用动,就可以开启离线批量asr。
 

看到这面框里asr任务完成就可以进行下一步打标了。就是检查切割的音频和文字 停顿对不对。
 


在是否开启打标webui前打勾,等待一会就打开另一个页面。
 


每句都有听都要对前面的文字对不对。就是这个地方比较费时间,要耐心检查好。有修改的话修改一次就点一下上面的提交文本,很重要,太长的超过十秒的音频或大短的音频或音不准的就删掉。 
这一页检查完后点下一页继续检查。太长的超过十秒的音频删掉。所以每个修改都要点提交文本保存一下。
全部检查完好后关闭这个页面。还要把打标的的勾去掉。
 

再回到页面上这个地方开启下一步。这里打上模型名称。点击最下面的开启一键三连。
 

一键三连结束后接着下一个节目。在1A的边上点开1B微调训练,
 

参数默认,要是显存低的话就修改前面第一个数。点击开启SoVITS训练 。 

页面看不出反应去后台看看。训练快慢由电脑性能决定。
 

只有一张显卡的话要等到SoVITS训练完成,再开启gpt训练。
 


来后台看看gpt也是一会儿就好了,
 

训练好的模型在GPT_weights_v2和SoVITS_weights_v2这两个文件夹里。要是你的是第一版本的话就在GPT_weights和SoVITS_weights文件夹。到此我们想要的声音就克隆好了
我们用刚做好的模型来配个音试试。
 

点击最后一个IC推理。选择要用的模型。没找到刚才命名的模型没关系,点旁边的刷新刷新一下模型库。就能看到了,
 

在这里打勾就能打开推理页面,
 

这里要放入一段十秒内的参考音频 。就用刚才切割的音频就可以,开启文字参考输入文字。输入要合成的文字。
 

点击合成。就能复制好喜欢的声音了。
收集了一些网络主播声音模型.欢迎试用
 
【下载地址】:GPT-SOVITS


 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 



赞(55)
DMCA / ABUSE REPORT | TOP Posted: 11-23 16:55 發表評論
.:. 草榴社區 » 技術討論區

電腦版 手機版 客戶端 DMCA
用時 0.01(s) x3, 11-24 15:34