位置: IT常识 - 正文

基于so-vits-svc语音模型实现AI翻唱歌曲(svc语法)

编辑:rootadmin
基于so-vits-svc语音模型实现AI翻唱歌曲

目录

获取数据集

开始训练

开始推理(翻唱)


获取数据集

推荐整理分享基于so-vits-svc语音模型实现AI翻唱歌曲(svc语法),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:基于sysml,sov语言,svc语法,基于svm,sov语言,sov型语言是什么意思,基于svm,sov型语言举例,内容如对您有帮助,希望把文章链接给更多的朋友!

工具整合包来源

【AI翻唱/SoVITS 4.0】手把手教你老婆唱歌给你听~无需配置环境的本地训练/推理教程[懒人整合包]_哔哩哔哩_bilibilihttps://www.bilibili.com/video/BV1H24y187Ko/?spm_id_from=333.1007.top_right_bar_window_custom_collection.content.click&vd_source=bd7513aedfc5a6d9d2da276ca29e3cb5

音频来源

QQ音乐-HQ高品质下载

zutomayo的歌曲列表

Dear Mr [F]

去和声、混响、切片按上面教程来就好了

已得到数据集

本地硬件水平有限,上云端GPU服务器训练

【so-vits-svc】手把手教你老婆唱歌_哔哩哔哩_bilibilihttps://www.bilibili.com/video/BV1vM4y1S7zB/?vd_source=bd7513aedfc5a6d9d2da276ca29e3cb5

AutoDL上选一个好显卡,镜像为up的改进版(加了webui和补充了很多注释)

资源清单

显卡:A5000,cuda版本11.6

镜像:so-vits-svc-webui

按readme.ipynb步骤走,最后开始训练

开始训练

训练的相关细节(config.json)

关于训练过程几个指标的关系参考如下

(167条消息) so-vits-svc3.0 中文详细安装、训练、推理使用教程_Sucial的博客-CSDN博客https://blog.csdn.net/Sucial/article/details/129104472

上面最多语音说话人的语音数可以理解为训练集大小,也就是说训练集越大,batch_size越小,训练就越快,但训练集比较大时,batch_size调太小猜测有可能会对训练效果产生影响 

一次处理数据集的数量:batch_size

如果数据集比较小,则推荐设置得小一点,比如我这次训练只是当作测试,数据集只用了一首歌,切成了12份,数据集大小就只有12,batch_size就只设置成了2,如果设置得太大会导致训练很久都训练不出一个模型,batch_size太大据说也比较吃显存,推荐设置成12以内,数据集很大再调高点

基于so-vits-svc语音模型实现AI翻唱歌曲(svc语法)

训练速度:learning_rate

按readme说两者要成正比,我batch_size调成了2,learning_rate调成了0.000033,训练速度不是看epoch的打印快慢,可以参照输出模型的快慢或者输出评估信息的快慢

隔多久输出一次评估信息:log_interval

注意不是代表打印多少次epoch,数据集越小、batch_size越大需要越多的epoch才能输出一次评估信息

下方是评估信息,各个浮点数的值越小代表损失越小,效果越好,不太熟悉可以不管

隔多久输出一次模型:eval_interval

注意不是代表打印多少次epoch,数据集越小、batch_size越大需要越多的epoch才能输出一次模型,输出模型就是log/44k目录下的那些G_开头的pth文件,D_开头的不能用

修改后的config.json如下

QA

停止后继续训练

So-VITS-SVC 4.0 训练/推理常见报错和Q&A - 哔哩哔哩 (bilibili.com)https://www.bilibili.com/read/cv22206231/

训练不出模型

个人记录VITS使用问题(先发一些,持续摸索) - 哔哩哔哩 (bilibili.com)https://www.bilibili.com/read/cv22071912/

开始推理(翻唱)

按改进版镜像中的readme使用webui来推理

Webui中只能转换wav文件,其他格式控制台报错要求我们先装ffmpeg把其他格式转成wav,那些可调参数似乎还不能改,改了就转不成了

为了不爆现存,我本地将歌曲(米泽园的POWDER SNOW)先用UVR分成人声和bgm,将人声用AU切分成每段最长1分钟,一段段传到webui上转换后再下回本地

然后再使用AU将多段音频合成完整一段人声(复制音频粘贴到另一段音频后面),还要使用混合音轨将完整人声和前面的bgm分别拉进两段音轨里并对齐开头

右键混音会话为新建文件,左侧工作区多了一个音频

双击后全选整段音频右键保存,即可得到最后的完整AI音频

本文链接地址:https://www.jiuchutong.com/zhishi/295289.html 转载请保留说明!

上一篇:关于WEB-INF目录及Tomcat部署方式、原理的简单理解(web-inf lib)

下一篇:HTML表格合并行和列(html表单合并行)

  • 小米12怎么设置来电闪光灯(小米12怎么设置动态壁纸)

    小米12怎么设置来电闪光灯(小米12怎么设置动态壁纸)

  • mx230显卡什么水平(mx230显卡好不好)

    mx230显卡什么水平(mx230显卡好不好)

  • 唯品会自动抢货成功率大吗(唯品会自动抢货是别人退的吗)

    唯品会自动抢货成功率大吗(唯品会自动抢货是别人退的吗)

  • siri唤醒词能改嘛(siri能不能更改唤醒词)

    siri唤醒词能改嘛(siri能不能更改唤醒词)

  • 华为荣耀30和p30有什么区别(华为荣耀30和荣耀30青春版手机壳一样吗)

    华为荣耀30和p30有什么区别(华为荣耀30和荣耀30青春版手机壳一样吗)

  • 苹果x下载软件没反应(苹果X下载软件每次都要输入ID密码)

    苹果x下载软件没反应(苹果X下载软件每次都要输入ID密码)

  • 华为手机微信来信息没有声音怎么回事(华为手机微信来语音不响铃怎么设置)

    华为手机微信来信息没有声音怎么回事(华为手机微信来语音不响铃怎么设置)

  • 网络适配器有感叹号不能上网(网络适配器有感叹号,错误代码56)

    网络适配器有感叹号不能上网(网络适配器有感叹号,错误代码56)

  • 抖音极速版怎么提现到微信(抖音极速版怎么填写别人的邀请码)

    抖音极速版怎么提现到微信(抖音极速版怎么填写别人的邀请码)

  • 抖音视频上传成功但是别人看不到(抖音视频上传成功后看非常卡顿)

    抖音视频上传成功但是别人看不到(抖音视频上传成功后看非常卡顿)

  • 苹果6plus能升级13吗(苹果6plus能升级15吗)

    苹果6plus能升级13吗(苹果6plus能升级15吗)

  • 抖音资料不合法 修改不过来怎么办(抖音上资料不合法什么意思)

    抖音资料不合法 修改不过来怎么办(抖音上资料不合法什么意思)

  • 抖音显示超级乐迷什么意思(抖音显示超级乐队怎么弄)

    抖音显示超级乐迷什么意思(抖音显示超级乐队怎么弄)

  • 华为nova5pro电池不耐用(华为nova5pro电池参数)

    华为nova5pro电池不耐用(华为nova5pro电池参数)

  • 华为恢复微信撤回消息(华为恢复自己微信撤回的消息)

    华为恢复微信撤回消息(华为恢复自己微信撤回的消息)

  • 快接单怎么开通(快接单怎么弄)

    快接单怎么开通(快接单怎么弄)

  • 相册管家有什么功能(相册管家作用)

    相册管家有什么功能(相册管家作用)

  • 小米9多少倍变焦(小米九几倍光学变焦)

    小米9多少倍变焦(小米九几倍光学变焦)

  • word邮件合并功能怎么用(Word邮件合并功能是指)

    word邮件合并功能怎么用(Word邮件合并功能是指)

  • qq号搜不到(为啥搜索qq号搜不到)

    qq号搜不到(为啥搜索qq号搜不到)

  • 短视频app应该怎么开发(短视频app应该怎么选择)

    短视频app应该怎么开发(短视频app应该怎么选择)

  • urlproc.exe是什么进程 有什么作用(url是什么格式的文件怎么打开)

    urlproc.exe是什么进程 有什么作用(url是什么格式的文件怎么打开)

  • 补缴税款需要去税务大厅吗
  • 金税盘费服务费记入什么科目
  • 二季度申报时间
  • 小规模纳税人开票税率
  • 普票冲红原票要退回吗
  • 企业职工保险如何转灵活就业
  • 盘盈固定资产属于企业的会计差错
  • 厂家试驾车和经销商试驾车
  • 行政事业单位收据样本
  • 企业支付个人借款利息要扣个税吗
  • 进口的原材料没有发票
  • 专票信息内容
  • 联营扣点怎么核算保本费用
  • 小规模企业所得税优惠政策最新2023
  • 消费税和增值税的不同之处
  • 销售已使用过的固定资产增值税
  • 发票上折扣怎么记账
  • 未及时申报个税的理由
  • 失业保险费退还计入什么科目
  • 资本弱化管理规定最新
  • 0x0000709怎么解决
  • 没有实缴的股份转让要交个人所得税吗
  • 大额医疗救助金怎么申请
  • 预提费用利息会增加吗
  • php输出姓名
  • 国有企业所得税政策
  • 安装虚拟windows
  • 获取vue实例
  • php优秀代码
  • 巴黎拉丁区有个著名的人文景点叫做先贤祠
  • 关于php中一些字符的数据
  • thinkphp获取数据库数据
  • 软件折旧费
  • 增值税系统技术维护费 减免政策
  • 上个月成本做多了怎么冲账
  • 以房租入股股份怎么计算
  • 建造合同新准则
  • Mysql半同步复制原理及问题排查
  • 小规模纳税人进项发票怎么做账
  • 小于500的费用没有发票怎么做账
  • 结转各项成本的会计分录
  • 收回投资收到的现金减少
  • 印花税报少了交税了怎么办
  • 现金存银行会有记录吗
  • mysql8绿色版安装
  • 印花税减半征收优惠政策2021
  • 外贸企业增值税申报
  • 跨月开票的业务怎么做
  • 会计事务所给的发票
  • 小规模纳税人开票限额是多少
  • 代扣代缴完税凭证抵扣期限
  • 运费未付的会计分录怎么做
  • 应收账款平均余额公式
  • 什么是电子商业承兑汇票贴现
  • 房产开发企业以什么为主
  • 财政专用存款账户
  • 公司私营企业
  • mysql解压版安装教程5.7.20
  • 免费获取windows8.1
  • WIN10系统更新之后无法启动
  • linux crontab -e
  • winxp如何修改密码
  • win7无线网络显示x无法启用
  • js实现无缝轮播
  • 每日一个linux命令
  • 批处理新建多个文件夹
  • django 实例
  • 管道的实现
  • nodejs搭建本地服务器运行html
  • python3.5 + PyQt5 +Eric6 实现的一个计算器代码
  • Python字符串大写
  • python str()怎么用
  • 基于javascript的毕业设计
  • unity meshcollider
  • call和apply用法
  • js弹出对话框的命令
  • 西藏五个确保是什么?
  • 代收工会经费标准规定
  • 出口退税网上申报流程
  • 税收收入弹性值
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设