位置: IT常识 - 正文

基于so-vits-svc语音模型实现AI翻唱歌曲(svc语法)

编辑:rootadmin
基于so-vits-svc语音模型实现AI翻唱歌曲

目录

获取数据集

开始训练

开始推理(翻唱)


获取数据集

推荐整理分享基于so-vits-svc语音模型实现AI翻唱歌曲(svc语法),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:基于sysml,sov语言,svc语法,基于svm,sov语言,sov型语言是什么意思,基于svm,sov型语言举例,内容如对您有帮助,希望把文章链接给更多的朋友!

工具整合包来源

【AI翻唱/SoVITS 4.0】手把手教你老婆唱歌给你听~无需配置环境的本地训练/推理教程[懒人整合包]_哔哩哔哩_bilibilihttps://www.bilibili.com/video/BV1H24y187Ko/?spm_id_from=333.1007.top_right_bar_window_custom_collection.content.click&vd_source=bd7513aedfc5a6d9d2da276ca29e3cb5

音频来源

QQ音乐-HQ高品质下载

zutomayo的歌曲列表

Dear Mr [F]

去和声、混响、切片按上面教程来就好了

已得到数据集

本地硬件水平有限,上云端GPU服务器训练

【so-vits-svc】手把手教你老婆唱歌_哔哩哔哩_bilibilihttps://www.bilibili.com/video/BV1vM4y1S7zB/?vd_source=bd7513aedfc5a6d9d2da276ca29e3cb5

AutoDL上选一个好显卡,镜像为up的改进版(加了webui和补充了很多注释)

资源清单

显卡:A5000,cuda版本11.6

镜像:so-vits-svc-webui

按readme.ipynb步骤走,最后开始训练

开始训练

训练的相关细节(config.json)

关于训练过程几个指标的关系参考如下

(167条消息) so-vits-svc3.0 中文详细安装、训练、推理使用教程_Sucial的博客-CSDN博客https://blog.csdn.net/Sucial/article/details/129104472

上面最多语音说话人的语音数可以理解为训练集大小,也就是说训练集越大,batch_size越小,训练就越快,但训练集比较大时,batch_size调太小猜测有可能会对训练效果产生影响 

一次处理数据集的数量:batch_size

如果数据集比较小,则推荐设置得小一点,比如我这次训练只是当作测试,数据集只用了一首歌,切成了12份,数据集大小就只有12,batch_size就只设置成了2,如果设置得太大会导致训练很久都训练不出一个模型,batch_size太大据说也比较吃显存,推荐设置成12以内,数据集很大再调高点

基于so-vits-svc语音模型实现AI翻唱歌曲(svc语法)

训练速度:learning_rate

按readme说两者要成正比,我batch_size调成了2,learning_rate调成了0.000033,训练速度不是看epoch的打印快慢,可以参照输出模型的快慢或者输出评估信息的快慢

隔多久输出一次评估信息:log_interval

注意不是代表打印多少次epoch,数据集越小、batch_size越大需要越多的epoch才能输出一次评估信息

下方是评估信息,各个浮点数的值越小代表损失越小,效果越好,不太熟悉可以不管

隔多久输出一次模型:eval_interval

注意不是代表打印多少次epoch,数据集越小、batch_size越大需要越多的epoch才能输出一次模型,输出模型就是log/44k目录下的那些G_开头的pth文件,D_开头的不能用

修改后的config.json如下

QA

停止后继续训练

So-VITS-SVC 4.0 训练/推理常见报错和Q&A - 哔哩哔哩 (bilibili.com)https://www.bilibili.com/read/cv22206231/

训练不出模型

个人记录VITS使用问题(先发一些,持续摸索) - 哔哩哔哩 (bilibili.com)https://www.bilibili.com/read/cv22071912/

开始推理(翻唱)

按改进版镜像中的readme使用webui来推理

Webui中只能转换wav文件,其他格式控制台报错要求我们先装ffmpeg把其他格式转成wav,那些可调参数似乎还不能改,改了就转不成了

为了不爆现存,我本地将歌曲(米泽园的POWDER SNOW)先用UVR分成人声和bgm,将人声用AU切分成每段最长1分钟,一段段传到webui上转换后再下回本地

然后再使用AU将多段音频合成完整一段人声(复制音频粘贴到另一段音频后面),还要使用混合音轨将完整人声和前面的bgm分别拉进两段音轨里并对齐开头

右键混音会话为新建文件,左侧工作区多了一个音频

双击后全选整段音频右键保存,即可得到最后的完整AI音频

本文链接地址:https://www.jiuchutong.com/zhishi/295289.html 转载请保留说明!

上一篇:关于WEB-INF目录及Tomcat部署方式、原理的简单理解(web-inf lib)

下一篇:HTML表格合并行和列(html表单合并行)

  • opporeno6pro没有原装耳机吗(opporeno6原生壁纸)

    opporeno6pro没有原装耳机吗(opporeno6原生壁纸)

  • 苹果蓝牙耳机首次怎么连接(苹果蓝牙耳机首次配对)

    苹果蓝牙耳机首次怎么连接(苹果蓝牙耳机首次配对)

  • 荣耀v7pro平板有高刷吗(荣耀v7pro平板有没有指纹)

    荣耀v7pro平板有高刷吗(荣耀v7pro平板有没有指纹)

  • 淘宝密码在哪看(淘宝密码在哪里可以看到)

    淘宝密码在哪看(淘宝密码在哪里可以看到)

  • 哔哩哔哩版权受限怎么缓存番剧(哔哩哔哩版权受限怎么缓存视频)

    哔哩哔哩版权受限怎么缓存番剧(哔哩哔哩版权受限怎么缓存视频)

  • 快手发作品能随便定位吗(快手发作品能随便发吗)

    快手发作品能随便定位吗(快手发作品能随便发吗)

  • 视频聊天流量耗的多吗(视频聊天 流量)

    视频聊天流量耗的多吗(视频聊天 流量)

  • 鼠标移动方向突然相反(鼠标移动方向突然相反win11)

    鼠标移动方向突然相反(鼠标移动方向突然相反win11)

  • vivos6处理器相当于麒麟多少(vivos6处理器相当于编辑多少)

    vivos6处理器相当于麒麟多少(vivos6处理器相当于编辑多少)

  • 华为手机最近删除的照片被删了还能恢复吗(华为手机最近删除的视频怎么找回来)

    华为手机最近删除的照片被删了还能恢复吗(华为手机最近删除的视频怎么找回来)

  • 怎么判断显卡是否坏了(怎么判断显卡是不是丐版)

    怎么判断显卡是否坏了(怎么判断显卡是不是丐版)

  • 小爱同学play跟小爱同学区别(小爱同学和play)

    小爱同学play跟小爱同学区别(小爱同学和play)

  • 小米平衡车怎么强制关机(小米平衡车怎么使用)

    小米平衡车怎么强制关机(小米平衡车怎么使用)

  • 电脑垃圾软件怎么卸载(电脑垃圾软件怎么彻底清除win10)

    电脑垃圾软件怎么卸载(电脑垃圾软件怎么彻底清除win10)

  • 怎么设置当前页为横向(怎么设置当前页码为罗马数字)

    怎么设置当前页为横向(怎么设置当前页码为罗马数字)

  • 5类和6类网线怎么分辨(五类和6类网线)

    5类和6类网线怎么分辨(五类和6类网线)

  • 京东退货优惠券退么(京东退货优惠券会退回吗)

    京东退货优惠券退么(京东退货优惠券会退回吗)

  • 小米电视支持3d电影吗(小米电视支持3d功能吗)

    小米电视支持3d电影吗(小米电视支持3d功能吗)

  • tendawifi怎么重新设置(tenda路由器重新设置)

    tendawifi怎么重新设置(tenda路由器重新设置)

  • or函数是什么意思(or函数怎么写)

    or函数是什么意思(or函数怎么写)

  • p30几倍变焦(p30多少倍变焦 p30p多少倍)

    p30几倍变焦(p30多少倍变焦 p30p多少倍)

  • 蓝牙耳机只有一边有声音怎么办(蓝牙耳机只有一只响怎么弄)

    蓝牙耳机只有一边有声音怎么办(蓝牙耳机只有一只响怎么弄)

  • 网易云怎么充值(网易云怎么充值零钱啊)

    网易云怎么充值(网易云怎么充值零钱啊)

  • 陌陌显示未知什么意思(陌陌上一些人显示的未知是什么意思)

    陌陌显示未知什么意思(陌陌上一些人显示的未知是什么意思)

  • 微服务组件-----Spring Cloud Alibaba 注册中心 Nacos源码(1.4.x版本)分析(微服务组件面试题)

    微服务组件-----Spring Cloud Alibaba 注册中心 Nacos源码(1.4.x版本)分析(微服务组件面试题)

  • discuz解决IE8 9 10 支付宝积分充值时,出现空白页的方法(ie8 ie8i)

    discuz解决IE8 9 10 支付宝积分充值时,出现空白页的方法(ie8 ie8i)

  • 税务登记管理办法2023
  • 两年前的发票可以补开吗
  • 劳务派遣差额发票0税率情况
  • 材料暂估入库的摘要怎么写
  • 城市维护建设税是什么意思
  • 发票打印机贵吗
  • 企业所得税汇算清缴退税怎么做账
  • 有形净资产负债率怎么计算
  • 用外购存货投资分录怎么写?
  • 罚款从工资扣除的说明
  • 公司发的现金
  • 软件企业产品如何销售
  • 如何冲销账面上的资金
  • 公司承担的个人所得税怎么做分录
  • 预付账款需要发票吗
  • 营业外支出用什么账户
  • 已开票怎么做坏账处理
  • 购入生产车间
  • 职工食堂对外经营合法吗
  • 在建工程转入长期待摊费用吗
  • 预收账款税收政策
  • 4s店以车换车怎么算的
  • 本月无收入怎样申报?
  • 人力资源管理师考试时间
  • 固定资产不入账是谁的责任
  • 建筑公司采购制度和流程
  • 印花税计税依据及计算方式
  • 工程公司项目经理年薪一般多少
  • 琼斯的大海怪
  • 如何配置无线路由器参数
  • php设计思路
  • 公积金怎么做会计科目
  • 被税怎么办
  • 企业取得的搬迁补贴
  • 待处理财产损益借贷方向
  • 如何免费使用超级简历
  • 哪些情况下公司不能辞退员工
  • 基于中国国情的中国式现代化具有哪些特色
  • delete select语句
  • 《linux内核分析》
  • vue.js如何安装
  • system view命令
  • 退休人员发绩效
  • 财政拨入的科技费是什么
  • 采购的技术服务费需入库吗
  • 图书免增值税具体包括哪些
  • php的do while语句
  • mysql基本命令大全
  • mysql数据库常用sql语句
  • 织梦DedeCMS默认文件夹重命名
  • 印花税申报时间填错造成逾期怎么办
  • 固定资产清理账户借方
  • 申报个税的流程怎么操作
  • 收到以前年度银行手续费发票分录
  • 公司没有车油费可以报销吗
  • 营改增租金收入税率
  • 留底税额怎么形成的
  • 4s店销售走了该找谁
  • 采用公允价值模式计量的投资性房地产不需要计提折旧
  • 主营业务成本账户年终结转后
  • 权益类会计科目有哪些科目
  • Windows7 64位环境下Python-igraph环境配置的方法
  • windows命令行使用
  • windows10玩lol有延迟怎么办
  • mac win10 wifi
  • Win10怎么打开屏幕键盘
  • windows10稳定版本
  • linux服务端
  • win7开机提示音在哪里关闭
  • win10电脑补丁 kb5000802
  • Win10桌面版红石预览版14295更新(修复)、已知问题及解决方案汇总
  • Android Broadcast
  • dos命令批处理
  • div li
  • attributes.add
  • nodejs 模块
  • js字符串的操作方法
  • 全国退休人员有几多人
  • 加计抵减怎么计提分录
  • 缴纳耕地占用税的好处
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设