位置: IT常识 - 正文

基于so-vits-svc语音模型实现AI翻唱歌曲(svc语法)

编辑:rootadmin
基于so-vits-svc语音模型实现AI翻唱歌曲

目录

获取数据集

开始训练

开始推理(翻唱)


获取数据集

推荐整理分享基于so-vits-svc语音模型实现AI翻唱歌曲(svc语法),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:基于sysml,sov语言,svc语法,基于svm,sov语言,sov型语言是什么意思,基于svm,sov型语言举例,内容如对您有帮助,希望把文章链接给更多的朋友!

工具整合包来源

【AI翻唱/SoVITS 4.0】手把手教你老婆唱歌给你听~无需配置环境的本地训练/推理教程[懒人整合包]_哔哩哔哩_bilibilihttps://www.bilibili.com/video/BV1H24y187Ko/?spm_id_from=333.1007.top_right_bar_window_custom_collection.content.click&vd_source=bd7513aedfc5a6d9d2da276ca29e3cb5

音频来源

QQ音乐-HQ高品质下载

zutomayo的歌曲列表

Dear Mr [F]

去和声、混响、切片按上面教程来就好了

已得到数据集

本地硬件水平有限,上云端GPU服务器训练

【so-vits-svc】手把手教你老婆唱歌_哔哩哔哩_bilibilihttps://www.bilibili.com/video/BV1vM4y1S7zB/?vd_source=bd7513aedfc5a6d9d2da276ca29e3cb5

AutoDL上选一个好显卡,镜像为up的改进版(加了webui和补充了很多注释)

资源清单

显卡:A5000,cuda版本11.6

镜像:so-vits-svc-webui

按readme.ipynb步骤走,最后开始训练

开始训练

训练的相关细节(config.json)

关于训练过程几个指标的关系参考如下

(167条消息) so-vits-svc3.0 中文详细安装、训练、推理使用教程_Sucial的博客-CSDN博客https://blog.csdn.net/Sucial/article/details/129104472

上面最多语音说话人的语音数可以理解为训练集大小,也就是说训练集越大,batch_size越小,训练就越快,但训练集比较大时,batch_size调太小猜测有可能会对训练效果产生影响 

一次处理数据集的数量:batch_size

如果数据集比较小,则推荐设置得小一点,比如我这次训练只是当作测试,数据集只用了一首歌,切成了12份,数据集大小就只有12,batch_size就只设置成了2,如果设置得太大会导致训练很久都训练不出一个模型,batch_size太大据说也比较吃显存,推荐设置成12以内,数据集很大再调高点

基于so-vits-svc语音模型实现AI翻唱歌曲(svc语法)

训练速度:learning_rate

按readme说两者要成正比,我batch_size调成了2,learning_rate调成了0.000033,训练速度不是看epoch的打印快慢,可以参照输出模型的快慢或者输出评估信息的快慢

隔多久输出一次评估信息:log_interval

注意不是代表打印多少次epoch,数据集越小、batch_size越大需要越多的epoch才能输出一次评估信息

下方是评估信息,各个浮点数的值越小代表损失越小,效果越好,不太熟悉可以不管

隔多久输出一次模型:eval_interval

注意不是代表打印多少次epoch,数据集越小、batch_size越大需要越多的epoch才能输出一次模型,输出模型就是log/44k目录下的那些G_开头的pth文件,D_开头的不能用

修改后的config.json如下

QA

停止后继续训练

So-VITS-SVC 4.0 训练/推理常见报错和Q&A - 哔哩哔哩 (bilibili.com)https://www.bilibili.com/read/cv22206231/

训练不出模型

个人记录VITS使用问题(先发一些,持续摸索) - 哔哩哔哩 (bilibili.com)https://www.bilibili.com/read/cv22071912/

开始推理(翻唱)

按改进版镜像中的readme使用webui来推理

Webui中只能转换wav文件,其他格式控制台报错要求我们先装ffmpeg把其他格式转成wav,那些可调参数似乎还不能改,改了就转不成了

为了不爆现存,我本地将歌曲(米泽园的POWDER SNOW)先用UVR分成人声和bgm,将人声用AU切分成每段最长1分钟,一段段传到webui上转换后再下回本地

然后再使用AU将多段音频合成完整一段人声(复制音频粘贴到另一段音频后面),还要使用混合音轨将完整人声和前面的bgm分别拉进两段音轨里并对齐开头

右键混音会话为新建文件,左侧工作区多了一个音频

双击后全选整段音频右键保存,即可得到最后的完整AI音频

本文链接地址:https://www.jiuchutong.com/zhishi/295289.html 转载请保留说明!

上一篇:关于WEB-INF目录及Tomcat部署方式、原理的简单理解(web-inf lib)

下一篇:HTML表格合并行和列(html表单合并行)

  • 苹果13怎么调静音模式(苹果13怎么调静音震动在辅助功能上)

    苹果13怎么调静音模式(苹果13怎么调静音震动在辅助功能上)

  • 苹果11可以用华为耳机吗(苹果11可以用华为快充吗)

    苹果11可以用华为耳机吗(苹果11可以用华为快充吗)

  • word怎么设置文本轮廓(word怎么设置文档纸张大小)

    word怎么设置文本轮廓(word怎么设置文档纸张大小)

  • 手机空白处按不出来小窗口(手机空白处长按不动是什么原因)

    手机空白处按不出来小窗口(手机空白处长按不动是什么原因)

  • 腾讯绿钻豪华版是什么(腾讯绿钻豪华版是干嘛用的)

    腾讯绿钻豪华版是什么(腾讯绿钻豪华版是干嘛用的)

  • 美图秀秀怎么给图片换背景(美图秀秀怎么给视频添加音乐)

    美图秀秀怎么给图片换背景(美图秀秀怎么给视频添加音乐)

  • a1876是ipad几代(a1876 ipad)

    a1876是ipad几代(a1876 ipad)

  • 怎样把qq聊天记录转发(怎样把qq聊天记录导出来)

    怎样把qq聊天记录转发(怎样把qq聊天记录导出来)

  • 微信黑名单里面删除了怎么找到联系人(微信黑名单里面的人删除后还在黑名单吗)

    微信黑名单里面删除了怎么找到联系人(微信黑名单里面的人删除后还在黑名单吗)

  • 微信中的视频号是什么(微信中的视频号在哪里找)

    微信中的视频号是什么(微信中的视频号在哪里找)

  • 电脑网络被禁用了怎么打开(电脑无法连接wifi网络是怎么回事)

    电脑网络被禁用了怎么打开(电脑无法连接wifi网络是怎么回事)

  • 淘宝总账单在哪里查(淘宝 总账单)

    淘宝总账单在哪里查(淘宝 总账单)

  • 微信提示语怎么设置(微信提示语怎么关闭)

    微信提示语怎么设置(微信提示语怎么关闭)

  • h5是什么意思(h5页面是什么意思)

    h5是什么意思(h5页面是什么意思)

  • 怎样使微信字体变大(怎样使微信字体变颜色)

    怎样使微信字体变大(怎样使微信字体变颜色)

  • hwt文件怎么打开(hwt文件放哪里)

    hwt文件怎么打开(hwt文件放哪里)

  • 手机怎么拦截垃圾短信(手机怎么拦截垃圾网站)

    手机怎么拦截垃圾短信(手机怎么拦截垃圾网站)

  • 卡西欧钢铁侠抬手灯怎么设置

    卡西欧钢铁侠抬手灯怎么设置

  • 腾讯会员下载后会员到期还能看吗(腾讯会员下载后的视频过期后怎么修改后缀看)

    腾讯会员下载后会员到期还能看吗(腾讯会员下载后的视频过期后怎么修改后缀看)

  • 抖音发图片怎么配音乐(抖音发图片怎么不自动翻页)

    抖音发图片怎么配音乐(抖音发图片怎么不自动翻页)

  • ps放大镜快捷键(ps放大镜快捷键是什么)

    ps放大镜快捷键(ps放大镜快捷键是什么)

  • 华为p30pro怎么关闭后台(华为p30pro怎么关闭步数显示)

    华为p30pro怎么关闭后台(华为p30pro怎么关闭步数显示)

  • Linux系统ulimit值的正确设置方法(linux中的util值很高)

    Linux系统ulimit值的正确设置方法(linux中的util值很高)

  • atq命令  显示用户待执行任务列表

    atq命令 显示用户待执行任务列表

  • dedecms织梦描述description长度限制修改方法(织梦栏目描述调用)

    dedecms织梦描述description长度限制修改方法(织梦栏目描述调用)

  • 电子缴款凭证和完税证明都可以做原始凭证吗
  • 申报个人所得税在哪里报
  • 主营业务收入净额在利润表里怎么看
  • 季末计提所得税可以根据本年利润计算吗?
  • 审计报告报备
  • 工人工资可以直接记主营业务成本吗
  • 在建工程无发票怎么说明原因
  • 代扣代缴增值税纳税义务发生时间
  • 变更法人流程具体流程图
  • 生产出来的次品怎么入账
  • 财务费用手续费有哪些
  • 出口发票金额和备注了差了1分钱
  • 因质量出问题的事件
  • 员工无息借款个人所得税
  • 个人所得税薪金所得是实发工资还是应发工资
  • 工程交税需要什么资料
  • 超市预付卡开票内容
  • 购买材料未付款怎么做账
  • 水电费计提和冲销
  • 银行承兑汇票开票流程图
  • 同比增长率为负数怎么算
  • 框架采购合同如何计贴印花税?
  • 融资租赁吗
  • 刚注册的有限公司可以马上注销吗
  • 施工企业内部往来核算方法包括( )
  • mac电脑遇到问题而重新启动
  • 进项税大于销项税怎么结转
  • P2PNetworking3.exe - P2PNetworking3是什么进程 有什么用
  • 债券溢折价是什么意思
  • php中imagecreatefromjpeg
  • laravel5.4生成验证码的实例讲解
  • 捐资民办学校可以盈利吗
  • 什么企业需要开具矿产品发票
  • 预缴所得税会计分录咋做
  • 增值税iva
  • 本年利润在借方代表亏损吗
  • 销售返利的账务处理购买方
  • phpcms api
  • 混合销售如何做会计分录
  • 增值税普票和卷式发票
  • 资产负债表的累计折旧
  • 专项扣除影响实绩吗
  • 个税申报错了并撤销
  • 物业公司物业费税率是多少
  • SQL Server实现split函数分割字符串功能及用法示例
  • 变卖固定资产的账务处理
  • 发票入账的管理规定
  • 税金及附加减半征收金额按哪个
  • 其他应付款付不出去怎么处理好
  • 食堂员工私自拿东西怎么办
  • 职工罚款的会计处理办法
  • 贷款减值准备如何计算
  • 研发过程4个主要阶段
  • 税控盘费和服务费一样吗
  • 建账的要点
  • mysql 5.7.12 winx64安装配置方法图文教程
  • sql语句连接方式
  • windows vista电脑
  • win2000安装过程
  • ubuntu系统中安装微信步骤
  • windowssys
  • 在windows中创建用户的步骤
  • ubuntu16.04添加用户
  • 蓝屏错误疑难解答win7
  • linux中内存是2GB,虚拟内存应该是多少
  • linux cut-c
  • win10如何将我的电脑添加到桌面
  • WIN7系统还原
  • win10交接wifi
  • html5能做游戏吗
  • easyui combobox默认选中
  • unityai寻路
  • bat xcopy copy
  • javascript+HTML5自定义元素播放焦点图动画
  • js调用键盘
  • 四川省税务局发票查询
  • 环保税按次申报需要交滞纳金吗
  • 深圳小微企业税收优惠政策2023
  • 安徽国家税务局网上办税平台12366
  • 2021税务稽查重点方向
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设