位置: IT常识 - 正文

基于so-vits-svc语音模型实现AI翻唱歌曲(svc语法)

编辑:rootadmin
基于so-vits-svc语音模型实现AI翻唱歌曲

目录

获取数据集

开始训练

开始推理(翻唱)


获取数据集

推荐整理分享基于so-vits-svc语音模型实现AI翻唱歌曲(svc语法),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:基于sysml,sov语言,svc语法,基于svm,sov语言,sov型语言是什么意思,基于svm,sov型语言举例,内容如对您有帮助,希望把文章链接给更多的朋友!

工具整合包来源

【AI翻唱/SoVITS 4.0】手把手教你老婆唱歌给你听~无需配置环境的本地训练/推理教程[懒人整合包]_哔哩哔哩_bilibilihttps://www.bilibili.com/video/BV1H24y187Ko/?spm_id_from=333.1007.top_right_bar_window_custom_collection.content.click&vd_source=bd7513aedfc5a6d9d2da276ca29e3cb5

音频来源

QQ音乐-HQ高品质下载

zutomayo的歌曲列表

Dear Mr [F]

去和声、混响、切片按上面教程来就好了

已得到数据集

本地硬件水平有限,上云端GPU服务器训练

【so-vits-svc】手把手教你老婆唱歌_哔哩哔哩_bilibilihttps://www.bilibili.com/video/BV1vM4y1S7zB/?vd_source=bd7513aedfc5a6d9d2da276ca29e3cb5

AutoDL上选一个好显卡,镜像为up的改进版(加了webui和补充了很多注释)

资源清单

显卡:A5000,cuda版本11.6

镜像:so-vits-svc-webui

按readme.ipynb步骤走,最后开始训练

开始训练

训练的相关细节(config.json)

关于训练过程几个指标的关系参考如下

(167条消息) so-vits-svc3.0 中文详细安装、训练、推理使用教程_Sucial的博客-CSDN博客https://blog.csdn.net/Sucial/article/details/129104472

上面最多语音说话人的语音数可以理解为训练集大小,也就是说训练集越大,batch_size越小,训练就越快,但训练集比较大时,batch_size调太小猜测有可能会对训练效果产生影响 

一次处理数据集的数量:batch_size

如果数据集比较小,则推荐设置得小一点,比如我这次训练只是当作测试,数据集只用了一首歌,切成了12份,数据集大小就只有12,batch_size就只设置成了2,如果设置得太大会导致训练很久都训练不出一个模型,batch_size太大据说也比较吃显存,推荐设置成12以内,数据集很大再调高点

基于so-vits-svc语音模型实现AI翻唱歌曲(svc语法)

训练速度:learning_rate

按readme说两者要成正比,我batch_size调成了2,learning_rate调成了0.000033,训练速度不是看epoch的打印快慢,可以参照输出模型的快慢或者输出评估信息的快慢

隔多久输出一次评估信息:log_interval

注意不是代表打印多少次epoch,数据集越小、batch_size越大需要越多的epoch才能输出一次评估信息

下方是评估信息,各个浮点数的值越小代表损失越小,效果越好,不太熟悉可以不管

隔多久输出一次模型:eval_interval

注意不是代表打印多少次epoch,数据集越小、batch_size越大需要越多的epoch才能输出一次模型,输出模型就是log/44k目录下的那些G_开头的pth文件,D_开头的不能用

修改后的config.json如下

QA

停止后继续训练

So-VITS-SVC 4.0 训练/推理常见报错和Q&A - 哔哩哔哩 (bilibili.com)https://www.bilibili.com/read/cv22206231/

训练不出模型

个人记录VITS使用问题(先发一些,持续摸索) - 哔哩哔哩 (bilibili.com)https://www.bilibili.com/read/cv22071912/

开始推理(翻唱)

按改进版镜像中的readme使用webui来推理

Webui中只能转换wav文件,其他格式控制台报错要求我们先装ffmpeg把其他格式转成wav,那些可调参数似乎还不能改,改了就转不成了

为了不爆现存,我本地将歌曲(米泽园的POWDER SNOW)先用UVR分成人声和bgm,将人声用AU切分成每段最长1分钟,一段段传到webui上转换后再下回本地

然后再使用AU将多段音频合成完整一段人声(复制音频粘贴到另一段音频后面),还要使用混合音轨将完整人声和前面的bgm分别拉进两段音轨里并对齐开头

右键混音会话为新建文件,左侧工作区多了一个音频

双击后全选整段音频右键保存,即可得到最后的完整AI音频

本文链接地址:https://www.jiuchutong.com/zhishi/295289.html 转载请保留说明!

上一篇:关于WEB-INF目录及Tomcat部署方式、原理的简单理解(web-inf lib)

下一篇:HTML表格合并行和列(html表单合并行)

  • OPPO Ace2搭配了几种颜色呢(oppo ace2优点和缺点)

    OPPO Ace2搭配了几种颜色呢(oppo ace2优点和缺点)

  • 电脑慢怎么处理(电脑慢怎么办电脑慢怎么处理)

    电脑慢怎么处理(电脑慢怎么办电脑慢怎么处理)

  • 0电压18650电池复活(18650零电压)

    0电压18650电池复活(18650零电压)

  • 虎牙观看的人数都是真实的吗(虎牙观看人数真实吗)

    虎牙观看的人数都是真实的吗(虎牙观看人数真实吗)

  • imovie怎么下载不了(imovie视频下载)

    imovie怎么下载不了(imovie视频下载)

  • iphonex和11pro屏幕对比(iphonex和11pro屏幕一样吗)

    iphonex和11pro屏幕对比(iphonex和11pro屏幕一样吗)

  • 移动网络慢怎么设置最快(移动网络慢怎么设置切换联通网)

    移动网络慢怎么设置最快(移动网络慢怎么设置切换联通网)

  • 华为手机颜色反转怎么设置(华为手机颜色反转怎么关闭)

    华为手机颜色反转怎么设置(华为手机颜色反转怎么关闭)

  • 电脑垃圾软件怎么卸载(电脑垃圾软件怎么彻底清除win10)

    电脑垃圾软件怎么卸载(电脑垃圾软件怎么彻底清除win10)

  • 网络显示h是啥意思(脸上长痣都什么意思)

    网络显示h是啥意思(脸上长痣都什么意思)

  • dc调光对手机有坏处吗(手机dc调光会增加手机耗电量吗)

    dc调光对手机有坏处吗(手机dc调光会增加手机耗电量吗)

  • 荣耀20s有红外吗(华为荣耀20s有红外功能吗)

    荣耀20s有红外吗(华为荣耀20s有红外功能吗)

  • 卖了天猫积分对淘宝号有影响吗(天猫积分卖钱)

    卖了天猫积分对淘宝号有影响吗(天猫积分卖钱)

  • 苹果手机怎么下载东西(苹果手机怎么下载来电铃声)

    苹果手机怎么下载东西(苹果手机怎么下载来电铃声)

  • 手机qq日志怎么删除(手机QQ日志怎么删除)

    手机qq日志怎么删除(手机QQ日志怎么删除)

  • 魅族16th开发者选项在哪里(魅族16th开发者选项设置)

    魅族16th开发者选项在哪里(魅族16th开发者选项设置)

  • 酷狗购买的专辑可以送给好友吗(酷狗购买的专辑可以退吗)

    酷狗购买的专辑可以送给好友吗(酷狗购买的专辑可以退吗)

  • bclk频率调多少(bclk频率是100怎么调)

    bclk频率调多少(bclk频率是100怎么调)

  • t分布-分位数表(T分布分位数表完整版)

    t分布-分位数表(T分布分位数表完整版)

  • 多闪能看到访客记录吗(多闪能看见访客吗)

    多闪能看到访客记录吗(多闪能看见访客吗)

  • vivox27上面摄像头怎么打开(vivox27的摄像头怎么弹出来)

    vivox27上面摄像头怎么打开(vivox27的摄像头怎么弹出来)

  • 怎么获得Win1021h1激活码 最新21h1系统密钥推荐(怎么获得win10纯净版)

    怎么获得Win1021h1激活码 最新21h1系统密钥推荐(怎么获得win10纯净版)

  • 不是 Bug,微软确认 Win11 任务栏不再支持一些功能特性(微软不包括)

    不是 Bug,微软确认 Win11 任务栏不再支持一些功能特性(微软不包括)

  • Dedecms 生成RSS地图地址出错修改方法(dedecms手册)

    Dedecms 生成RSS地图地址出错修改方法(dedecms手册)

  • 小规模纳税人企业所得税计算
  • 固定资产的入账
  • 长期股权投资其他综合收益什么时候转留存收益
  • 简易计税开的发票可以抵扣吗
  • 征税和补贴对市场结果的影响
  • 小规模税控设备维护费怎么填申报表格
  • 企业接收捐赠的会计分录
  • 新会计准则有预提费用吗
  • 印花税法律制度规定不征收印花税的是什么
  • 营改增以后小规模纳税人如何纳税
  • 房地产企业增值税预缴
  • 先抵押 后租赁
  • 门店里备用客户喝的茶叶怎么入账?
  • 初级备考计划表
  • 建筑公司如何结算成本
  • 加盟费是一年一收还是终身的
  • 海关进口增值税和关税怎么入账
  • 上月计提费用下月一定要冲回吗
  • 独享20m网速快吗
  • 一次性支付一年租金怎么做账
  • windows待机密码
  • 环形链表入口节点
  • php 读取文本文件
  • 过桥资金账务处理
  • 出口退税率为0怎么处理
  • 所有者权益类的期末余额公式
  • 借款利息还能再算利息吗
  • 瑞士·劳特布龙嫩小镇
  • 二手车销售发票的开具怎么处理?
  • 大数据可视化前端界面模板
  • Smarty实现页面静态化(生成HTML)的方法
  • vue路由传参的几种方式
  • uni-app原理
  • 小程序和h5页面的区别
  • 前端开发做什么副业
  • parted命令详解
  • 10-Ajax&Vue
  • 数据库 元数据
  • 协议、合同
  • 分公司申请独立账户流程
  • 取得不规范发票的处理
  • 申报水利基金的流程
  • 2.MyBatis
  • python struct库
  • 企业的净资产都有哪些
  • 报废产品属于什么会计科目
  • 小微企业认定需要哪些资料
  • 信用减值损失如何列报
  • 持有至到期投资和债权投资的区别
  • 其他应付款在借方资产负债表怎么填
  • 扣缴个人所得税怎么计算
  • 票据贴现的分录
  • 公司人事怎么办公积金提取流程?
  • 电子承兑汇票怎么查询
  • 人力资源公司的进项票有哪些
  • 公司卖掉软件计入成本吗
  • 联想s5s531笔记本M2
  • yAssistSe.exe是什么进程
  • win7 win8 win8.1
  • 微软何时推出win10
  • win10ipv4 ipv6无internet访问权限
  • jquery中attr和prop
  • unity3D游戏开发
  • css div内容自动换行
  • bootstrap页头
  • flask开发实例
  • nodejs搭建本地资源服务器
  • three.js入门指南
  • javascript数据
  • jquery search
  • python爬虫京东
  • android开源小项目
  • js验证码代码怎么写
  • 从局部变量和全变量区分
  • 陕西省地方税务局关于调整土地增值税预征率的公告
  • 中国纳税大户排行
  • 南京江宁区地税局待遇(南京各个区税务局待遇)
  • 不用税控盘可以清卡吗
  • 青霉素过敏是因为提纯不好吗
  • 国税发票什么意思
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设