分享
实战教程:基于 Sovits 的声音训练及推理
输入“/”快速插入内容
实战教程:基于 Sovits 的声音训练及推理
飞书用户8537
飞书用户9793
2024年9月3日修改
👋 欢迎来到 SVC 的世界!
Sovits 是一个音声转换的项目,可以将已有的歌声或者语音中的声线换成你想要的声线,从而达到“翻唱”的效果。
原作者是
bilibili@羽毛布団
的 So-VITS-SVC 一站式整合包的用户手册。
本文结合原文,并添加了关键步骤的截图
,方便大家学习。如有问题,可以查看原文,有更专业的讲解
。
原文地址:
https://www.yuque.com/umoubuton/ueupp5
视频教程地址:
https://www.bilibili.com/video/BV1H24y187Ko/?spm_id_from=333.788&vd_source=35e62d366d8173e12669705f7aedd122
结合另一个视频观看:
https://www.bilibili.com/video/BV1ea4y1G7gx/?spm_id_from=333.788.recommend_more_video.-1&vd_source=35e62d366d8173e12669705f7aedd122
以下是教程正文:
1,
完整整合包 (v2.3.4)下载
https://pan.baidu.com/s/12u_LDyb5KSOfvjJ9LVwCIQ?pwd=g8n4
提取码:g8n4
解压后如下图:
2,下载
底模 DLC
预训练模型(底模)可以大大减少小数据集的训练难度。整合包内已经自带了底模,并会在训练时自动加载。但是目前
Vec768l12
编码器有一个更强的底模。你可以自行下载并替换原来的底模。
下载地址:
ms903/sovits4.0-768vec-layer12 at main
1 将下载的底模分别改名为
G_0.pth
和
D_0.pth
这里注意源文件名中的 D 和 G,不要搞错了
2 替换到
pre_trained_model/768l12
目录下同名文件,