前言
东雪莲可以和间眠大佐切割,我认为东雪莲也可以和锤头鲨本鲨切割。
首先 我不是棺材板
其次,准备开始了。
先品鉴一段
再来一段日配
文字-语音(GPT-SoVITS)
1 配置环境
1.1 Conda
先拉取最新的仓库
$ git clone https://github.com/RVC-Boss/GPT-SoVITS/
然后创建一个conda环境 并且安装所需要的包
在安装之前你应该手动安装一下pytorch来避免一会自动安装的torch没有gpu用
去pytorch官网查看怎么使用pip 安装最新的pytorch即可
然后安装requirements.txt
$ pip install -r requirements.txt
之后大概率会报错到爽
原因是你没有安装cpp相关工具,所以jieba_fast等一系列库无法被编译,这有两个解决办法,一是直接下载.whl文件安装,或者直接下载vc,我推荐后者一劳永逸
Microsoft C++ 生成工具 – Visual Studio
请下载并安装这个,然后重新执行上述命令。
不出意外应该就装好了这一堆库了,但是还是不能用的。
因为装的pytorch大概率是没有cuda版本的,用cpu嗯算需要耗费非常多的时间与电费,所以需要卸载pytorch后
$ pip uninstall pytorch
去pytorch官网:PyTorch选择你的环境并且复制命令安装。
$ pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
#just a example modlfile it by yourself
下一步就可以开始推理了
需要先训练模型
训练 文字-语音(GPT-SoVITS)模型
需要准备一些申必数据集
在启动网页UI之前,需要在config.py中修改本地端口,避免占用其他你正在用的端口。
之后直接启动webui.py
当然训练非常麻烦 我这里提供一个现成的申必模型(东雪莲)
推理 文字-语音(GPT-SoVITS)模型
把模型解压后应该就能在web上看到了,再选择一段参考音频与文字,推荐选择一段特别清晰的。
之后就能让ai莲莲说话了。
so-vits-svc 模型
这个是让东雪莲唱歌的(
首先需要准备数据集