碧蓝档案吧 关注:423,882贴子:10,582,864

回复:让你的学生开口唱歌!RVC云端训练指南

只看楼主收藏回复



IP属地:山东来自Android客户端18楼2024-09-12 02:41
回复
    cy


    IP属地:福建来自Android客户端19楼2024-09-12 11:22
    回复


      IP属地:浙江来自Android客户端20楼2024-09-12 12:25
      回复
        前排(?)支持


        IP属地:山东来自Android客户端21楼2024-09-12 20:26
        回复
          我为什么推荐各位使用RVC,其一,RVC训练所需数据集少(10分钟即可,也就是说只要有换皮的学生就可以开练)其二,相对于so-vits-svc,RVC的下限更高,在数据集质量较差的情况,RVC的效果更好(众所周知你游很多语音音质都只能用悲剧来形容,当然so-vits-svc的上限是比RVC高的),其三,RVC的云端训练成本低,一般可以控制在1元以内。


          IP属地:四川22楼2024-09-12 21:31
          回复
            那么什么样的声音适合AI翻唱呢?大多数情况下,音声偏亮的声音更适合,例如:优香,和纱,而音声较暗的不太适合,例如佳代子,纱织,这些声音训练出的模型,音域窄,一般而言效果不会太好。


            IP属地:四川23楼2024-09-12 22:43
            回复
              假期边练模型边写算了


              IP属地:四川24楼2024-09-12 22:59
              回复
                ddsp需要的训练集好像也不是很多,而且不那么吃配置,但是我目前还没练过歌声。我不会铸币了吧,我拿ddsp练语音变声,效果很糟,它不会只能练歌声吧……目前使用体验最好的还是花佬的tts。


                IP属地:湖南来自Android客户端25楼2024-09-13 12:56
                收起回复
                  继续更新


                  IP属地:四川26楼2024-09-14 20:43
                  回复
                    1.搜集数据集:打开浏览器,输入kivo.fun以进入古书馆,下载角色音频(那种太短的就不下了,例如受击语音)


                    IP属地:四川27楼2024-09-14 20:55
                    回复
                      补充一点:沾了混响的语音也不能要


                      IP属地:四川28楼2024-09-14 21:15
                      回复
                        2.合并语音
                        我们需要将上述音频进行合并,以方便我们来进行下一步:响度匹配


                        IP属地:四川29楼2024-09-14 21:30
                        回复
                          由于古书馆的语音响度太大,直接拿去训练的话模型效果不会很好。所以进行响度匹配是必要的。但是每个角色换皮的语音响度不同,所以我们应该按不同的换皮来分开合并。例如我这里下载了宫子和泳装宫子的语音,打开格式工厂,点击音频合并,将原皮和泳装皮分别合并成两个采样率为44100Hz的WAV文件。


                          IP属地:四川30楼2024-09-14 22:08
                          回复
                            点击这个文件夹图标即可找到输出文件地址


                            IP属地:四川31楼2024-09-14 22:13
                            回复
                              3.响度匹配
                              打开AU,启动后按下ctrl+N新建多轨会话,点击文件,导入,文件。将你合并出的音频导入进来


                              IP属地:四川32楼2024-09-14 22:25
                              回复