尝试RVC音色克隆团长音色

news/2024/12/25 2:33:34/文章来源:https://www.cnblogs.com/xbule/p/18424601

前言

昨晚玩剑网3突发奇想,把团长声音克隆下来,利用语音喵制作成语音DBM。
这样不管团长开不开团,打团也能有团长声音听了诶嘿嘿。
于是当场关闭游戏声音录了打本的素材,本文就边做边记录。

下载

在B站找到了这个教程:
【你的声音,现在是我的了!】https://www.bilibili.com/video/BV1P541117yn
粗略看一遍感觉思路清晰,步骤明确。开始尝试。

打开项目页面 https://github.com/RVC-Boss/GPT-SoVITS

Release打开下载页面,下载v2版本,解压
解压好慢,可以先把录制的声音从视频分离出来

电脑上刚好有剪映,视频文件拖进去,右键分离音频,导出音频,wav格式

启动

解压后打开 go-webui.bat
官方中文教程:https://www.yuque.com/baicaigongchang1145haoyuangong/ib3g1e

官方中文教程提供了在线使用的网址:https://gsv.acgnai.top/ ,里面有训练好的模型可以直接拿来用,配合F12可以下载自定义的语音文件,暂时没有发现有数量限制

UVR5人声伴奏分离&去混响去延迟

因为录制的音频是游戏内语音,加上团长用的麦不是很好,所以需要处理一下混响和噪声
开启 UVR5人声伴奏分离&去混响去延迟工具,等待一会后出现 UVR5 WebUI

选择 onnx_dereverb_by_FoxJoy模型 去混响,去延迟,
贴入wav文件文件夹路径,默认选择flac格式音频,直接转换
转换进度可以在bat窗口查看。5分钟才转换10%,预计要50分钟,可以看一下官方中文教程 睡一觉

睡了一觉发现转换好了,输出在程序的 output\uvr5_opt 文件夹里,确实把混响杂音去掉了一些

再用 DeEcho-Aggressive模型,对刚才用 onnx_dereverb_by_FoxJoy模型 处理过的flac文件重新处理一下
处理完成的文件名开头应该是 vocal,结尾是 main_vocal

语音切分&降噪&ASR

关闭 UVR5 WebUI,打开 GPT-SoVITS WebUI,进行语音切分、降噪、ASR

语音文本校对标注

校对文字,本页校对完成后点击 Submit Text 保存,Next Index下一页
有不需要的音频片段,右边 yes 打钩,上方 Delete Audio
image

开始TTS推理

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/801237.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

vsftpd部署(centos7.9)

说明:– vsftpd的版本:vsftpd-3.0.2-29.el7_9.x86_64– ftp根目录:/var/www– ftp 配置文件目录:/etc/vsftpd– ftp 虚拟用户权限配置文件目录:/etc/vsftpd/user_conf 实现目标:– 匿名用户可以登录,但是不能访问虚拟用户的宿主目录,只能访问共享目录– 虚拟用户对自己…

隐私保护体系下网络威胁情报共享的研究现状和方案设计

来源:http://netinfo-security.org/article/2024/1671-1122/1671-1122-24-7-1129.shtml威胁情报 网络威胁情报是关于网络中正在进行的或潜在的恶意活动信息,涵盖但不限于特定的恶意软件样本、恶意IP地址、钓鱼电子邮件信息、黑客组织的入侵行为等内容,对于提前感知预警、防范…

Logisim-013-◇汉字显示

转码在线工具地址 https://www.23bei.com/tool/54.html#仓库地址 https://gitee.com/gitliang/logisim-to-cpu

spring6.1在java17环境下使用反射

引包 <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-aop</artifactId><version>3.3.4</version> </dependency> 反射代码编写简单的反射方法,如下所示 package com.lw.reflect.c…

实景三维+耕地保护:构建耕地资源管理的全闭环新模式

在耕地资源日益珍贵的今天,如何高效、精准地实施耕地保护,成为了我国农业可持续发展与生态文明建设的关键课题。“实景三维+耕地保护”的创新模式,能够为这一挑战提供突破性的解决方案,打造一个从前端监测到后端管理的全闭环耕地保护管理模式。本文将深入分析这一模式的核心…

IDEA 如何设置TAB页显示多行

前言 我们在使用IDEA开发时,经常需要打开多个TAB页,但是,IDEA默认的方式是最多只能打开少量的TAB页,且打开的TAB页只能堆积在一行上显示,如果超出了数量,就会自动隐藏。这样对于我能经常需要在多个不同TAB页之间打开来说,是比较麻烦的,那么有什么办法能改变下设置呢? …

深入剖析RocketMQ消息消费原理

本文参考转载至《RocketMQ技术内幕 第2版》一. 消息消费概述 消息消费以组的模式开展,一个消费组可以包含多个消费者,每个消费组可以订阅多个主题,消费组之间有集群模式和广播模式两种消费模式。集群模式是当前主题下的同一条消息只允许被其中一个消费者消费。广播模式是当前…

dc-8

靶机下载地址:dc-8 找到靶机 nmap -sV 192.168.6.0/24查看端口 疑似有注入点开始尝试 python sqlmap.py -u "http://192.168.6.135/?nid=*" --dbs 查库python sqlmap.py -u "http://192.168.6.135/?nid=*" -D "d7db" --tables 查表python sqlm…

27. 守护进程、进程间通信

1. 僵尸进程与孤儿进程1.1 前言 在unix中,所有的子进程都是由父进程创建的,子进程再创建新的子进程 子进程的结束和父进程的运行是一个异步的过程,即子进程运行完成时,父进程并不知道 当子进程运行完成时,父进程需要调用wait()或waitpid()来获取子进程的运行状态 1.2 僵尸…

BUU XSS COURSE 1

启动靶机有留言板和登录功能,很明显是存储性xss,通过留言功能插入xss代码,获取cookie登录后台 先测试过滤 <script>alert(1);</script> 查看源代码发现script被过滤 <input onfocus="alert(xss);">好像只过滤了script找一个xss平台或者自己用服…

Wireshark开源抓包工具

Wireshark零基础使用教程(超详细) - 元宇宙-Metaverse - 博客园 (cnblogs.com)一、Wireshark是什么 Wireshark是使用最广泛的一款「开源抓包软件」,常用来检测网络问题、攻击溯源、或者分析底层通信机制。 它使用WinPCAP作为接口,直接与网卡进行数据报文交换。 二、Wiresha…

Prompt提示词概念

什么是prompt提示词? 叮!快来看看我和文心一言的奇妙对话~什么是提示工程(prompt engineering)?点击链接 https://yiyan.baidu.com/share/vMZ69XCFTc?utm_invite_code=P0HSh4T14mrU4TwxGbJ%2BSw%3D%3D&utm_name=SGlkZGVuX3N0YXJz&utm_fission_type=common -- 文心…