Talk|香港中文大学(深圳)张雪遥:音频生成开源工具包Amphion的歌声转换指南

本期为TechBeat人工智能社区570线上Talk。

北京时间2月7日(周三)20:00,香港中文大学(深圳)博士生张雪遥的Talk已准时在TechBeat人工智能社区开播!

他与大家分享的主题是: 音频生成开源工具包Amphion的歌声转换指南,系统地介绍他的团队提出的针对歌声转换的音频生成开源工具包Amphion,包括该任务的定义、研究发展脉络、最前沿的技术框架范式,以及Amphion对该任务的集成思路与架构设计等相关工作所做的研究。

Talk·信息

主题: 音频生成开源工具包Amphion的歌声转换指南

嘉宾:港中文大学(深圳)博士生 张雪遥

时间:北京时间 2月7日(周三)20:00

地点:TechBeat人工智能社区

点击下方链接,即可观看视频!

TechBeatTechBeat是荟聚全球华人AI精英的成长社区,每周上新来自顶尖大厂、明星创业公司、国际顶级高校相关专业在读博士的最新研究工作。我们希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。icon-default.png?t=N7T8https://www.techbeat.net/talk-info?id=848

Talk·介绍

Amphion是一个集成了语音合成转换、歌声合成转换、音效音乐生成等多功能为一体的音频AIGC开源平台(https://github.com/open-mmlab/Amphion)。在本次报告中,我们将针对于歌声转换(Singing Voice Conversion),介绍该任务的定义、研究发展脉络、最前沿的技术框架范式,以及Amphion对该任务的集成思路与架构设计。除此之外,我们还将介绍Amphion的整体系统架构、代码开发逻辑,以及各类文档的设计思路。最后,我们将通过实例说明,如何基于Amphion来进行各项音频生成任务的研究与开发。

Talk大纲

1、背景:(1)Amphion的初心与愿景;(2)歌声转换任务的任务介绍、相关应用、发展历程

2、当前业内歌声转换技术的Pipeline

3、Amphion中对歌声转换技术的集成与设计

4、Amphion在歌声转换的前沿探索:融合多种语义特征的歌声转换框架

5、Amphion的系统架构、代码与文档设计

Talk·预习资料

Image

论文链接:

https://arxiv.org/pdf/2312.09911.pdf

Github链接:

https://github.com/open-mmlab/Amphion

项目链接:

https://huggingface.co/spaces/amphion/singing_voice_conversion

Talk·提问交流

在Talk界面下的【交流区】参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!

Talk·嘉宾介绍

Image

张雪遥

香港中文大学(深圳)博士生在读

张雪遥,音频生成开源工具包Amphion的联合发起人,香港中文大学(深圳)2022级博士生,导师为武执政教授。研究兴趣为人工智能音乐、歌声生成等。曾入选2023年腾讯犀牛鸟精英人才计划,曾在MM、WWW、ACL、ICASSP等顶级学术会议上发表论文7篇,谷歌学术引用数百次,参与维护多项学术开源项目。本硕毕业于武汉大学、中国科学院大学,曾获国家奖学金、校园十佳歌手等荣誉

个人主页: 

TechBeat


关于TechBeat人工智能社区

TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。

我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。

期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!

更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/460042.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

mysql 对于null字段排序处理

最近遇到一个需求 ,需要对一个报表的多个字段进行多字段复杂条件排序 排序字段为NULL时 Mysql对于排序字段为NULL时,有自身默认的排序规则,默认是认为null 值 是无穷小 ELECT id,script_id,last_modified,live_count,next_show FROM virtua…

红队打靶练习:PHOTOGRAPHER: 1

目录 信息收集 1、arp 2、nmap 3、nikto 目录扫描 1、gobuster 2、dirsearch WEB 信息收集 enum4linux smbclient 8000端口 CMS利用 信息收集 文件上传漏洞利用 提权 信息收集 get user.txt get flag 信息收集 1、arp ┌──(root㉿ru)-[~/kali] └─# a…

AI专题:2023年AI和标准化网络安全报告

今天分享的是AI系列深度研究报告:《AI专题:2023年AI和标准化网络安全报告》。 (报告出品方:enisa) 报告共计:37页 文件目的和目标 本文件的总体目标是概述与人工智能(AI)网络安全有关的标准(现有的、正在…

ChatGPT 3.5与4.0:深入解析技术进步与性能提升的关键数据

大家好,欢迎来到我的博客!今天我们将详细比较两个引人注目的ChatGPT版本——3.5和4.0,通过一些关键数据来深入解析它们之间的差异以及4.0版本的技术进步。 1. 模型规模与参数 ChatGPT 3.5: 参数数量:约1.7亿个模型层数…

格子表单GRID-FORM | 文档网站搭建(VitePress)与部署(Github Pages)

格子表单/GRID-FORM已在Github 开源,如能帮到您麻烦给个星🤝 GRID-FORM 系列文章 基于 VUE3 可视化低代码表单设计器嵌套表单与自定义脚本交互文档网站搭建(VitePress)与部署(Github Pages) 效果预览 格…

FPGA高端项目:解码索尼IMX327 MIPI相机转USB3.0 UVC 输出,提供FPGA开发板+2套工程源码+技术支持

目录 1、前言免责声明 2、相关方案推荐我这里已有的 MIPI 编解码方案 3、本 MIPI CSI-RX IP 介绍4、个人 FPGA高端图像处理开发板简介5、详细设计方案设计原理框图IMX327 及其配置MIPI CSI RX图像 ISP 处理图像缓存UVC 时序USB3.0输出架构FPGA逻辑设计工程源码架构SDK软件工程源…

CentOS镜像如何下载?在VMware中如何安装?

一、问题 CentOS镜像如何下载?在VMware中如何安装? 二、解决 1、CentOS镜像的下载 (1)官方网站 The CentOS Project (2)官方中文官网 CentOS 中文 官网 (3)选择CentOS Linux…

yarn/npm certificate has expired

目录 报错 原因:HTTPS 证书验证失败 方法 a.检查网络安全软件:可能会拦截或修改 HTTPS 流量 b.strict-ssl:false关闭验证【临时方法】 报错 info No lockfile found. [1/4] Resolving packages... error Error: certificate has expired at TLS…

【MySQL进阶之路】BufferPool底层设计(上)

欢迎关注公众号(通过文章导读关注:【11来了】),及时收到 AI 前沿项目工具及新技术的推送! 在我后台回复 「资料」 可领取编程高频电子书! 在我后台回复「面试」可领取硬核面试笔记! 文章导读地址…

设计模式2-对象池模式

对象池模式,Object Pool Pattern,当你的应用程序需要频繁创建和销毁某种资源(比如数据库连接、线程、socket连接等)时,Object Pool 设计模式就变得很有用。它通过预先创建一组对象并将它们保存在池中,以便在…

【Godot4.2】文件系统自定义控件 - GroupButtons

GroupButtons 概述 读者朋友们好,我是巽星石,这是我的Godot4.2文件系统自定义控件系列文章。 在很多程序或插件设计中,都会用到一堆按钮的形式,好处是比较直观,用啥点啥,本质上相当于一个简化的二级树形…

re:从0开始的CSS学习之路 5. 颜色单位

0. 写在前面 没想到在CSS里也要再次了解这些颜色单位,感觉回到了大二的数字图像处理,可惜现在已经大四了,感觉并没有学会什么AI的东西 1. 颜色单位 预定义颜色名:HTML和CSS规定了147种颜色名。例如:red yellow green …