车载多通道语音识别挑战赛（ICMC-ASR）丨ICASSP2024

由希尔贝壳、理想汽车、西工大音频语音与语言处理研究组、新加坡南洋理工大学、天津大学、WeNet开源社区、微软、中国信通院等单位发起的“车载多通道语音识别挑战赛”（ICMC-ASR）将作为IEEE声学、语音与信号处理国际会议（ICASSP2024）的旗舰赛事，正式启动。报名参加此次赛事，您将获得：

业界首个新能源车智能座舱多通道实录语音数据集；
超百人的车内驾驶员和乘客间语音对话数据，覆盖不同驾驶场景；
测试车载语音识别的真实技术水平；
顶会 ICASSP2024 受邀论文和报告机会；
与国际语音学术和产业界深度交流技术前沿的机会。

官网：https://icmcasr.org

背景

随着汽车成为人们日常生活中不可或缺的一部分，而驾驶舱中传统的触摸交互方式容易分散驾驶员的注意力，存在安全风险，因此，车内基于语音的交互方式得到重视。与通常家庭或会议场景中的语音识别系统不同，驾驶场景中的系统面临更加独特的挑战，缺乏大规模的公共真实车内数据一直是该领域发展的主要障碍。因此，特推出车载多通道语音识别挑战赛（ICMC-ASR）。

本次赛事发布一个真实的车内多通道语音语料库，包含约 1000+ 小时、车内真实录制的多通道普通话语音数据，收音设备包含车内分布式麦克风收集的远场数据，以及参与者的头戴麦克风收集的近场数据。更多赛事数据的详细信息请参考官方网站的数据介绍。

数据集样例：

demo1

demo2

赛道

ICMC-ASR 设立了两个不同的赛道：

• Track I Automatic Speech Recognition (ASR):

提供评估集的真实的说话人日志结果。任务目标是开发基于多通道多说话人语音识别系统。参与者需要关注不同通道数据信息融合、背景噪声抑制以及多说话人重叠等。

• Track II Automatic Speech Diarization and Recognition (ASDR):

去除说话人日志的先验知识（如说话人的分割、说话人标签以及说话人人数），参与者需要使用说话人日志和识别技术对评估集中的每个会话进行分割和转录。该任务接受端到端系统以及允许更多的系统灵活性。

有任何问题，可联系：icmcasr_challenge@aishelldata.com 。

重要日期

9.12	注册开放
9.30	训练集发布，注册截止
10.7	验证集和基线系统发布
12.5	测试集发布，榜单开启
12.19	最终结果提交截止
12.30	系统说明提交截止