实验室郑若伟、陈永强等成员参加2021“天马杯”全球高校科技创新大赛斩获佳绩
.
发布人:郑若伟  发布时间:2021-12-24   动态浏览次数:2119

20211224日,2021“天马杯全球高校科技创新大赛(以下简称大赛)总决赛在重庆盛大举行。该大赛为包含视觉赛道、语音赛道和NLP赛道多赛道并行的科技创新大赛,吸引了来自海内外134所高校,组成了253支参赛队伍,590名参赛选手。经过65天的激烈角逐,由华南理工大学音频、语音与视觉处理实验室的郑若伟、陈永强、兰小添、徐剑斌、李学高组成的参赛队伍(队伍名称:asvp获得了语音赛道总决赛三等奖的佳绩。



郑若伟同学以线上形式参加总决赛颁奖仪式


马上消费金融股份有限公司(简称马上消费)是一家经中国银保监会批准,持有消费金融牌照的科技驱动型金融机构。天马杯始于2019年,已连续举办三年,得到了海内外高校在校生高度认可,给在校学生搭建起良好的创新和交流平台.


2021“天马杯”全球高校创新大赛赛题


本次大赛无监督学习ASR赛题说明:

1、使用带有标注信息的资源进行有监督学习的ASR模型,在学术和工业上都取得了巨大的成功。但是我国幅员辽阔,民族众多,在方言、少数民族语言等小语种上想要获取海量标注数据存在非常大的困难。如何使用少量的场景数据或者方言数据,就能达到好的识别效果呢?AI人工智能领域试图探索不需要语音-文字转录数据的语音识别系统。为了解决在不同场景下、不同语种下和数据资源不足的情况下,现有ASR技术性能损失严重的问题。我们寻求更优模式,更优算法来实现低资源ASR系统。

2、初赛任务:本赛题使用受限数据。

·         (1) 针对方言、小语种语音识别系统,在数据资源不足,标注难以获取的情况下,使用半监督,无监督建模成为一种可能。本次赛题旨在探索低资源语音识别更高准确度,更优算法。

·         (2) 考虑到比赛为了突出技术深度,避免数据带来的增益过大;鼓励参赛队伍能够深度参与这次活动,本次比赛中只允许使用官方提供的开源数据集。不允许使用外部数据,包括其它语音识别数据集、纯文本数据集,以及语音合成数据等;可以在开源的预训练模型,如wav2vec基础上fine-tune;不允许使用模型融合系统。

·         (3) 发音词典可以采用Aishell-1提供的发音词典,也可以采用公开渠道可获取的词典,包括通过商业渠道或者开源项目提供的发音词典。

·         (4) 主办方提供预训练模型和baseline基线系统。并且提供单卡T416GGPU服务器用于完成比赛任务。

3、数据描述

◆ 训练集:wenetspeech-S训练集
 A榜测试集:wenetspeech TEST_NETTEST_MEETING 测试集,提交结果时,提交两个测试集的平均值
 B榜测试集:比赛组委会1116日发布

4、评价指标

◆ 比赛将以补充测试集上的字错误率(CER)进行最后队伍名次的排序。
 CER = (S + D + I ) / N
 CER
Character Error RateS为替换的字数,D为删除的字数,I为插入的字数,N为总字数

5、语音赛道组委会

联席主席:谢磊 教授 西北工业大学
联席主席:王洪斌 高级总监 马上消费金融有限公司
委员: 刘敏 总监 马上消费金融有限公司
委员: 卢晶 研究员 马上消费金融有限公司
委员: 卜辉 CEO 北京希尔贝壳科技有限公司