近期,实验室的江钟杰同学在李艳雄老师的指导下,提出了一种注意力多尺度卷积递归网络(attentive multi-scale convolutional recurrent network,AMCRN)用于解决说话人认证问题,该网络在等错误率、最小检测损失以及计算复杂度等方面均优于对比方法。相关成果在 Applied Soft Computing期刊上发表。论文链接

另外,实验室的陈昊同学在李艳雄老师的指导下提出了一种利用特征分组与交互的轻量级原型网络用于解决少样本条件下的说话人识别问题。 相关成果在 IEEE Transactions on Multimedia期刊上发表。论文链接


作者简介:

江钟杰,2019级硕士研究生。他的研究兴趣为深度学习与说话人认证,目前就职于腾讯科技。

陈昊, 2020年在华南理工大学获得学士学位,同年继续在本校攻读硕士学位。他的研究兴趣主要包括深度学习与说话人识别。