多模态说话人认证系统
本系统是一个远程多模态说话人认证系统,其中声纹认证作为系统认证的主要方式,此外,还包括其他的生物信息检测,如人脸检测和语音唇动一致性的检测。用户使用计算机进行生物信息的注册与认证。
系统采用了轻度挑战响应策略作为抗录音回放和录音重放攻击的手段之一,根据用户的注册资料,在认证时对用户提出不同的问题,并使用语音识别,检测用户回答的合理性。
多媒体信息检索系统
本系统是一个基于内容的多媒体检索系统,处理对象目前是新闻视频。本系统基于视频特征的视频搜索,其视频内容分析涵盖视觉特征分析、音频特征分析和文本特征分析等,基于内容进行视频搜索,还处于研发阶段。简言之,本系统根据用户想看的东西进行匹配,与实际生活中的搜索体验一致,也就是说除了用文字来搜视频还可以用图片来搜视频,用音频来搜索视频,乃至视频搜视频,在这些核心能力的架构基础上提供比文本搜索更丰富的内容和搜索体验,让用户更快捷、更精确地选择自己想要看的视频。
具有防录音回放的说话人认证评估系统
本系统是远程说话人身份认证系统的离线验证版本。在说话人识别基础上,兼具防录音回放攻击的功能,解决利用录音设备录制说话人声音并回放来攻击身份认证系统的问题,系统采用文本无关的说话人识别方式。
复杂环境下基于准干净语音构造的语音质量客观评价方法
本系统基于准干净语音构造,目标在于对不同环境场景下低信噪比的语音进行客观质量评价。在客观评价方法中,有参考源评价方法一般比无参考源要获得更好的性能。该系统基于准干净语音构造和有参考源评价模型,实现接近于有参考源客观评价的性能。