音频、语音与视觉处理实验室( Audio, Speech and Vision Processing Laboratory, ASVP Lab)成立于1993年,主要从事音频、语音与视觉信号处理技术研究及其应用开发(具体研究方向见后面的清单)。已发表高水平学术论文两百余篇;获得国家发明专利三十余件;获得多项省部级科技奖励。研究成果已被华为技术有限公司、广东省电信研究院、广州海格通信集团等企业所应用,取得了良好的社会、经济效益。
实验室注重国际学术交流,与卡耐基梅隆大学、华盛顿大学、剑桥大学、伦敦玛丽女王大学、坦佩雷大学、萨里大学、新加坡国立大学、香港城市大学等国际著名大学具有人才培养和科研合作;同时也培养了一批来自法国、多哥、喀麦隆、坦桑尼亚、巴基斯坦、斐济等国的留学生。
实验室现有教师2人,在读博/硕士生十余人。实验室已毕业硕士研究生一百余人、博士研究生二十余人,国内访问学者十余人。研究生就业单位主要为国内知名高校、研究所和IT企业。
实验室为学生提供良好的成长环境与支持,鼓励学生开展学术研究、参加各类科技竞赛以及出国深造,并取得了良好成绩。欢迎有志从事音视频信号处理、机器学习理论研究与应用的同学来实验室攻读博/硕士学位;欢迎从事智能信号处理及相关领域的专家学者来实验室访问交流;欢迎海内外各类人才加入本实验室!
近期实验室主要的研究兴趣包括:
1. Intelligent Audio Processing (智能音频信号处理)
· AudioEvent Detection and Recognition (音频事件检测及识别)
· Audio Scene Analysis (声学场景分析)
· Objective Measurement of Speech Quality (语音客观质量评价)
· Low Rate Speech Coding (低码率语音编码)
· Echo Cancellation (回声消除)
· Speaker Change Detection and Analysis of Speaker Roles
(说话人改变检测及说话人角色分析)
· Bi-module Speech Recognition (双模态语音识别技术)
2. Security of Identity Authentication based on Speech
(语音身份认证安全技术)
· Speech Record & Play Back Detection (录音回放检测)
· Consistency Analysis between Lip Motion and Voice
(语音唇动一致性评价)
· Audio Recorder Authentication (录音设备源识别)
· Security of Audio data (音频数据安全)
3. Multimedia Analysis多媒体分析
· Audio & Video Content Analysis under Surveillance Environment
(音视频联合分析的监控系统)
· Face Recognition based Check on Work Attendance & Surveillance
of unenrolled Person.
(监控视频环境下的基于人脸识别的考勤及陌生人检测)
· Application of Audio Information in Multimedia Retrieval
(音频信息在多媒体信息检索中的应用技术)
· Human falling Detection based on Video analysis
(基于视频分析的人跌倒检测)
· Fruit & Vegetable Recognition for commercial trace back
4. Application of Embedded System嵌入式应用系统
· Embedded Surveillance System based on Video Content Analysis
(基于内容分析的嵌入式视频监控系统)
· RFID-based Management System of Equipment
(基于RFID 的设备管理系统)
-------------------------------------------------------------
