实验室介绍

音频、语音与视觉处理实验室( Audio, Speech and Vision Processing Laboratory, ASVP Lab)成立于1993年，主要从事音频、语音与视觉信号处理技术研究及其应用开发（具体研究方向见后面的清单）。已发表高水平学术论文两百余篇；获得国家发明专利三十余件；获得多项省部级科技奖励。研究成果已被华为技术有限公司、广东省电信研究院、广州海格通信集团等企业所应用，取得了良好的社会、经济效益。

实验室注重国际学术交流，与卡耐基梅隆大学、华盛顿大学、剑桥大学、伦敦玛丽女王大学、坦佩雷大学、萨里大学、新加坡国立大学、香港城市大学等国际著名大学具有人才培养和科研合作；同时也培养了一批来自法国、多哥、喀麦隆、坦桑尼亚、巴基斯坦、斐济等国的留学生。

实验室现有教师2人，在读博/硕士生十余人。实验室已毕业硕士研究生一百余人、博士研究生二十余人，国内访问学者十余人。研究生就业单位主要为国内知名高校、研究所和IT企业。

实验室为学生提供良好的成长环境与支持，鼓励学生开展学术研究、参加各类科技竞赛以及出国深造，并取得了良好成绩。欢迎有志从事音视频信号处理、机器学习理论研究与应用的同学来实验室攻读博/硕士学位；欢迎从事智能信号处理及相关领域的专家学者来实验室访问交流；欢迎海内外各类人才加入本实验室！

近期实验室主要的研究兴趣包括：

1. Intelligent Audio Processing (智能音频信号处理)

· AudioEvent Detection and Recognition (音频事件检测及识别)

· Audio Scene Analysis (声学场景分析)

· Objective Measurement of Speech Quality (语音客观质量评价)

· Low Rate Speech Coding (低码率语音编码)

· Echo Cancellation (回声消除)

· Speaker Change Detection and Analysis of Speaker Roles

(说话人改变检测及说话人角色分析)

· Bi-module Speech Recognition (双模态语音识别技术)

2. Security of Identity Authentication based on Speech

（语音身份认证安全技术）

· Speech Record & Play Back Detection (录音回放检测)

· Consistency Analysis between Lip Motion and Voice

(语音唇动一致性评价)

· Audio Recorder Authentication (录音设备源识别)

· Security of Audio data (音频数据安全)

3. Multimedia Analysis多媒体分析

· Audio & Video Content Analysis under Surveillance Environment

(音视频联合分析的监控系统)

· Face Recognition based Check on Work Attendance & Surveillance

of unenrolled Person.

(监控视频环境下的基于人脸识别的考勤及陌生人检测)

· Application of Audio Information in Multimedia Retrieval

(音频信息在多媒体信息检索中的应用技术)

· Human falling Detection based on Video analysis

(基于视频分析的人跌倒检测)

· Fruit & Vegetable Recognition for commercial trace back

4. Application of Embedded System嵌入式应用系统

· Embedded Surveillance System based on Video Content Analysis

（基于内容分析的嵌入式视频监控系统）

· RFID-based Management System of Equipment

(基于RFID 的设备管理系统)

-------------------------------------------------------------