基于PLAR的说话人确认系统的噪音鲁棒性 |
| |
作者姓名: | 尹聪 白静 龚宬 张陈昊 郑方 Waleed H.Abdulla |
| |
作者单位: | 太原理工大学信息工程学院;清华大学计算机科学与技术系,清华信息科学技术国家实验室技术创新和开发部语音和语言技术中心;奥克兰大学 |
| |
基金项目: | 国家自然科学基金项目(61271389);国家“九七三”重点基础研究发展计划(2013CB329302) |
| |
摘 要: | 针对Mel频率倒谱系数(Mel frequency cepstralcoefficient,MFCC)特征的说话人确认系统在干净语音环境下具有很高识别率但在噪音环境下识别率急剧下降的缺点,构建了基于感知对数面积比系数(perceptual log area ratio,PLAR)特征的说话人确认系统,并对该系统的噪音鲁棒性进行研究。结果表明:PLAR特征具有较强的噪音鲁棒性。将PLAR与MFCC进行特征域和分数域的融合,利用两者之间存在着的互补性,可有效提高说话人确认系统的识别性能。
|
关 键 词: | 说话人确认 感知对数面积比系数(PLAR) 鲁棒性 融合 |
本文献已被 CNKI 等数据库收录! |
|