基于统计阈值的鲁棒性语音识别(英文) 期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

基于统计阈值的鲁棒性语音识别(英文)

引用本文：	李银国,蒲甫安,郑方.基于统计阈值的鲁棒性语音识别(英文)[J].重庆邮电学院学报(自然科学版),2012(2).

作者姓名：	李银国蒲甫安郑方

作者单位：	重庆邮电大学汽车电子与嵌入式研究中心;清华大学语音与语言研究中心;

基金项目：	The National High Technology Research and Development Program of China Project(2009ZX01038-002-002-2)

摘要：	近几十年来,语音识别系统已由实验室环境走向真实的世界中。在不同的环境噪声下,识别性能却仍不尽人意,尤其是在低信噪比的环境中。为解决在低信噪比情况下的低识别率的问题,以声学参数MFCC(Mel-frequency cepstrum coefficient)为基础,提出了一种基于统计阈值的倒谱均值方差归一化算法,该算法能进一步减小训练环境和测试环境的不匹配程度,从而提升了语音识别系统对环境噪声的鲁棒性。首先,对输入的语音提取MFCC声学参数,然后对提取的声学参数作均值方差归一化处理,最后采用统计阈值的方法抑制归一化后存在变异的特征。该算法能增加带噪语音特征和纯净语音特征的相似性;与MFCC为基线的系统相比,在低信噪比情况下,该算法的错误率最高下降约40%,同时该方法也优于其他的鲁棒性特征倒谱均值减和倒谱均值归一。
关键词：	鲁棒性特征提取均值减均值方差归一(MVN) 梅尔频率倒谱系数(MFCC) 统计阈值语音识别
本文献已被 CNKI 等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏