基于正弦模型的语音识别时频特征 |
| |
作者姓名: | 邢艳玲 杨吉斌 张雄伟 |
| |
作者单位: | 解放军理工大学,通信工程学院,江苏,南京,210007;解放军理工大学,通信工程学院,江苏,南京,210007;解放军理工大学,通信工程学院,江苏,南京,210007 |
| |
摘 要: | 为改善语音识别系统的性能,采用时频分布参数来描述语音特征。由于时频分布参数考虑到语音信号内在的非平稳特性,因此能够更准确地描述语音信号的时频特性。对基于正弦模型的多种时频参数(能量谱和幅度加权瞬时频谱)进行了比较,并在基于隐马尔可夫模型的连接词语音识别系统中进行了实验仿真。结果表明,单独采用时频分布参数作为ASR的前端特征并不能改善识别率;而采用标准ASR特征和能量谱时频特征的联合前端特征,可以有效地改善语音识别系统的识别效果。
|
关 键 词: | 语音识别 语音前端特征 时频分布 正弦模型 能量谱 |
文章编号: | 1009-3443(2004)01-0022-04 |
修稿时间: | 2003-04-18 |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
| 点击此处可从《解放军理工大学学报(自然科学版)》浏览原始摘要信息 |
|
点击此处可从《解放军理工大学学报(自然科学版)》下载免费的PDF全文 |
|