首页 | 本学科首页   官方微博 | 高级检索  
     

基于正弦模型的语音识别时频特征
作者姓名:邢艳玲  杨吉斌  张雄伟
作者单位:解放军理工大学,通信工程学院,江苏,南京,210007;解放军理工大学,通信工程学院,江苏,南京,210007;解放军理工大学,通信工程学院,江苏,南京,210007
摘    要:为改善语音识别系统的性能,采用时频分布参数来描述语音特征。由于时频分布参数考虑到语音信号内在的非平稳特性,因此能够更准确地描述语音信号的时频特性。对基于正弦模型的多种时频参数(能量谱和幅度加权瞬时频谱)进行了比较,并在基于隐马尔可夫模型的连接词语音识别系统中进行了实验仿真。结果表明,单独采用时频分布参数作为ASR的前端特征并不能改善识别率;而采用标准ASR特征和能量谱时频特征的联合前端特征,可以有效地改善语音识别系统的识别效果。

关 键 词:语音识别  语音前端特征  时频分布  正弦模型  能量谱
文章编号:1009-3443(2004)01-0022-04
修稿时间:2003-04-18
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《解放军理工大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《解放军理工大学学报(自然科学版)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号