汉语连续语音识别中上下文相关的声韵母建模 Context dependent initial/final acoustic modeling for continuous Chinese speech recognition期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

汉语连续语音识别中上下文相关的声韵母建模

引用本文：	李净,郑方,张继勇,吴文虎.汉语连续语音识别中上下文相关的声韵母建模[J].清华大学学报(自然科学版),2004,44(1):61-64.

作者姓名：	李净郑方张继勇吴文虎

作者单位：	1. 清华大学,计算机科学与技术系,智能技术与系统国家重点实验室,北京,100084 2. 清华大学,计算机科学与技术系,智能技术与系统国家重点实验室,北京,100084;北京得意音通技术有限公司,北京,100085

摘要：	声学建模是汉语连续语音识别中的关键步骤之一。根据汉语语音的特点,采用扩展声韵母(XIF)作为识别基元,并针对XIF基元设计了相应的问题集,利用基于决策树的状态共享策略建立上下文相关声韵模型(Tri-XIF)。将Tri-XIF模型与上下文相关音素模型(Tri-phone)、上下文无关音节模型进行了对比。提出了几种方法用于改善标注、改进问题集和降低模型规模。实验结果表明,Tri-XIF模型与Tri-phone模型、音节模型相比,识别性能有了很大提高,其音节误识率分别降低了24.53%和41.65%。采用了所提出的优化策略后,模型规模降低20%以上,而性能下降很少。
关键词：	语音识别决策树上下文相关声韵母
文章编号：	1000-0054(2004)01-0061-04
修稿时间：	2003年1月13日
Context dependent initial/final acoustic modeling for continuous Chinese speech recognition

LI Jing,ZHENG Fang,ZHANG Jiyong,WU Wenhu.Context dependent initial/final acoustic modeling for continuous Chinese speech recognition[J].Journal of Tsinghua University(Science and Technology),2004,44(1):61-64.

Authors:	LI Jing ZHENG Fang ZHANG Jiyong WU Wenhu

Institution:	LI Jing~1,ZHENG Fang~1,2,ZHANG Jiyong~1,WU Wenhu~1 Department of Computer Science and Technology,Tsinghua University,Beijing 100084,China, 2. Beijing d-Ear Technologies,Beijing 100085,China)

Abstract:

Keywords:	speech recognition decision tree context dependent initial/final
本文献已被 CNKI 万方数据等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏