首页 | 本学科首页   官方微博 | 高级检索  
     检索      

汉语连续语音识别中上下文相关的声韵母建模
引用本文:李净,郑方,张继勇,吴文虎.汉语连续语音识别中上下文相关的声韵母建模[J].清华大学学报(自然科学版),2004,44(1):61-64.
作者姓名:李净  郑方  张继勇  吴文虎
作者单位:1. 清华大学,计算机科学与技术系,智能技术与系统国家重点实验室,北京,100084
2. 清华大学,计算机科学与技术系,智能技术与系统国家重点实验室,北京,100084;北京得意音通技术有限公司,北京,100085
摘    要:声学建模是汉语连续语音识别中的关键步骤之一。根据汉语语音的特点,采用扩展声韵母(XIF)作为识别基元,并针对XIF基元设计了相应的问题集,利用基于决策树的状态共享策略建立上下文相关声韵模型(Tri-XIF)。将Tri-XIF模型与上下文相关音素模型(Tri-phone)、上下文无关音节模型进行了对比。提出了几种方法用于改善标注、改进问题集和降低模型规模。实验结果表明,Tri-XIF模型与Tri-phone模型、音节模型相比,识别性能有了很大提高,其音节误识率分别降低了24.53%和41.65%。采用了所提出的优化策略后,模型规模降低20%以上,而性能下降很少。

关 键 词:语音识别  决策树  上下文相关  声韵母
文章编号:1000-0054(2004)01-0061-04
修稿时间:2003年1月13日

Context dependent initial/final acoustic modeling for continuous Chinese speech recognition
LI Jing,ZHENG Fang,ZHANG Jiyong,WU Wenhu.Context dependent initial/final acoustic modeling for continuous Chinese speech recognition[J].Journal of Tsinghua University(Science and Technology),2004,44(1):61-64.
Authors:LI Jing  ZHENG Fang    ZHANG Jiyong  WU Wenhu
Institution:LI Jing~1,ZHENG Fang~1,2,ZHANG Jiyong~1,WU Wenhu~1 Department of Computer Science and Technology,Tsinghua University,Beijing 100084,China, 2. Beijing d-Ear Technologies,Beijing 100085,China)
Abstract:
Keywords:speech recognition  decision tree  context dependent  initial/final
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号