普通话连续数字串语音识别的持续时间模型 Duration Modeling for Continuous Mandarin Digital Speech Recognition期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

普通话连续数字串语音识别的持续时间模型

引用本文：	董蓉,袁俊,朱杰. 普通话连续数字串语音识别的持续时间模型[J]. 上海交通大学学报, 2002, 36(10): 1529-1532

作者姓名：	董蓉袁俊朱杰

作者单位：	上海交通大学,电子工程系,上海,200030

摘要：	在普通话连续数字串的识别中，与传统HMM在持续时间模型上的错误假设有关的删除与插入错误所占比例可达24．23％。基于此，在Viterbi解码中引入持续时间模型信息。对多种带参函数分布的持续时间模型在理论和实验上的比较分析都证明了Gamma分布更能精确反映汉语字模型的持续时间特性。文中还在外惩罚模型的基础上提出预理分段内惩罚持续时间模型和全局内惩罚持续时间模型两种改进算法。实验表明，结合持续时间模型的语音识别算法可以有效地减少删除与插入错误率，使总体识别错误率比基带系统减少了47．74％。
关键词：	普通话连续数字串持续时间模型 Viterbi解码连续语音识别 Gamma分布惩罚函数
文章编号：	1006-2467(2002)09-1529-04
修稿时间：	2001-10-30
Duration Modeling for Continuous Mandarin Digital Speech Recognition

DONG Rong,YUAN Jun,ZHU Jie. Duration Modeling for Continuous Mandarin Digital Speech Recognition[J]. Journal of Shanghai Jiaotong University, 2002, 36(10): 1529-1532

Authors:	DONG Rong YUAN Jun ZHU Jie

Abstract:	In a continuous Mandarin digit recognizer,the insertion and deletion errors related to the conventional HMM's false assumption on duration modeling amount to 24.23% in all recognition errors.This paper applied duration information into Viterbi decoding to overcome these errors. All the theoretic analysis on different parametric distributions and experiment results conclude that Gamma distribution comes out optimally characterize syllable level duration in Mandarin. In addition to ex penalty function, two forms of durational model were proposed: pre weighted in penalty function and global penalty function. The experimental results indicate that combining durational model with traditional recognition algorithm can effectively reduce both the deletion and insertion error rate and consequently about 47.74% total recognition error rate reduction is achieved over the baseline system.

Keywords:	duration model Viterbi decoding continuous speech recognition
本文献已被 CNKI 维普万方数据等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏