首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
维吾尔语是一种黏着语,基于单词的语言模型不太适合于维吾尔语大词汇连续语音识别任务。该文提出了适合维吾尔语的基于音节的语言模型,引入最大匹配分词算法评价音节语言模型在大词汇连续语音识别任务中的单词识别性能。实验结果表明:基于音节的语言模型在未登录词和模型复杂度等方面表现出比基于单词的语言模型更加优越的性能,并且使识别系统的单元错误率比基于单词的系统减少了50%。因此,在维吾尔语语音识别任务上可以将音节作为识别单元。  相似文献   

2.
为了解决基于词语的维吾尔语语音识别系统集外词过多的问题,采用形态分析生成的语素或数据驱动切分生成的统计子词代替词语作为识别系统的词典单元。在此基础上,提出一种根据语素识别系统和统计子词识别系统在声学模型训练数据上的音素错误率差别选择词语最佳分解结果,从而构建语素-统计子词联合词典的方法。在维吾尔语电话交谈式语音识别任务上比较各个系统的性能。实验结果表明,语素或统计子词的运用能有效缓解词语系统集外词过多的问题。与词典大小为200K的词语系统相比,55K的语素-统计子词联合系统使测试集上的音素错误率从45.4%下降到43.8%。  相似文献   

3.
分析了潜语义分析语言模型在建模和解码过程中的主要问题, 实现了潜语义分析语言模型的建模, 并提出一种在连续语音识别系统一遍解码框架中融合的方法. 实验结果表明, 该方法可有效地提高大词汇汉语连续语音识别系统的性能.   相似文献   

4.
在比较各种汉语语音识别基元的基础上,结合汉语语音和随机轨迹模型的特色,提出了以音素类单元作为汉语连续语音识别系统的识别基元,基于音素基随机轨迹模型的汉语连续语音识别系统的实验结果表明,该方案可行。  相似文献   

5.
对于大词汇量语音识别系统,适当选择基本单元至关重要。虽然以词为基本单元时避免了词边界的确定等复杂过程,但很多派生类结构中(如黏性语言),词比较长,而且很多文字(如中文、日文等)不需要词边界,因而在自然语言处理应用中没有选取基本单元集的固定模式。该文以维吾尔语大词汇量语音识别系统为例,研究基于各个层次化粒度单元的语音识别系统。通过比较各种层次化单元集为基础的语音识别结果,分析错误识别模式,收集被误判的单元序列作为在2层单元序列结构中择优的训练样本库。比较各种单元集的优缺点,提出一种能平衡长单元集和短单元集优点的方法。实验结果表明:该方法不仅可以有效提高语音识别准确率,也大大缩减了词典容量。  相似文献   

6.
为提高汉语连续语音识别系统的性能,建立了音节间相关的半音节识别单元,并研究了基于这种单元的连续语音识别算法。讨论了基于 D D B H M M 模型和最大后验概率估计准则的连续语音识别的理论基础,依据动态规划的基本原理,提出了一种基于音节间相关的识别单元的汉语连续语音识别算法。依照这种算法,不但能得到最优句子侯选,而且能够在识别过程中得到音节格(即 Nbest句子侯选)的数据结构。最后通过大词汇量非特定人连续语音识别的实验,表明了采用音节间相关的识别单元比基本的识别单元误识率有明显的降低  相似文献   

7.
在比较各种汉语语音识别基元的基础上,结合汉语语音和随机轨迹模型的特色,提出了以音素类单元作为汉语连续语音识别系统的识别基元.基于音素基随机轨迹模型的汉语连续语音识别系统的实验结果表明,该方案可行.  相似文献   

8.
设计孤立词的语音识别系统,对小词汇量、非特定人的语音进行识别。利用HTK(Hidden Markov Model Toolkit,隐马尔科夫模型工具箱)语音识别工具包进行系统的搭建,从语音识别的原理出发,对每一个单词建立和训练隐马尔科夫模型,探讨语音识别的基本流程和实现方法,为连续语音识别研究打下基础。实验结果显示,隐马尔科夫模型对孤立词具有良好的识别性能。在正常说话语境下,对语料库中单词的识别率可达到80%。  相似文献   

9.
为提高语音识别系统的性能,针对汉语语音的单音节结构的特点,提出了建立三音子识别单元的方法。这种方法完全利用语音学知识对上下文进行分类从而实现参数共享,而不同于传统的数据驱动的聚类共享。提出并实现了采用三音子单元的识别系统的训练算法和识别搜索算法。实验表明:基于语音学分类的三音子单元对识别性能有明显的改善,系统的首选误识率相对基线系统降低了28%。  相似文献   

10.
汉语语音识别研究中,识别单元的选取是很重要的。该文提出一种基于声韵母分割的,以韵母为基本识别单元的大词汇量孤立词的语音识别方法,并与以汉语词为基本识别单元的语音识别方法进行比较识别实验。结果表明,基于韵母为基本识别单元的语音识别性能优于以汉语词为基本识别单元的语音识别方法。  相似文献   

11.
研究了汉语大词汇词组语音识别算法的实现问题,提出了适用于大词汇汉语语音识别的有效而可行的训练和识别策略,对其中一些关键问题做了比较性实验,得出了一些有益的结论.针对汉语语音学特点提出了一种新的识别基元依赖韵头的声韵母模型(FHIF),实验证明FHIF的确优于普通的声韵母模型(IF).随后介绍了一个特定人汉语大词汇词组语音的模拟识别系统,该系统原则上可以识别无限的汉语词组,通过对汉语中最常用的5000词的测试结果表明,该模拟系统首选词条在特定人下已达到了约87%的识别率  相似文献   

12.
汽车噪声中自动语音的识别技术   总被引:6,自引:0,他引:6  
汽车中的话音拨号系统是自动语音识别技术的应用热点.自动语音识别系统是一个基于训练的系统.在汽车噪声中,由于实际应用环境与形成系统参数的训练环境的失配,传统语音识别系统的性能会大幅度地下降,从而无法实用.为了提高语音识别系统在特定环境下的识别率及实用性,首先根据汽车环境中语音的失真模型分析了系统性能下降的原因,然后针对加性汽车噪声与信道失真对系统的影响,讨论了在汽车噪声中改善语音识别系统性能的方法.提出了在识别系统中用基于子带的语音增强算法和倒谱均值相减算法相结合的方法.对大量的多人连续数字串语音的识别实验表明,这一方法大大提高了系统在汽车噪声环境中的识别率,它还可以简便、实时的实现,具有一定的实用性.  相似文献   

13.
语音端点检测(voice activity detection,VAD)是在连续语音信号中,将语音和非语言片段分离的技术。VAD在语音识别、说话人识别、语音编码等领域起着重要作用。传统VAD算法在类型已知的噪声环境下可以达到较好的性能,但在实际情况中,未知噪声的影响通常会使系统性能下降显著,在差异化噪声下的VAD是端点检测的研究难点。在总结现有语音端点检测算法基础上,提出了一种基于深度神经网络的语音端点检测方法,同时结合维特比算法,与基于贝叶斯信息准则(bayesian information criterion, BIC)的混合高斯模型(gaussian mixture model,GMM) 语音端点检测系统进行对比,在大词汇连续语音识别系统中的实验结果表明,将深度神经网络结合维特比算法,应用于语音端点检测,在复杂噪声环境下取得了更好的效果,适应性更强。  相似文献   

14.
大规模词表连续语音识别系统需要综合各种知识源,如声学模型、语言模型、发音词典等。其中,解码网络是识别引擎的基础,对提高解码器的性能有着至关重要的影响。有效综合这些知识源,构建一个紧致的解码网络,可以有效减少识别时的搜索空间和重复计算,显著提高解码速度。该文针对语音识别的动态解码网络进行研究,提出了词标志(word end,WE)节点前推算法,结合传统的前后向合并算法,实现了一个基于隐Markov模型状态为网络节点的紧凑动态解码网络。优化后的解码网络的节点数和边数分别是线性词典解码网络的1/4,是开源工具包HDecode的1/2;需要计算语言模型预测分数的节点数为HDecode的1/2。该声学模型基于三音子建模,可方便地移植到其他语种上。  相似文献   

15.
语音数据资源是语音识别研究的基础。当前国内只有为数不多的开放的语音数据库供研究者免费使用,特别是在维吾尔语等少数民族语音识别方面,数据资源更为贫乏。该文发布一个完全免费的维吾尔语连续语音数据库,该数据库包括约20h的训练数据和1h的测试数据,同时介绍了构建维吾尔语语音识别系统所需要的音素集、词表、文本数据等相关资源,以及用于构建基线系统的脚本。给出了该基线系统在纯净测试数据和噪声测试数据上的识别性能。该数据库为维吾尔语语音识别研究提供了可以借鉴的标准数据库。  相似文献   

16.
语音识别中信号特征的提取和选择   总被引:4,自引:0,他引:4  
本就语音识别中的各种特征参数的性能,提取算法等进行了分析和比较。根据选择特征参数的主要依据,选择LPCC和ARAC作为基本特征参数和动态特征参数,并应用于一个维吾尔语语音识别系统中,取得了很好的识别结果。  相似文献   

17.
针对低资源环境下由于标注训练数据不足、造成语音识别系统识别率急剧下降的问题,提出一种采用长短时记忆网络的低资源语音识别(LSTM-LRASR)方法。该方法采用长短时记忆网络构建声学模型,从特征提取、数据扩展及模型优化3个方面提高低资源语音识别性能。在特征提取方面,提取语言无关的高层稳健特征参数,降低声学模型对训练数据的依赖;在数据扩展方面,对已有标注数据进行语速扰动,对无标注数据进行自动识别,从而自动获取更多标注数据;在模型优化方面,通过序贯区分性训练技术提高模型对易混淆音素的区分能力,利用最小风险贝叶斯解码对多个系统进行融合,进一步提高识别性能。对OpenKWS16评测数据的实验结果表明,采用LSTMLRASR方法搭建的低资源语音识别系统的词错率相对基线系统下降了29.9%,所有查询词的查询项权重代价提升了60.3%。  相似文献   

18.
黏着性语音的元辅音区别性特征对口语环境下的连续语音识别影响很大.通过维吾尔语和谐语音现象下的发音规律及其规则,采用语言学、实验语音学技术和数字语音信号处理等方法,研究和谐发音现象下的元音、辅音区别特征系统,建立扩展元辅音集,并以此为基础,开展基于扩展元辅音集的连续语音识别研究,进一步通过其声学模型比较研究,构建连续语音识别模型,为维吾尔语口语环境下的连续语音识别提供一种新方法.  相似文献   

19.
针对已有的发音字典扩展方法只能从文本数据中学习新词而无法学习到音频数据中新词的问题,提出了一种基于混合语音识别系统的发音字典新词学习方法。该方法首先分别采用音节和字母音素对混合识别系统对音频数据进行集外词识别,利用系统间的互补性得到尽可能多的新词及其发音候选,然后借助感知器与最大熵模型对得到的新词及发音进行优化,降低错误率,最后实现发音字典的扩展,并利用语法语义信息完成对语言模型参数更新。基于华尔街日报(WSJ)语料库的连续语音识别实验表明:该方法可以有效学习到音频数据中的未知新词,采取的数据优化策略极大地提高了所得新词及发音的精度;在词错误率指标下,字典扩展后系统的识别性能相对基线系统提高约13.4%。  相似文献   

20.
在识别系统中,建模单元能够勾画一种语言的声学和语音学特性,因此对系统性能起到至关重要的作用。该文参照一些已在大词汇量连续语音识别系统(LVCSR)中取得较好效果的建模单元集,构建了新的音素建模单元集(Ne-wPS)。另外,根据NewPS中元音及其变体对前后接音素协同发音的影响,提出了基于扩展的元音三角图设计问题集(NewQS)的方法。实验表明:NewPS和NewQS结合的识别性能超越了传统的声韵母建模单元集;并且,建模单元数目大幅度的减少给系统后续模块的处理带来了便利。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号