期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

马晓梅李雪耀《中国新技术新产品精选》2008,(15):27-28

关键词确认是语音识别中一个重要的研究方向。对于关键词确认系统来讲,废料模型的结构和类型对整个系统的性能有很大的影响。文中提出了一种基于音节格的废料模型。实验表明,与传统的基于音素类的废料模型相比,关键词确认率有了很大的提高。相似文献

2.

马晓梅《科学技术与工程》2011,11(13):2967-2970,2976

关键词检测技术是语音识别领域中一个重要的研究方向。对于关键词检测系统来讲,若要求达到高检测率的同时希望虚报率较低,仅仅建立关键词模型是不够的。填料模型的结构和类型对整个系统的性能相对会有更大的影响。对于非特定说话人的连续语音中出现的非关键词语音提出建立一种新的有效的基于词表树结构的填料模型。实验结果表明,与传统的基于音节格和音节聚类的填料模型相比,关键词的检测率有了很大的提高,系统的综合性能较好,具有一定的可行性和实用性。相似文献

3.

噪声环境中基于HMM模型的语音信号端点检测方法 总被引：8，自引：1，他引：8

朱杰韦晓东《上海交通大学学报》1998,32(10):14-16

在噪声环境下如何提高语音信号端点检测的准确性是自动语音识别（ＡＳＲ）研究中的一个重要课题．常用的基于短时能量的端点检测方法对于能量较低的音节或在信噪比较低的环境下,检测性能不够理想．讨论了一种基于ＨＭＭ模型的语音信号端点检测方法．先用训练的方法生成背景噪声和废料的模型,再用Ｖｉｔｅｒｂｉ解码算法对待测信号进行处理,并给出了具体的实现方法．实验测试结果表明,基于ＨＭＭ的端点检测方法的检测性能接近于人工检测,方法是有效的．相似文献

4.

基于音素后验概率的样例语音关键词检测方法

《天津大学学报(自然科学与工程技术版)》2015,(9)

低资源条件下的语音关键词检测是一个具有挑战性的问题,因为传统的基于大词汇量连续语音识别(LVCSR)的语音关键词检测方法不再适用.针对此问题提出了一种基于深度神经网络(DNN)输出层后验概率特征和改进的动态时间规整(DTW)算法的语音关键词检测方法.采用无监督高斯混合模型(GMM)和中、英文DNN音素模型得出的输入特征构建互补的子系统,并在SWS2013多语种数据集上进行实验.结果表明:相对于基线系统,分数层面的多语种、多系统融合能够有效地提升语音关键词检测系统的性能. 相似文献

5.

基于BPNN/HMM神经网络的声学模型研究 总被引：1，自引：0，他引：1

李凡吴军黄刚《华中科技大学学报(自然科学版)》2004,32(9):9-11

研制了一种基于BP神经网络和隐马尔可夫模型(HMM)的混合声学模型,BP神经网络的主要功能是把失真语音特征矢量转换成纯净语音特征矢量,而删则对转换后的纯净语音特征矢量进行分类,从模型级补偿的方面来提高语音识别系统的鲁棒性．讨论了一种基于线性预测的MKCC语音特征提取方法,该方法把提取出的失真语音特征矢量作为神经网络的输入,从而实现了特征参数级去噪处理的目的．相似文献

6.

基于离散HMM的非特定人关键词提取语音识别系统 总被引：2，自引：0，他引：2

汪鹏刘加刘润生《吉林大学学报(理学版)》2003,41(3):347-351

设计了一个基于离散隐含马尔可夫整词模型的非特定人汉语小词表关键词提取语音识别系统, 提出一种基于对前向、后向搜索得到的关键词假设做二次识别的置信度策略. 将该置信度用于关键词提取系统的说话验证, 得到了良好效果. 相似文献

7.

基于隐马尔可夫模型的非母语说话人口音识别

赵征鹏杨鉴普园媛尉洪《云南大学学报(自然科学版)》2004,26(B07):43-46

基于云南境内说话人母语为纳西语、僳僳语的汉语普通话语音，采用隐马尔可夫模型(HMM)，由标准普通话语音库训练得到基线系统的声学模型(HMMSTD)．然后以基线系统的声学模型为初始模型，分别用母语为纳西语、傈僳语的汉语普通话语音训练得到各自的声学模型(HMMNX和HMMLS)，对于未知语音，根据各识别系统的概率得分。采用最大概率准则进行口音的分类判决．实验表明，基于HMM的口音识别系统，其正确识别率达93％。相似文献

8.

基于复高斯混合模型的鲁棒VAD算法

雷建军杨震刘刚郭军《天津大学学报(自然科学与工程技术版)》2009,42(4)

针对语音激活检测的鲁棒性问题,提出在非平稳噪声环境下使用基于复高斯混合模型的鲁棒语音激活检测算法.算法中假设纯净语音谱满足复高斯混合模型,先验信噪比利用预先训练好的复高斯混合模型计算得到.复高斯混合模型的引入一方面提高了语音激活检测的性能,另一方面避免了使用基于最小均方误差语音增强的先验信噪比估计过程.实验中使用NOISEX-92噪声库来验证系统在噪声环境下的性能.结果表明,该种算法在非平稳噪声环境下具有良好的检测性能. 相似文献

9.

随机轨迹模型中汉语连续语音识别基元的选取方案

黄心晔施嵘富煜清陆佶人《东南大学学报(自然科学版)》1999,29(4):94

在比较各种汉语语音识别基元的基础上,结合汉语语音和随机轨迹模型的特色,提出了以音素类单元作为汉语连续语音识别系统的识别基元．基于音素基随机轨迹模型的汉语连续语音识别系统的实验结果表明,该方案可行．相似文献

10.

语音关键词识别系统声学模型构建综述

《燕山大学学报》2017,(6)

语音关键词识别技术作为语音识别的重要分支在20世纪90年代逐渐被重视起来,时至今日,语音关键词识别技术已经被应用到车内语音命令识别、机器人交互及特殊语音筛选等众多领域。本文给出了语音关键词识别技术的整体模型及性能评价指标,综述了语音关键词识别系统声学模型构建技术的现状,详细总结了语音关键词识别系统声学模型构建技术,并重点总结了深度学习在声学模型构建上的应用。最后对语音关键词识别技术的发展前景进行了讨论,认为深度学习隐马尔科夫混合模型作为连续语音识别中最成熟的模型构建技术将在关键词识别中有更多应用,循环神经网络有可能凭借其序列训练能力成为更有效的模型构建技术,而大计算量、云平台及便携可穿戴将会成为语音关键词识别技术发展的主流方向。相似文献

11.

基于拼音图的两阶段关键词检索系统

罗骏欧智坚王作英《清华大学学报(自然科学版)》2005,45(10):1356-1359

针对当前关键词检索系统中单阶段系统检索速度慢,基于大词汇量连续语音识别(LVCSR)的两阶段系统又不够稳健的现状,提出一种新的基于拼音图的两阶段检索系统以满足快速、稳健检索的需要。两阶段分为预处理阶段和检索阶段。预处理阶段将语音数据识别成具有高覆盖率的拼音图。检索阶段响应用户的频繁查询,在拼音图中查找出与关键词拼音匹配的拼音串,并采用基于N元拼音文法的前后向算法计算置信度以实现对检索结果的筛选。实验表明:系统的二字词召回率及正确率可达72.19%和72.68%,三字词召回率及正确率可达73.51%和82.98%,均优于LVCSR系统,且检索阶段仅需0.01倍实时,具有良好的实用价值。相似文献

12.

基于自回归模型的加性噪声环境稳健语音识别

刘敬伟王作英肖熙《清华大学学报(自然科学版)》2006,46(1):50-53

为提高噪声不平稳或不可估的情况下语音识别的稳健性,提出了利用自回归模型和短时平稳性假设,估计干净与噪声环境的语音数据,建立相应的语音识别模型,以达到抗噪效果的稳健语音信号处理方法。在N o iseX-92的4种噪声环境(w h ite,babb le,vo lvo,destroyer eng ine)从0到20 dB的不同信噪比下的“863”大词汇连续语音标准数据库的平均识别结果表明,该方法能够使得基于段长分布的隐M arkov模型的语音识别系统在25候选时声学层的音节相对错误率下降达到10.85%以下,同时相对正确识别率上升12.13%。相似文献

13.

段长在汉语语音识别系统后处理阶段的应用

李曜刘加《清华大学学报(自然科学版)》2009,(Z1)

针对传统的隐含马尔可夫模型(hidden Markov model,HMM)存在的缺陷,该文提出了一种在识别的后处理阶段使用段长模型的方法,并应用在基于HMM的汉语识别系统上。该方法利用归一化的段长模型对识别系统的解码结果重新打分,比较前后两次算出的分数从而选出更可靠的识别结果。实验表明,通过该方法将段长模型应用在识别过程中,可以显著提高识别系统的性能,大量减少识别结果中的插入错误。数据显示,该方法使识别系统的音节错误率下降了大约10%,识别系统最终的插入错误和删除错误都低于1%。相似文献

14.

基于音节间相关识别单元的汉语连续语音识别算法

赵庆卫王作英陆大《清华大学学报(自然科学版)》1999,39(9):391

为提高汉语连续语音识别系统的性能,建立了音节间相关的半音节识别单元,并研究了基于这种单元的连续语音识别算法。讨论了基于ＤＤＢＨＭＭ模型和最大后验概率估计准则的连续语音识别的理论基础,依据动态规划的基本原理,提出了一种基于音节间相关的识别单元的汉语连续语音识别算法。依照这种算法,不但能得到最优句子侯选,而且能够在识别过程中得到音节格（即Ｎｂｅｓｔ句子侯选）的数据结构。最后通过大词汇量非特定人连续语音识别的实验,表明了采用音节间相关的识别单元比基本的识别单元误识率有明显的降低相似文献

15.

汉语连续语音识别中上下文相关的声韵母建模 总被引：8，自引：1，他引：8

李净郑方张继勇吴文虎《清华大学学报(自然科学版)》2004,44(1):61-64

声学建模是汉语连续语音识别中的关键步骤之一。根据汉语语音的特点,采用扩展声韵母(XIF)作为识别基元,并针对XIF基元设计了相应的问题集,利用基于决策树的状态共享策略建立上下文相关声韵模型(Tri-XIF)。将Tri-XIF模型与上下文相关音素模型(Tri-phone)、上下文无关音节模型进行了对比。提出了几种方法用于改善标注、改进问题集和降低模型规模。实验结果表明,Tri-XIF模型与Tri-phone模型、音节模型相比,识别性能有了很大提高,其音节误识率分别降低了24.53%和41.65%。采用了所提出的优化策略后,模型规模降低20%以上,而性能下降很少。相似文献

16.

汉语语音识别策略的研究

邝继顺何鎏藻《湖南大学学报(自然科学版)》1993,20(2):33-39

相似文献

17.

基于 CNN 和 Group Normalization 的校园垃圾图像分类

王玉王梦佳张伟红《吉林大学学报(信息科学版)》2021,38(6):744-750

为解决大学校园的垃圾回收分类问题, 提出了一种基于卷积神经网络和归一化技术的垃圾图像分类方法, 不需要对输入的图像进行复杂的处理, 网络模型即可根据算法提取图像特征, 通过加入群组归一化(GroupNormalization)和网络模型各层之间的协作, 克服传统分类算法的缺点, 实现对垃圾图像的分类。实验表明,该识别方法具有较高准确率, 可以较好识别不可回收及可回收垃圾。相似文献

18.

汉语中新词识别方法研究

王倩倩范通让《河北省科学院学报》2014,(2):35-40

随着互联网和社会的飞速发展,新词不断涌现。识别和整理这些新词语,是中文信息处理中的一个重要研究课题。提出一种新词识别方法,该方法利用基于PAT-Array的重复字符串抽取候选串,提高了新词的召回率。并在此基础上分析新词内部模式,添加了垃圾串过滤机制。单字串过滤主要是运用垃圾词典的方法,多字词模式新词的确定是利用改进的互信息与独立成词概率结合的方法。由此,大幅度提高了新词识别的准确率。相似文献

19.

普通话连续数字串语音识别的持续时间模型

董蓉袁俊朱杰《上海交通大学学报》2002,36(10):1529-1532

在普通话连续数字串的识别中，与传统HMM在持续时间模型上的错误假设有关的删除与插入错误所占比例可达24．23％。基于此，在Viterbi解码中引入持续时间模型信息。对多种带参函数分布的持续时间模型在理论和实验上的比较分析都证明了Gamma分布更能精确反映汉语字模型的持续时间特性。文中还在外惩罚模型的基础上提出预理分段内惩罚持续时间模型和全局内惩罚持续时间模型两种改进算法。实验表明，结合持续时间模型的语音识别算法可以有效地减少删除与插入错误率，使总体识别错误率比基带系统减少了47．74％。相似文献