首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 234 毫秒
1.
提出了一种可用于嵌入式ASR系统的语音/噪声分类的新方法,该方法利用一个噪声模型,对每帧信号的评价值进行语音/噪声分类.实验表明,该方法可以有效地区分语音和噪声,并表现出在各种噪声环境和不同信噪比条件下的鲁棒性.该算法已经集成进一个ASR系统,并在Corn-paq iPAQ上进行了测试,其计算代价不到整个系统代价的10%.  相似文献   

2.
汉语数码语音识别中一种新的抗噪声特征参数   总被引:1,自引:1,他引:0  
为了提高中小词汇量语音识别系统在噪声环境下的识别性能,以10个汉语数码语音为对象,利用汉语数码语音信号区别于噪声信号的准周期特性,提出了一种汉语数码语音频谱包络峰值特性的提取方法,首先用基频对语音频谱采样得到由谐波值构成的包络以提高信噪比,然后再对所得包络进行峰值提取得到汉语数码语音的峰值特征。实验结果表明,在信噪比大于5dB时,用该方法得到的峰值特征具有一定的抗噪性。  相似文献   

3.
基于多尺度分形维数的汉语语音声韵切分   总被引:10,自引:0,他引:10  
针对低信噪比环境 ,提出一种汉语语音声韵母切分新方法。以语音信号非线性产生机制中存在混沌特性为依据 ,将普通分形维数扩展为多尺度分形维数 ,用于考察语音信号在不同最大观测分辨率下的局部自相似性。利用稳定声韵母段及其之间过渡段在多尺度分形维数上的不同特性能较好地区分二者。由此针对汉语音节“声母 +韵母”的结构特点设计了一种简单而高效的汉语语音声韵母切分方法。在干净语音测试集下测试 ,切分正确率为 95 .2 % ;在信噪比为10 d B的噪声环境下 ,正确率达到 82 .3%。  相似文献   

4.
提出短时能频值(EFV)的新概念,设计了用短时能频值的参量来估计语音起止点的新的有效算法,提高了语音信号与背景噪声的分辨力。运用基于短时能频值EFV估计语音起止点的算法,研究汉语普通话音素的区别特征,上机计算分析证明了EFV门限能够很好地从噪声中分辨出语音信号,有着较好的稳定性和较高的语音-噪声分辨力。  相似文献   

5.
语音端点检测(voice activity detection,VAD)是在连续语音信号中,将语音和非语言片段分离的技术。VAD在语音识别、说话人识别、语音编码等领域起着重要作用。传统VAD算法在类型已知的噪声环境下可以达到较好的性能,但在实际情况中,未知噪声的影响通常会使系统性能下降显著,在差异化噪声下的VAD是端点检测的研究难点。在总结现有语音端点检测算法基础上,提出了一种基于深度神经网络的语音端点检测方法,同时结合维特比算法,与基于贝叶斯信息准则(bayesian information criterion, BIC)的混合高斯模型(gaussian mixture model,GMM) 语音端点检测系统进行对比,在大词汇连续语音识别系统中的实验结果表明,将深度神经网络结合维特比算法,应用于语音端点检测,在复杂噪声环境下取得了更好的效果,适应性更强。  相似文献   

6.
通过分析汉语语音及非特定人语音特点,选择过零率、能量、基音周期和前两个共振峰作为语音特征,用音素分类的方法构造判决树,在此基础上,给出了一个非特定人普通话孤立数字音(0~9)识别系统,识别率大约为96.6%。  相似文献   

7.
语音增强用于抗噪声语音识别   总被引:12,自引:1,他引:11  
语音识别系统通常是将在安静的环境下训练得到的参数应用于实际环境中。如果实际环境也是安静的 ,则语音识别系统可以令人满意地工作。然而 ,当实际环境中有噪声存在时 ,语音识别系统性能急剧下降。为了让语音识别系统在安静的环境和有噪声的环境中都获得令人满意的工作性能 ,研究了一个将语音增强器和语音识别器级连起来的系统。该系统中 ,语音增强作为前端处理用于提高识别器输入端信号的信噪比。通过 3种不同的增强算法用于纯净语音和3种类型带噪语音的实验结果分析比较表明 ,这一方法对纯净语音的识别精度几乎没有任何改变而大大提高了系统的抗噪声性能  相似文献   

8.
针对基于短时能量和过零率相结合的语音边界检测法在实际应用中的不足,提出了一种改进方法——基于短时相关性和极值点的语音边界检测法,并在MATLAB环境下进行实验测试,在语音客观评价及语音识别算法中取得了良好的效果.  相似文献   

9.
根据语音的发声特点,基于分析语音信号中的基音频率和语音之间的关系,提出一种在强噪声环境下实现提高语音识别率的方法,并对基于基音频能值的端点检测算法和传统语音端点检测算法进行比较.实验结果表明该方法不仅能够有效提高语音段的检测率,同时还具有计算量小、实时性高、不受噪声影响即鲁棒性好等特点.  相似文献   

10.
由于战场使用环境的特殊性,环境噪声成为军事命令语音识别技术实用化的一个主要障碍。该文利用模型补偿技术,对噪声环境年军事命令语音识别进行探索。重点研究噪声环境下的并行模型组合算法(PMC),详细论述其原理以及在噪声环境下的语音识别中的应用。实验使用了48个高炮射击口令,分别在3种不同噪声,不同信噪比条件下对该方法进行识别率测试,结果表明,该方法具有一定的实际应用价值。  相似文献   

11.
语音识别中基于模糊聚类分析的参数聚类   总被引:1,自引:0,他引:1  
徐向华  朱杰  郭强 《上海交通大学学报》2004,38(12):2086-2088,2093
为减少语音识别中声学模型的参数量,提高参数训练的鲁棒性,基于声学决策树结构,提出利用模糊聚类分析方法对模型参数聚类,包括高斯聚类和方差共享.对大词汇量汉语连续语音识别的实验结果表明:高斯模糊聚类使高斯数减少25%时,识别率提高了0.15%.进一步做模糊方差共享,当方差减少到初始模型的24%,与同样参数量的未进行聚类的模型相比,误识率下降了3.01%,证明了模糊聚类分析在语音参数聚类中的有效性.  相似文献   

12.
分析了潜语义分析语言模型在建模和解码过程中的主要问题, 实现了潜语义分析语言模型的建模, 并提出一种在连续语音识别系统一遍解码框架中融合的方法. 实验结果表明, 该方法可有效地提高大词汇汉语连续语音识别系统的性能.   相似文献   

13.
一种基于自适应模糊滤波的语音增强方法   总被引:1,自引:0,他引:1       下载免费PDF全文
在语音识别和语者识别中,通常需要先将输入的语音信号进行去噪处理,这样可使识别的正确率大大提高,通常采用基于LMS算法和RLS算法的自适应线性滤波器来进行去噪。提出了一种基于自适应模糊滤波器的语音增强方法,该模糊滤波器是一种非线性滤波器,它在语音信号的特征域空间采用参数映射的方式来滤除噪声,并能够进行自适应结构调整和参数更新。实验结果表明,采用自适应模糊滤波器来滤除噪声比线性滤波器具有更好的效果。  相似文献   

14.
为提高噪声不平稳或不可估的情况下语音识别的稳健性,提出了利用自回归模型和短时平稳性假设,估计干净与噪声环境的语音数据,建立相应的语音识别模型,以达到抗噪效果的稳健语音信号处理方法。在N o iseX-92的4种噪声环境(w h ite,babb le,vo lvo,destroyer eng ine)从0到20 dB的不同信噪比下的“863”大词汇连续语音标准数据库的平均识别结果表明,该方法能够使得基于段长分布的隐M arkov模型的语音识别系统在25候选时声学层的音节相对错误率下降达到10.85%以下,同时相对正确识别率上升12.13%。  相似文献   

15.
IntroductionA speech signal is normally mixed with many kindsof noises,which can significantly decrease theperformance of a speech recognizer.The highconcentration of energy in the low frequency rangeobserved for most speech spectra is considered anuisance because it makes less relevant the energyof the signal at middle and high frequencies[1] . The performance of automatic continuous speechrecognition (ACSR ) systems dramaticallydecreases when they are trained and used indifferent environm…  相似文献   

16.
吴兰  杨攀  李斌全  王涵 《广西科学》2023,30(1):52-60
视听语音识别(Audio-Visual Speech Recognition,AVSR)技术利用唇读和语音识别(Audio-Visual Speech Recognition,AVSR)的关联性和互补性可有效提高字符识别准确率。针对唇读的识别率远低于语音识别、语音信号易受噪声破坏、现有的视听语音识别方法在大词汇量环境噪声中的识别率大幅降低等问题,本文提出一种多模态视听语音识别(Multi-modality Audio-Visual Speech Recognition,MAVSR)方法。该方法基于自注意力机制构建双流前端编码模型,引入模态控制器解决环境噪声下音频模态占据主导地位而导致的各模态识别性能不均衡问题,提高识别稳定性与鲁棒性,构建基于一维卷积的多模态特征融合网络,解决音视频数据异构问题,提升音视频模态间的关联性与互补性。与现有主流方法对比,在仅音频、仅视频、音视频融合3种任务下,该方法的识别准确率提升7.58%以上。  相似文献   

17.
以模糊集理论为基础,提出了一种汉语指令识别的模糊语音描述和模糊匹配算法,在语音信号的时间规整中,使用一种改进的非线性帧数规整算法,在40条指令的识别实验中,正确率达93%以上。  相似文献   

18.
汉语语音音素分割的一种新方法   总被引:3,自引:0,他引:3  
音素分割在大词汇量连续语音识别的过程中起着重要的作用 .该文提出了一种简单实用的音素分割方法 ,比较好地解决了这个问题 ,并在大词汇量汉语语音识别中得到了应用 ,取得了较好的结果  相似文献   

19.
本文介绍了我们开发的“汉语声控电脑打字机”的结构、功能以及系统实现中的一些关键技术,本系统是一个特定人、孤立词、大词汇量的汉语语音识别与理解系统,其最终识别率可达95%以上。  相似文献   

20.
语音增强是解决噪声污染的有效方法,它的首要目标是在接收端尽可能从带噪语音中恢复纯净的语音信号.讨论强背景噪声下的基于模糊系统的语音增强方法,并与减谱法语音增强算法进行比较.计算机仿真结果表明,该方法在大大消除背景噪声的同时,消除了音乐噪声,同时保持语音信号较好的可懂度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号