首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
为解决文本无关说话人识别中训练与识别环境不同导致模式失配的问题,提出了一种采用语音增强模块进行前端预处理的i-向量说话人识别系统,从而提高系统对于环境噪声的鲁棒性.为评估不同语音增强算法的性能,利用NIST08核心测试集进行仿真实验.采用IMCRA算法对语音进行噪声估计后,分别用维纳滤波法、MMSE-LSA、传统谱减法和多频带谱减法等4种方法进行语音增强前端处理,在基于i-向量的说话人识别系统下进行实验.实验结果表明采用了语音增强的系统具有一定抗噪声性能,并且在高信噪比条件下,基于多频带的谱减法在此系统下性能最佳,而低信噪比情况下MMSE-LSA算法更有优势.  相似文献   

2.
语音增强用于抗噪声语音识别   总被引:12,自引:1,他引:11  
语音识别系统通常是将在安静的环境下训练得到的参数应用于实际环境中。如果实际环境也是安静的 ,则语音识别系统可以令人满意地工作。然而 ,当实际环境中有噪声存在时 ,语音识别系统性能急剧下降。为了让语音识别系统在安静的环境和有噪声的环境中都获得令人满意的工作性能 ,研究了一个将语音增强器和语音识别器级连起来的系统。该系统中 ,语音增强作为前端处理用于提高识别器输入端信号的信噪比。通过 3种不同的增强算法用于纯净语音和3种类型带噪语音的实验结果分析比较表明 ,这一方法对纯净语音的识别精度几乎没有任何改变而大大提高了系统的抗噪声性能  相似文献   

3.
在强背景噪声和强反射环境中,麦克风阵元接收的信号质量很差,从而影响麦克风阵列语音增强系统的性能.我们利用ICA对麦克风阵元接收信号进行分析,这种ICA预处理可以有效抑制背景噪声和回声,真实环境中的实验表明,ICA预处理能够显著改善麦克风阵列语音增强系统的性能.  相似文献   

4.
提出一种以词片为识别基元的特定位置后验概率网格方法,解决了语音检索中的集外词处理问题,实现开集语音文档检索。通过引入前端查询扩展技术生成多个候选查询以补偿语音识别过程带来的误差及用户输入误差。在检索过程中引入编辑距离权重来实现模糊查询,提高系统的查全率并增强系统鲁棒性。实验表明该方法在集外词处理和系统鲁棒性等方面优于传统方法。  相似文献   

5.
单通道语音增强算法自上个世纪60年代已来有了长足的发展,但由于时频域处理的局限性,目前现有的单通道语音增强算法无法有效抑制背景噪声中的突发噪声成分。突发噪声通常表现为短时、能量强、时频域有纹理特征的噪声,在参数上无法和语音进行有效区分。但对于背景噪声中的突发噪声,其在空间上通常是具有方向性。因此,本文提出了一种联合空间和时频域的语音增强系统。即在语音采集的前端使用GSC麦克风阵列形成波束,使主瓣对准期望语音信号、旁瓣对准突发噪声从而从空间上抑制突发噪声,然后对采集到的语音信号进行时频域语音增强处理。本文选取MMSE-LSA作为时频域的处理算法,因其在保留语音的可懂度、自然度方面有突出的性能。实验表明,该系统可以有效地抑制含有突发噪声的背景噪声。  相似文献   

6.
单通道语音增强算法自20世纪60年代以来有了长足的发展,但由于时频域处理的局限性,现有的单通道语音增强算法无法有效抑制背景噪声中的突发噪声成分。突发噪声通常表现为短时、能量强、时频域有纹理特征,在参数上无法和语音进行有效区分。但背景噪声中的突发噪声,在空间上通常具有方向性。因此,提出了一种联合空间和时频域的语音增强系统。即在语音采集的前端使用GSC麦克风阵列形成波束,使主瓣对准期望语音信号、旁瓣对准突发噪声从而从空间上抑制突发噪声,然后对采集到的语音信号进行时频域语音增强处理。选取MMSE-LSA作为时频域的处理算法,因其在保留语音的可懂度、自然度方面有突出的性能。实验表明,该系统可以有效地抑制含有突发噪声的背景噪声。  相似文献   

7.
语音增强是语音信号处理领域一种传统且依然非常活跃的研究分支。单通道语音增强是指从单个麦克风采集的带噪语音中尽可能恢复出干净语音,在移动通信、语音交互、数字助听等领域有重要的应用价值。传统的单通道语音增强技术在处理平稳噪声时已取得较好的增强性能,但在非平稳噪声条件下增强效果依然难以令人满意。近年来,随着人工智能的快速发展,基于深度学习的单通道语音增强在处理非平稳噪声问题方面已取得明显的进展。通过系统梳理单通道语音增强中深度学习方法的发展,并按照技术发展脉络,分基于参数映射、基于生成对抗机制和基于弱监督3个方面进行综述,介绍三类方法的基本原理,分析典型文献的技术思路,总结三类方法的优势与存在的问题,最后对深度学习技术在单通道语音增强领域的发展进行了展望。  相似文献   

8.
在实际应用中,噪声干扰导致语音识别性能急剧下降。针对该问题,本文分析传统方法并提出相应的系统解决方案:采用小波变换对语音信号进行前端处理,以MFCC声道特征结合基频(F0)韵律特征来提高识别系统的鲁棒性。实验结果表明:小波变换能有效地消除噪声影响,经小波降噪处理后,使得F0-MFCC联合模型能更好的识别语音。可以看出在噪声环境下系统的综合性能得到很大改善。  相似文献   

9.
基于调制域谱减法的鲁棒性说话人识别   总被引:1,自引:1,他引:0  
针对说话人识别性能在噪声环境下急剧下降的问题,提出了基于调制域谱减法的鲁棒性说话人识别方法。首先在说话人识别前端通过调制域谱减法对含噪语音进行增强处理,然后通过Gammatone滤波器组提取对噪声具有抑制作用的特征,最后与说话人模型进行匹配识别。仿真结果表明,运用此方法能显著抑制噪声对说话人识别系统的影响,提高系统的识别率。  相似文献   

10.
语音识别门禁系统关键技术研究   总被引:1,自引:0,他引:1  
通过对语音识别技术的原理进行分析,结合特定人语音识别技术在门禁系统中的具体应用,从语音信号的预处理、信号端点检测、特征信号的提取到识别策略的算法等关键技术上进行研究,从技术角度阐明了该系统在理论上的合理性和可行性,并通过实验说明系统在噪声干扰的情况下性能没有明显的下降。  相似文献   

11.
语音增强技术在低速语音编码中的应用   总被引:1,自引:1,他引:0       下载免费PDF全文
在语音编码的应用环境中,特别是在军事应用中,强噪声环境下声码器性能的改进是一个亟待解决的问题。在研究语音增强技术的基础上,将语音增强技术于低速语音编码,有效地改善了低速语音编码算法的抗背景噪声的性能。并利用所构建的语音质量客观评价平台,对语音增强低速编码算法的抗背景噪声性能进行了客观评估与分析。  相似文献   

12.
通过对语音识别技术的原理进行分析,结合特定人语音识别技术在门禁系统中的具体应用,从语音信号的预处理、信号端点检测、特征信号的提取到识别策略的算法等关键技术上进行研究,从技术角度阐明了该系统在理论上的合理性和可行性,并通过实验说明系统在噪声干扰的情况下性能没有明显的下降.  相似文献   

13.
介绍了语音失真测度系统的构成以及实现的算法思想.采用前端处理技术.实现了对重放语音信号进行分帧、端点检测等特征的提取,获得了以Mel尺度倒谱参数作为衡量语音失真测度的特征向量.采用动态时间弯折算法,获得了用于语音质量客观评价的语音失真测度.  相似文献   

14.
针对加性有色噪声干扰,提出了一种单通道输入基于信号子空间的话音增强算法。算法中使用自适应的方法跟踪KLT(Karhunen—Loeve Transform)阵。运用一种近似模型来表述有色噪声的特性,并基于噪声平稳的假设,通过采用预处理技术的语音活动性检测(VAD:Voice Activity Detection)单元获取噪声样本,用于下一语音帧中噪声特性的估计和增强处理。实验表明,算法对于有色噪声干扰下的语音信号有较好的增强效果,并且性能优于改进减谱法。  相似文献   

15.
吴荣娣 《科技信息》2010,(24):132-132,134
介于环境条件的变化以及噪声等因素的影响,识别系统的性能急剧下降的原因而出现的鲁棒性语音识别研究,其试图解决的就是如何在实际环境下提升语音识别系统性能的问题。在理论上,噪声鲁棒性所面临的问题其实就是训练和识别环境之间的不匹配。而这种不匹配通常都会体现在特征参数概率分布的差异上。特征参数规整(归一化,Normalization)可以在一定程度上减小这种不匹配的程度,进而提升系统性能。通常的抗噪声方法主要可以分为三种:前端处理、特征值处理以及模型补偿。直方图均衡化(HEQ)属于特征值处理抗噪声方法的类型。作为一种能够改善线性转换方法缺点的替代方法,直方均衡法(HEQ)已经被用于弥补声失配。  相似文献   

16.
听觉掩蔽门限在说话者识别中的应用   总被引:2,自引:0,他引:2  
语音信息在人的听觉系统中的表示具有一定的冗余性.利用这一特性把丢失数据技术应用于噪声环境下说话者识别系统的性能改进.听觉掩蔽效应这一听觉现象被用来检测语音信号频谱中被噪声严重干扰的“丢失成分”.经过丢失数据补偿技术结合语音增强处理,说话者识别系统在不利环境下的准确率得到了提高.通过对宽带噪声- 白噪声和一种特殊噪声——汽车噪声干扰下语音的说话者辨认实验,发现这种方法优于单独使用语音增强方法.  相似文献   

17.
调频语音通信技术具有抗干扰性能好、易于实现的特点,但在水声信道多径条件下调频体制传输的水声语音质量受到严重影响.针对此问题在调频语音通信体制下引入时间反转处理,通过抑制多径效应聚焦能量提高信号信噪比,改善调频水声语音通信性能,并采用客观语音质量评估(perceptual evaluation of speech quality,PESQ)方法对调频水声语音通信质量进行评估.海洋试验证明,时间反转处理可有效提高调频水声语音通信系统性能.  相似文献   

18.
本文主要研究语音增强系统在短时频域内,以对数最小均方误差作为语音幅值估计的准则.对含噪语音进行消噪处理。首先推导了公式,并从理论上作了分析研究.在此基础上作了大量实验,与类似的最小均方误差短时谱幅值估计法(MMSE STSA)作了性能比较.实验结果表明,由MMSE LOG-STSA增强方法得到的语音输出的质量优于由MMSA STSA方法得到的质量.语音的失真度和清晰度均有显著改善,同时大大降低了语音中的“音乐噪声”.  相似文献   

19.
提出了一种将基音同步叠加技术用于汉语文语转换系统的方法。主要介绍了系统的基本组成、语音基元选择、语音库的结构和检索、文本的预处理、合成规则、基音同步叠加技术等。该系统在语言学处理中采用了分词精度较高的基于词形统计的汉语文本切分算法 ;韵律处理采用了能有效控制合成语音韵律的语音合成规则 ;声学处理采用了基音同步叠加技术进行语音合成 ,易于调整合成语音的音高、音长和音强。测试表明 ,本系统语音输出清晰度达 95 % ,自然度达 8.1分 (按 10分制 ) ,基本达到实用的要求  相似文献   

20.
利用改进的SVM分类算法处理汉语语音识别结果文本的分类问题,针对语音识别文本的特点简化了文本分类的预处理过程,调整支持向量机的分类超平面,并且自动优化参数,结合实际的识别结果文本集测试了改进的SVM性能,同时实现了KNN和贝叶斯分类算法,对3种分类性能进行了评价.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号