首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 109 毫秒
1.
为了进一步提高矢量Taylor级数(VTS)算法的模型补偿精度以及在噪声环境下的识别性能,提出将无监督聚类与VTS算法相结合。无监督聚类算法利用噪声模型之间的Kullback-Leibler距离将含噪语音段划分为若干个子段。然后针对各个子段分别进行一阶Taylor级数展开,并在此基础上逐段估计噪声参数和补偿声学模型。该算法结合一个中文数字串识别系统进行实验,在Babble噪声和Gauss白噪声环境下该算法的误识率相对传统的VTS算法分别下降了27.7%和17.8%。证明这种结合无监督聚类的分段VTS算法能够更加有效地将语音和噪声在倒谱域上的非线性混合模型用一阶线性模型来近似。  相似文献   

2.
针对噪声环境下语音识别系统性能下降的问题,提出一种基于语音时频相关性的Mel特征矢量聚类补偿算法。该算法首先实现掩码估计,利用纯净语音信号时域和频域的相关性,实现了时频块的有效划分和基于时频块的语音特征聚类。在此基础上,对带噪语音的Mel语谱进行特征补偿。采用HTK工具和TIDIGITS数据库加入不同类别噪声的语音测试结果表明:该算法在不同信噪比条件下,获得了较基于频域相关性聚类特征补偿算法更好的性能。  相似文献   

3.
提出了一种基于SDCN算法的鲁棒性语音命令识别。依赖于信噪比的倒谱正常化(SDCN)算法直接在倒谱域根据输入语音帧的信噪比(SNR)来增加一补偿矢量,从而恢复未受污染的净语音信号,补偿矢量直接从训练环境和测试环境中记录的语音倒谱中逐帧比较得到,该算法对退化的环境具有很强的鲁棒性,实验结果证明,该算法简单,有效。  相似文献   

4.
传统的倒谱平滑维纳滤波算法在求取选择性平滑范围时,噪声会对维纳增益函数的倒谱产生影响,使估计出的选择性平滑范围不正确,进而导致此传统算法在平滑掉音乐噪声的同时也影响了噪声抑制效果。为此提出了一种基于修正倒谱平滑技术改进的维纳语音增强算法,该算法先用最大似然准则估计出纯净语音的倒谱,然后在纯净语音倒谱中求取基频和共振峰的位置,进而得到选择性平滑的范围。该方法提高了选择性倒谱平滑的准确性,进而改善了传统倒谱平滑维纳滤波语音增强算法的噪声抑制效果。最后在不同的噪声场景中对传统算法和改进算法进行了仿真对比,表明该算法能够在去除噪声的同时更好地保留语音的特征结构,较好地提高了带噪语音的质量。  相似文献   

5.
为提高卷积环境下语音识别系统的鲁棒性,提出了一种基于时/频ICA(independent component analysis)的卷积噪声模型估计方法.所提算法首先使用ICA方法从含噪语音信号中提取纯净语音信号的短时功率谱,然后在MEL滤波器组域内将含噪语音的短时谱减去纯净语音的短时谱,并根据去噪后卷积噪声的短时谱估算其HMM(hidden markov model)模型.在仿真和真实环境下进行了语音识别实验,其识别正确率相比较传统的卷积噪声估计方法分别提升了4.70%和4.75%.实验结果表明,论文所提算法能够实现对卷积噪声的精确估计,并有效提升卷积噪声环境下语音识别系统的性能.  相似文献   

6.
基于浊音语音谐波谱子带加权重建的抗噪声说话人识别   总被引:1,自引:0,他引:1  
提出了一个基于浊音语音谐波谱重建的说话人识别算法.该算法根据浊音语音短时频谱的结构特征和基音信息,对浊音语音谐波结构频谱进行子带加权重建,以补偿由噪声引起的训练与测试条件的失配.算法基于重建浊音频谱提取感知线性预测倒谱系数,与基音相组合作为说话人的语音特征参数矢量,采用高斯混合模型对说话人进行建模.仿真实验的结果表明:所提出的浊音谱重建方法对多种类型含噪语音的噪声补偿均具良好效果,可以明显提高在噪声环境下的与文本无关的说话人识别的识别率,特别是显著提高低信噪比环境下的识别率,而不会明显降低纯净语音和高信噪比环境下的识别率.  相似文献   

7.
单通道语音增强中,已有的先验信噪比算法能有效地去除噪声,提升语音增强算法性能;但是由于在噪声功率谱估计不准确,造成噪声功率出现过估和低估的情况,造成了语音失真和保留较多残留噪声。通过倒谱处理能在含噪语音段中抑制语音中的谐频成分和在纯噪声段中避免部分较强的噪声成分误判为语音信号,准确地估计出噪声功率谱,同时语音失真不大。在多种噪声背景下的客观评价指标分析表明,经过倒谱处理后的先验信噪比估计算法能提高先验信噪比算法的估计性能。  相似文献   

8.
为了提高噪声估计的准确性,改进语音增强方法性能,在改进的最小控制递归平均算法(Improved Minima Controlled Recursive Averaging,IMCRA)的基础上提出了一种基于噪声分类的语音增强方法。该方法首先对含噪语音进行噪声类型的判断,然后根据判定的噪声类型选取相应的最优参数进行噪声估计,最后采用最优修正的对数谱幅度语音估计计算增强后的语音。该方法相对于传统IMCRA算法,在语音信号的还原和背景噪声的抑制两方面都有较好的性能。  相似文献   

9.
该文提出了一种基于修正倒谱模型的改进的倒谱基音检测算法.该算法首先对分帧语音进行10阶线性预测编码(LPC)分析和逆滤波,获得LPC预测残差;然后对残差信号进行倒谱分析,倒谱分析中采用了离散傅里叶变换频谱的高频分量置零的计算措施;最后根据倒谱的特征求得浊音语音的基音周期.仿真检测结果表明:该算法无论对纯净语音,还是对不同加噪情况下的含噪语音,其基音检测结果都明显优于传统倒谱基音检测算法,并且也明显优于基于平均幅度差函数的基音检测算法,而略优于基于自相关函数的基音检测算法.  相似文献   

10.
针对现有语音增强算法在低信噪比(SNR)非平稳噪声环境下的表现并不理想这一问题,提出了一种基于深度学习的语音增强算法.首先,构建了一个深度神经网络(DNN),然后从四个不同分辨率的耳蜗中提取了多分辨率听觉倒谱系数(MRACC)作为神经网络的输入,该系数既关注了细节的高分辨率特征,又把握了全局性的低分辨率特征;其次,跟踪噪声变化构建了一个自适应掩蔽阈值(AM)作为神经网络的训练目标,该阈值能够依据噪声调节理想二值掩蔽(IBM)和理想软掩蔽(IRM)的权重;最后,将估计的自适应掩蔽阈值用于对含噪语音进行增强.实验结果表明:相较于对比算法,该算法不仅可以进一步提高语音质量和可懂度,而且能够抑制更多的噪声.  相似文献   

11.
The performance of automatic speech recognizer degrades seriously when there are mismatches between the training and testing conditions. Vector Taylor Series (VTS) approach has been used to compensate mismatches caused by additive noise and convolutive channel distortion in the cepstral domain, in this paper, the conventional VTS is extended by incorporating noise clustering into its EM iteration procedure, improving its compensation effectiveness under non-stationary noisy environments. Recognition experiments under babble and exhibition noisy environments demonstrate that the new algorithm achieves 35% average error rate reduction compared with the conventional VTS.  相似文献   

12.
该文对语音端点检测的能量状态变迁算法进行了改进,同时把能量差、Lpc系数和倒谱系数应用在改进后的状态机中,得到了新的语音端点检测算法。实验表明,这些改进算法的检测性能很好,端点检测结果准确度高。模拟实验表明,这些算法具有较强的鲁棒性,其中基于倒谱系数的能量状态方法性能最好。  相似文献   

13.
基于传统的Mel倒谱系数(MFCC)系列特征的语音识别系统在噪声环境中的识别性能会急剧下降。为了进行噪声环境中的自动语音识别,提出了一种反映语音信号谐振程度的特征:谐振强度,并用之代替传统MFCC特征中的能量维(零维倒谱C0,或者帧能量E)。在展览馆噪声、人群噪声和汽车噪声等情况下的语音识别实验结果表明:基于这种新特征的语音识别系统比基于传统特征的语音识别系统有更高的平均识别率和更好的抗噪声能力。  相似文献   

14.
混响声场中语音识别方法研究   总被引:1,自引:4,他引:1  
免提式话筒语音识别系统是语音识别走向实用的目标之一.实现这一系统,首先要解决房间效应引起的混响问题.通过讨论室内混响声场中语音的特点,提出用鲁棒性特征参数——滤波规整的Mel频率倒谱参数(FNMFCC,即MFCC参数在对数功率谱域进行低通滤波,倒谱域进行均值减,并用标准差加权进行非线性规整,采用这3种措施来消除混响引起的语音参数的变化.识别方法用矢量量化法,用4组无混响数码语音进行训练,对特定人无混响和4种混响声场中共150组数码音的平均识别率达到98.7%.提出的这一新方法在不降低无混响音识别率的情况下,提高了混响声场的语音识别率.该方法不仅识别率高,而且运算量小、所需内存空间小。易于做成小型实用的快速识别系统.  相似文献   

15.
针对包括环境噪声的混叠语音信号分离困难问题,提出一种新的频域快速定点独立向量分析模型,对混叠语音信号进行盲分离.该模型中的每个源信号以向量形式混合,模型采用二次泰勒多项式把牛顿迭代算法直接应用于复变量对照函数,通过最优化使牛顿迭代规则更加简单和清晰.对实际采集的语音信号进行仿真,实验证明算法很好地分离了卷积盲源信号,新算法具有良好的收敛性和较高的准确性.  相似文献   

16.
单通道语音增强算法自上个世纪60年代已来有了长足的发展,但由于时频域处理的局限性,目前现有的单通道语音增强算法无法有效抑制背景噪声中的突发噪声成分。突发噪声通常表现为短时、能量强、时频域有纹理特征的噪声,在参数上无法和语音进行有效区分。但对于背景噪声中的突发噪声,其在空间上通常是具有方向性。因此,本文提出了一种联合空间和时频域的语音增强系统。即在语音采集的前端使用GSC麦克风阵列形成波束,使主瓣对准期望语音信号、旁瓣对准突发噪声从而从空间上抑制突发噪声,然后对采集到的语音信号进行时频域语音增强处理。本文选取MMSE-LSA作为时频域的处理算法,因其在保留语音的可懂度、自然度方面有突出的性能。实验表明,该系统可以有效地抑制含有突发噪声的背景噪声。  相似文献   

17.
大多数去混响的算法都是基于短时分析,不可避免地带来了截断效应;如果对混响语音进行逆滤波,则要求房间冲激响应满足最小相位.本文提出了一种针对单通道的语音长时分帧的去混响算法.算法采用长时帧分析,有效减小了截断效应的影响.首先对混响语音信号进行长时分帧计算其最小相位分量倒谱,然后根据纯净语音和房间冲激响应倒谱的不同分布,在倒谱域阻带滤波得到去混响语音最小相位分量的估计,根据最小相位倒谱理论,进而可以估计出去混响语音频域的模,最后利用人耳对相位信息的不敏感性,用估计的去混响语音的模和混响语音的相位合成,傅里叶反变换得到去混响语音时域波形.实验表明,该算法有良好的去混响效果.  相似文献   

18.
考虑到传统单通道语音增强算法对噪声抑制的局限性,本文采用由两个微型麦克风阵列组成的双微阵列,利用该阵列空间结构的时空域特性对含噪语音进行处理,提出了一种适用于双微阵列的语音增强算法。该增强算法是将各通道采集到的带噪语音信号先使用对数最小均方误差(Logarithmic Minimunm Mean Square Error,LogMMSE)提升其信噪比,然后利用频域宽带最小方差无畸变响应(MVDR)通过对目标声源信号的获取,保留目标声源方向的信号并抑制其他方向的信号干扰,最后通过一个改进可懂度结合改进最小控制递归平均(Improved Minimum Controlled Recursive Average Algorithm,IMCRA)噪声估计的维纳滤波器来去除噪声残留提升语音质量。仿真实验结果表明,相比传统的单通道语音增强算法,该算法具有良好的噪声抑制性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号