首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
基于子带能量线性映射的噪声中端点检测算法   总被引:8,自引:0,他引:8  
研究噪声环境下的语音端点检测问题。在低信噪比下 ,虽然噪声和语音的频谱分布不同 ,但是传统语音检测算法使用的时域能量没有描述能量在各频域子带的分布 ,对于语音和噪声没有很好的区分性。以前提出的基于时间 -频率的能量参数利用频域的限带能量加上时域能量来进行噪声中的语音检测。但是它们选择频带的依据是语音信号的高能量子带 ,而没有考虑噪声的子带能量分布。该文提出的语音检测方法同时考虑语音和噪声的频域能量分布 ,采用线性映射的方法将 Mel滤波器组的子带能量特征空间映射到噪声和语音最有区分性的一维子空间 ,得到新的特征参数 EL MBE进行语音检测。实验结果表明 ,在噪声环境下基于线性映射的能量参数比时域能量 ,基于时间 -频率的能量有更好语音检测性能。  相似文献   

2.
矢量泰勒级数是一种有效的抗噪声鲁棒语音识别算法.然而在对数谱域,美尔滤波器组的不同通道之间有较强的相关性,因而难以从含噪语音中准确估计噪声的方差.提出了一种基于矢量泰勒级数的倒谱域特征补偿算法.该算法在倒谱域,用一个高斯混合模型描述语音倒谱特征的分布,通过矢量泰勒级数从含噪语音中估计噪声的均值和方差.实验结果表明,此算法能明显提高语音识别系统的性能,优于基于矢量泰勒级数的对数谱域特征补偿算法.  相似文献   

3.
为了进一步提高矢量Taylor级数(VTS)算法的模型补偿精度以及在噪声环境下的识别性能,提出将无监督聚类与VTS算法相结合。无监督聚类算法利用噪声模型之间的Kullback-Leibler距离将含噪语音段划分为若干个子段。然后针对各个子段分别进行一阶Taylor级数展开,并在此基础上逐段估计噪声参数和补偿声学模型。该算法结合一个中文数字串识别系统进行实验,在Babble噪声和Gauss白噪声环境下该算法的误识率相对传统的VTS算法分别下降了27.7%和17.8%。证明这种结合无监督聚类的分段VTS算法能够更加有效地将语音和噪声在倒谱域上的非线性混合模型用一阶线性模型来近似。  相似文献   

4.
针对传统语音端点检测方法在噪声环境下鲁棒性较差以及对语音段检测效果不佳的问题,提出一种多特征融合的语音端点检测方法.首先,提取带噪语音信号的子带谱熵特征和基于Mel频率倒谱系数(Mel Frequency Cepstral Coefficient, MFCC)的投影特征,并将Gammatone频率倒谱系数的第一维系数GFCC0特征应用到语音端点检测任务中;然后,对3类特征进行自适应加权融合,得到适用于端点检测的融合特征;最后,采用模糊C均值聚类自适应估计门限阈值,再通过双门限法得到端点检测的结果.所提方法和已有传统方法相比,在7种噪声环境下均取得了更好的端点检测结果,提升了语音端点检测的准确率,特别是在volvo噪声环境下的端点检测准确率可以达到94.5%以上.  相似文献   

5.
为了提高在噪声环境下语音识别系统的性能,对基于子带独立感知理论的语音识别方法进行了研究.这些方法利用人耳对不同频率信号感知的差异,以及噪声和识别对象的频域特征差异,分别采用线性分析、判决分析、多层感知机以及子带最大似然估计对噪声影响进行补偿.实验表明,子带分析采用非线性策略优于线性策略.基于独立感知假定的子带模型,虽然由于独立性假定丢失了带间相关性,但对于噪声环境下语音识别而言可以捕获噪声和识别对象的频谱差异,从而获得比全带分析更高的鲁棒性.  相似文献   

6.
Wigner-Ville分布是一种双线性时频分布,对多分量信号分析存在交叉项干扰.本文提出了一种基于EEMD和Cohen类时频融合算法,该算法采用EEMD算法将信号从频域上分离为若干个固有模态函数之和,再对伪分量之外的各分量进行Cohen类时频变换并叠加,得到信号的时频分布,消除了信号内部各模态函数之间时频分布的交叉项.通过对EEMD和Cohen类时频融合算法进行仿真,与小波分解和Cohen类联合时频算法、EMD和Cohen类联合时频算法的仿真进行比较,结果表明,该算法抑制交叉项效果最好,重构误差最小,同时抑制了噪声对时频特征的干扰.  相似文献   

7.
病理语音具有强烈的非平稳性和突变性特点,较难分析。S变换具有良好的时频分辨率和时频定位能力。该文将S变换与人耳听觉的Mel特性结合,提出一种能够突出发声器官病变的病理语音特征MSCC(Mel S-transform cepstrum coefficients)。在NCSC语料库上,通过与经典语音倒谱特征MFCC(Mel frequency cepstrum coefficients)和当前常用声学特征的对比,表明MSCC特征对语音中动态、快变的病理信息具有更强的刻画能力。此外,选用F-Score方法对特征进行评价和采用粒子群算法进行特征筛选,MSCC表现出了更好的分类性能。可见,MSCC特征可以为临床诊断提供病理语音的高精准分析。  相似文献   

8.
陈雪芳 《科学技术与工程》2013,13(12):3297-3300
提出了基于远近距离的说话人聚类算法:首先,使用端点检测算法把语音分割成读音段,然后,采用T2公式对近距离的说话人语音段进行聚类得到语音块,最后,使用谱聚类的方法估计说话人数目,对远距离的说话人(语音块)进行聚类。实验结果表明,在近距离的说话人聚类中,使用T2公式比使用BIC和KL在语音块准确率方面分别高出2.62%和13.84%,在远距离的说话人聚类中,使用谱聚类算法基本上可以把语音中的说话人数目计算出来,当说话人数目为15时,类纯度和说话人纯度可以达到78%,说明该算法可以有效地对说话人进行聚类。  相似文献   

9.
为了在复杂电磁环境中实现多跳频信号盲检测,提出一种基于时频图连通域特征的多跳频信号检测算法.首先利用短时傅里叶变换与wigner-ville分布(STFTWVD)组合时频方法完成时频变换,保证时频图的时频分辨率和交叉项抑制,并利用自适应二维维纳滤波去除背景噪声,提高算法抗噪性能;然后采用自适应阈值二值化算法对时频图二值化处理并进行8邻域连通域标记,提取每个连通域的特征组成分类特征集;最后利用改进的K均值聚类算法完成特征集分类,根据分类集统计结果和检测条件实现跳频信号检测.仿真结果表明:本文算法能够有效克服定频干扰、突发干扰和扫频干扰;在低信噪比条件下,算法聚类稳定性较好,跳频检测成功率较高.  相似文献   

10.
基于传统的Mel倒谱系数(MFCC)系列特征的语音识别系统在噪声环境中的识别性能会急剧下降。为了进行噪声环境中的自动语音识别,提出了一种反映语音信号谐振程度的特征:谐振强度,并用之代替传统MFCC特征中的能量维(零维倒谱C0,或者帧能量E)。在展览馆噪声、人群噪声和汽车噪声等情况下的语音识别实验结果表明:基于这种新特征的语音识别系统比基于传统特征的语音识别系统有更高的平均识别率和更好的抗噪声能力。  相似文献   

11.
为了在保证语音增强算法性能的同时,降低算法复杂度,提出了一种巴克域最小统计量控制递归平均噪声估计算法.将带噪信号在巴克域进行分解并进行最小统计量分析,基于此最小统计量控制噪声的递归平均估计.算法基于听觉模型,充分利用巴克带内频带间的相关性,具有较好的噪声跟踪估计性能.该算法复杂度低,适用于常见语音增强方法.仿真结果表明,基于该噪声估计的语音增强可以有效地抑制噪声,增强后语音失真较小,在低信噪比条件下能够有效改善语音编码合成后的语音质量.  相似文献   

12.
基于小波变换的语音激活检测   总被引:4,自引:0,他引:4  
为了提高语音激活检测在多种噪声环境下的检测性能,基于语音与噪声相区别的主要特征,提出了一种基于小波变换的语音激活检测算法.算法将信号频带划分为多个子带,提出用归一化谱分布向量表征信号的谱分布特性,利用小波检测信号分形特征的能力,提出用信号的自相关指数来表征信号的自相关性,结合归一化谱分布向量的线性加权和自相关指数两个因素得出新的激活检测判决准则.实验仿真结果与ITU标准G.729和ETSI标准AMR2中的检测性能进行了分析比较.结果表明,该算法在多种噪声环境下都具有较高的准确率和稳定性.  相似文献   

13.
该文提出一种适用于各种复杂噪声场景下的鲁棒性活动语音检测方法。采用能量、主频率分量和短时谱熵3种声学参数形成三维特征,这3种参数在各种各样的噪声中表现出很强的互补性;在活动语音脉冲检测中,采用K均值聚类算法自适应地选择特征并且计算语音检测过程中所用到的阈值。在美国国家标准与技术研究院说话人评测2008和2012年任务上进行实验,结果表明:所提出的方法在各种不同噪声环境下均具有较好的性能,相比传统的非监督和有监督活动语音检测算法更加鲁棒高效。  相似文献   

14.
语音识别模型中帧间独立假设在给模型计算带来简洁的同时,不可避免地降低了模型精度,增加了识别错误。该文旨在寻找一种既能满足帧间独立假设又能保持语音信息的特征。分别提出了基于k均值和基于归一化类内方差的语音识别自适应聚类特征提取算法,可以自适应地实现聚类特征流的提取。将该自适应特征分别应用在Gauss混合模型-隐Markov模型、基于段长分布的隐Markov模型和上下文相关的深度神经网络模型这3种语音识别模型中,与基线系统进行了实验对比。结果表明:采用基于归一化类内方差的自适应特征可以使得3种语言模型的识别错误率分别相对下降10.53%、5.17%和2.65%,展示了语音自适应聚类特征的良好性能。  相似文献   

15.
在噪声环境下,稀疏表示方法并没有表现出它出色的区分性能,反而由于特征的分散导致性能的大幅下降。根据语音特征参数之间的相关性,提出了一种适用于稀疏表示说话人识别的全局补偿方法。该方法对不同阶特征参数进行逐一分析,目的是为了找出被噪声影响最严重的一阶参数并去除之,以此增强测试语音与训练语音之间的相关性。理论分析和实验结果表明,该方法具有很好的抗噪性能,在信噪比为5d B时,带有白噪声的语句识别率达到了85.7%,而在高信噪比时,其识别率能够达到97.5%,几乎等同于干净语音的识别率。  相似文献   

16.
为了解决现有生物激励设计过程存在的跨领域知识获取难的问题,提出了面向生物激励设计的基于功能特征语义相关性的功能语义聚类和基于环境特征约束适应性的环境约束聚类组成的两阶段知识元聚类算法。将生物激励设计过程跨领域实例知识检索问题转化为对离散的生物领域或工程领域知识元的聚类检索。根据跨领域术语知识表示的不同确定跨领域检索功能词,执行基于功能特征语义相关性的功能语义的一阶段聚类,结合生物领域功能与环境特征约束间的相关性,完成基于不同类型环境特征约束的二阶段聚类。一方面,将模糊理论与模糊数学引入知识元聚类算法中,提出基于模糊隶属度函数的语义相似度计算方法,实现了基于功能关键字的语义聚类;另一方面,将FCM聚类算法引入到知识元聚类过程中,结合给出的不同类型环境特征约束相似性算法,提出了AFCM算法,实现了基于环境特征约束适应性的环境约束聚类。最后,开发了相应的原型系统,并且以视觉假体装置设计为例进行测试。结果表明,聚类时间和准确率得到极大改善,聚类效率得到显著提升。该算法有效地避免了跨领域知识分布的离散性,减少了设计过程中研究对象的数量,能够合理地获取已有设计知识,为深入研究奠定了基础。  相似文献   

17.
一种基于核的模糊聚类算法   总被引:6,自引:2,他引:4  
结合核技术与改进的模糊c均值算法聚类准则提出一 种基于核的模糊聚类算法. 通过引入核函数, 样本点被非线性变换映射到高维特征空间进行聚类, 提高了聚类性能. 同时, 算法改进了模糊c-均值聚类模型中的概率型约束条件, 使其对噪声和野值点具有较好的鲁棒性. 在真实数据和人造数据上与常用聚类算法进行了对比实验, 结果表明该算法具有较低的时间、 空间复杂度与较好的聚类性能.  相似文献   

18.
单载波频域均衡(SC-FDE)系统利用单抽头频域均衡补偿频率选择性衰落。该文提出了一种用于SC-FDE系统的二维最小均方误差(MMSE)信道估计算法。利用信道的时频分离特性,将二维估计简化为频域一维MMSE内插与时域一维MMSE滤波的级联。该算法对基于时域训练序列和基于频域训练序列的SC-FDE系统均适用。仿真表明,所提算法在两种训练序列条件下均优于传统的一维信道估计算法,且其性能与理想信道估计更接近。  相似文献   

19.
采用聚类神经网络与分离输出语音重构的语音分离算法   总被引:1,自引:1,他引:0  
基于听觉现象分析计算模型 ( CASA)的基本原理 ,对仅有单通道输入混合语音信号时 ,采用振荡器神经网络 ,提出了一种 CASA计算模型语音分离算法结构 .利用实例说明了算法的具体实现步骤和参数设置 .讨论了该算法结构中各语音听觉感知成分 Segments的聚类过程和对分离输出语音的重构处理部分 ,以及如何采用合适的听觉感知成分聚类规则设计相应的聚类神经网络 ,以完成对应不同输入独立语音源信号的各 Segments的聚类 ,从而实现语音分离任务  相似文献   

20.
目前基于纯净语音信号的语音识别系统和说话人识别系统都已达到了很高的识别率,但是当信号中含有噪声,特别是含有语音噪声时,识别率就会大大降低.解决这一问题的关键是实现语音与噪声的自动分离.考虑到语音信号的非平稳特性,把时域去相关的思想推广到频域,提出了频域去相关算法,实验结果显示了算法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号