首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
用于语音识别的鲁棒自适应麦克风阵列算法   总被引:1,自引:0,他引:1  
对现实环境中存在的混响以及非平稳干扰语音信源等因素导致的算法性能下降,提出了一种用于语音识别的鲁棒旁瓣对消算法。讨论了旁瓣对消算法在自适应麦克风阵列中的应用,分析了算法在不同的混响条件下、不同的干扰源的噪声抑制能力。该算法通过分帧处理将输入信号划分为一系列短时平稳的信号片段。根据当前帧的信噪比决定自适应滤波器的权系数更新方式。采用一定的范数约束来限制自适应滤波器权系数的误调整。实验结果表明该麦克风阵列在混响的现实环境中能够有效抑制平稳噪声源和交叠谈话背景干扰,提高了语音识别器的抗噪性能。  相似文献   

2.
基于麦克风阵列的声源定位研究   总被引:8,自引:0,他引:8  
基于麦克风阵列的声源定位是有效声源提取的前提和基础,其技术在多媒体通信中得到了广泛的应用.讨论了基于麦克风均匀线阵和均匀圆阵的声源定位方法,并进行了仿真,其结果表明这两种模型均能有效地提取出声源的位置.并给出了算法的硬件实现的原理框图。  相似文献   

3.
联合波束形成与谱减法的麦克风阵列语音增强算法   总被引:1,自引:0,他引:1  
考虑到封闭环境的散射噪声场中,传统波束形成方法及单通道谱减法对噪声抑制的局限性,提出一种将波束形成方法与谱减法相结合的麦克风阵列语音增强方法.该方法首先通过波束形成器的空间滤波作用,将波达方向不同的语音信号和噪声信号加以区别,再经过延时补偿单元的相应处理,从而达到衰减噪声的目的,然后采用谱减法对波束形成器输出端的残留噪声进行后置处理.仿真实验结果表明。在小房间混响情况下,与其他方法相比,该方法不仅运算量小。而且具有良好的噪声抑制性能.  相似文献   

4.
基于压缩感知的麦克风阵列声源定位算法   总被引:2,自引:0,他引:2  
为了提高麦克风阵列在高混响、低信噪比环境中的定位性能,提出了一种基于压缩感知的声源定位算法.该算法将声源定位问题转化为稀疏信号的重构问题,将不同位置的房间冲激响应作为特征以构建字典.首先,将麦克风接收信号转换至频域,从具有较高能量的频点中求得一组扩展的频域声源信号矢量,该矢量中包含了声源的位置信息.然后,在频域中整合这些扩展的声源信号矢量,使声源的位置信息更突出,矢量中最大元素所对应的空间位置即为声源的位置估计.仿真实验结果表明,与相位变换加权的可控响应功率(SRP-PHAT)定位算法相比,所提算法的定位成功率更高,对混响的鲁棒性更强,更适合高混响低信噪比环境中的声源位置估计.  相似文献   

5.
基于小波变换的传声器阵列语音增强方法   总被引:5,自引:0,他引:5  
针对现有的基于传声器阵列语音增强算法的局限性,并考虑到入耳听觉感知模型,提出一种将延迟-求和波束形成技术和小波变换技术相结合进行语音增强的方法,该方法首先利用延迟-求和波束形成技术将阵列中各个传声器接收到的信号进行时间延迟补偿,并对各通道信号相加-平均,消除一部分不相干或弱相干噪声;然后再利用小波变换技术进一步去除噪声,计算机模拟结果表明,该方法具有良好的消噪能力。  相似文献   

6.
针对在非平稳和多种噪声并存的语音增强算法抑制噪声能力有限的问题,提出基于最小跟踪噪声功率谱估计的相干滤波与广义旁瓣抵消的麦克风小阵语音增强算法。该方法先利用最小跟踪噪声功率谱估计的相干滤波抑制弱相关噪声,再结合广义旁瓣抵消与端点检测抑制强相关噪声。实验结果表明,方法更加有效地抑制噪声的影响;并提高了语音的可懂度。  相似文献   

7.
为了进一步提高矢量Taylor级数(VTS)算法的模型补偿精度以及在噪声环境下的识别性能,提出将无监督聚类与VTS算法相结合。无监督聚类算法利用噪声模型之间的Kullback-Leibler距离将含噪语音段划分为若干个子段。然后针对各个子段分别进行一阶Taylor级数展开,并在此基础上逐段估计噪声参数和补偿声学模型。该算法结合一个中文数字串识别系统进行实验,在Babble噪声和Gauss白噪声环境下该算法的误识率相对传统的VTS算法分别下降了27.7%和17.8%。证明这种结合无监督聚类的分段VTS算法能够更加有效地将语音和噪声在倒谱域上的非线性混合模型用一阶线性模型来近似。  相似文献   

8.
针对在低信噪比环境下语音增强对语音识别率的提升不明显的问题,提出一种用在识别系统前端的麦克风阵列增强算法。该阵列增强算法基于相干滤波和频率带宽波束形成后置改进维纳滤波器。首先将采集到的阵列信号,求相邻通道间的相关函数,利用阵元间信号的相关性进行初始噪声抑制,然后利用频域宽带最小方差无畸变响应(MVDR)通过对目标声源信息的获取,保留目标声源方向的信号并抑制其他方向的信号干扰,再通过改进的维纳滤波器去除噪声残留提升语音可懂度,最后用梅尔频率倒谱系数(MFCC)和隐马尔科夫模型(HMM)对增强后的语音信号做特征提取并识别。仿真过程模仿双耳采集数据,结果表明该语音增强方法在低信噪比环境下获得较好的增强效果,能有效的提高低信噪比环境下的语音识别率。  相似文献   

9.
融合语音增强与后续补偿的抗噪声语音识别方法   总被引:2,自引:1,他引:2  
为了提高基于隐含Markov模型的语音识别系统在噪声环境中的稳健性,研究了一种融合语音增强与后续补偿的抗噪声语音识别方法.在前端,语音增强有效地抑制背景噪声,从而提高了输入信号的信噪比.语音增强后的剩余噪声以及语音失真是对语音识别不利的因素,其影响将通过识别阶段的并行模型合并或特征提取阶段的倒谱均值归一化得到补偿.实验结果表明,此方法能够显著地提高语音识别系统在噪声环境中,特别是低信噪比条件下的识别精度,如对-5 dB的自噪声,该方法可将识别精度从11.7%提高至71.0%.  相似文献   

10.
夏阳  张元元 《山东科学》2011,24(6):75-79
针对相位变换加权广义互相关方法(GCC-PHAT)对噪声的影响较为敏感的缺点,本文通过削弱噪音互谱、加权信噪比、应用相干函数等手段对原始的相位变换加权函数(PHAT)进行了改进,得到了一种改进的相位变换加权函数(MPHAT),以便在有噪情况下更准确地估计时间差。大量的仿真实验验证了本文算法的有效性。  相似文献   

11.
针对小体积应用场合下的语音增强,提出了一种基于等边三角形结构的麦克风阵列与Wiener后置滤波相结合,并由VAD作为控制单元的语音增强方法。该方法克服了自适应零限波束形成只能抑制空间相干噪声的缺点,并得到可在二维平面上旋转的波束主瓣。通过仿真和真实环境的实验,证明算法能够显著地提高输入语音信噪比,且适用于多种噪声场。  相似文献   

12.
考虑到传统单通道语音增强算法对噪声抑制的局限性,本文采用由两个微型麦克风阵列组成的双微阵列,利用该阵列空间结构的时空域特性对含噪语音进行处理,提出了一种适用于双微阵列的语音增强算法。该增强算法是将各通道采集到的带噪语音信号先使用对数最小均方误差(Logarithmic Minimunm Mean Square Error,LogMMSE)提升其信噪比,然后利用频域宽带最小方差无畸变响应(MVDR)通过对目标声源信号的获取,保留目标声源方向的信号并抑制其他方向的信号干扰,最后通过一个改进可懂度结合改进最小控制递归平均(Improved Minimum Controlled Recursive Average Algorithm,IMCRA)噪声估计的维纳滤波器来去除噪声残留提升语音质量。仿真实验结果表明,相比传统的单通道语音增强算法,该算法具有良好的噪声抑制性能。  相似文献   

13.
基于传统的Mel倒谱系数(MFCC)系列特征的语音识别系统在噪声环境中的识别性能会急剧下降。为了进行噪声环境中的自动语音识别,提出了一种反映语音信号谐振程度的特征:谐振强度,并用之代替传统MFCC特征中的能量维(零维倒谱C0,或者帧能量E)。在展览馆噪声、人群噪声和汽车噪声等情况下的语音识别实验结果表明:基于这种新特征的语音识别系统比基于传统特征的语音识别系统有更高的平均识别率和更好的抗噪声能力。  相似文献   

14.
提出一种将改进EMD与麦克风阵列MVDR自适应波束形成相结合的语音增强方法。该方法利用互相关系数阈值法去除将EMD算法分解后的的虚假IMF分量,结合各阶IMF分量的自相关函数特性准确获取信号与噪声的主导IMF分量分界点,然后对所有噪声主导的IMF分量进行小波阈值去噪,接着将所有剩余IMF分量进行MVDR波束形成获得增强语音信号。改进EMD算法避免了在高信噪比条件下的信号失真,与MVDR波束形成相结合,满足了MVDR窄带特性要求,增强了麦克风阵列抗干扰能力。实验结果证明了方法的有效性。  相似文献   

15.
The development of computational auditory modeling in the last 30 vears is reviewed, and its development in the com trig years is predicted .  相似文献   

16.
麦克风阵列的几何结构形成了麦克风阵列工作时性能的基本限制,是影响噪声源识别系统性能的关键因素之一.对十字阵(37阵元)、六角阵(37阵元)、矩形阵(36阵元)在均匀加权时方向性、角度分辨率等性能进行仿真定量对比研究:十字阵具有最好的方向性为71.6 dB,六角阵具有最好的空间对称性且能抑制栅瓣;阵元数目变化时主瓣宽度的对比,表明阵元数大于100时增加阵元对改善角度分辨率作用不大;主瓣宽度与频率关系,显示随频率增加3种阵列输出信号畸变程度基本相同.  相似文献   

17.
研究了声源定位技术在鼾声检测上的应用,主要研究鼾声的声学特性、声源定位技术原理,并利用声源定位技术对人体打鼾时头部姿态进行识别.采用广义互相关函数法对多路声音采集系统采集到的鼾声信号进行延迟估计计算,根据得到的相对时延信息进行声音定位,结合定位信息和朝向信息推断出当前受试者打鼾时头部姿态.采用数据采集卡进行高速信号采集,使用虚拟仪器Labview进行信号处理和算法实现,实验中受试者以不同头部姿态在该系统监测下模拟打鼾,通过该系统检测头部姿态,综合判断正确率达到80%.  相似文献   

18.
邵学辉  付永庆  郑莉 《应用科技》2007,34(10):13-16
针对近场均匀麦克风线阵,提出了一种利用单个校正源对存在阵元幅度和相位误差的阵列模型进行校正的方法,该方法要求在已知校正源和各个阵元位置的前提下对阵列幅相误差进行估计,从而得出了阵列误差校正矩阵.对实际麦克风阵列校正的结果表明,该方法简单快速,计算量小,且具有较高的估计精度.  相似文献   

19.
用于语音识别的基于频谱调整的信道自适应方法   总被引:1,自引:1,他引:0  
语音识别系统在实际应用时,其性能会因各种因素而下降,其中重要的一个因素是信道的不匹配。该文提出了一种新的信道自适应方法——频谱调整法。该方法在频域上定义一个分段线性信道归一化函数,根据最大似然准则利用梯度投影法求其最优参数后,对语音的幅度频谱进行归一化。实验表明,该方法可以利用很少的自适应数据使识别的字错误率下降10%左右。  相似文献   

20.
为提高噪声不平稳或不可估的情况下语音识别的稳健性,提出了利用自回归模型和短时平稳性假设,估计干净与噪声环境的语音数据,建立相应的语音识别模型,以达到抗噪效果的稳健语音信号处理方法。在N o iseX-92的4种噪声环境(w h ite,babb le,vo lvo,destroyer eng ine)从0到20 dB的不同信噪比下的“863”大词汇连续语音标准数据库的平均识别结果表明,该方法能够使得基于段长分布的隐M arkov模型的语音识别系统在25候选时声学层的音节相对错误率下降达到10.85%以下,同时相对正确识别率上升12.13%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号