首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
为提高近场麦克风阵列的声源定位精确度,对基于麦克风阵列的声源定位技术进行研究.详细分析了近场信号传播模型,并结合窄带子空间算法,对宽带ISM(Incoherent Signal-Subspace Method)算法进行改进,提出一种近场子空间声源方位和距离联合估计算法.该算法根据短时信号的频率特性,在特定频率上对信号应用子空间算法进行方向距离联合估计并对结果进行叠加,从而得到最终结果.该算法在相关信源和混响条件下均能得到较好的DOA(Direction-of-Arrival)估计效果.计算机仿真验证了算法的有效性.  相似文献   

2.
提出了一种利用加权Mel倒谱提取语音信号共振峰的算法.首先对短时语音信号进行加权Mel倒谱分析,获得包含频谱主要成分的加权Mel倒谱系数;然后利用离散余弦平滑算法,从加权Mel倒谱系数获得谱包络,并从谱包络的峰值位置获得候选共振峰;最后根据共振峰的连续性约束条件和频率范围,从候选共振峰筛选得到共振峰的估计值.实验结果表明,本算法比倒谱法提取的共振峰误差更小,在噪声环境下具有较好的鲁棒性.  相似文献   

3.
人类语音中的共振峰特征作为语音信号处理系统中具有较高稳定性的频域参数,携带着众多有用的信息。本文结合实际教学情况和实验需求,针对语音信号处理中提取共振峰容易出现的困扰,根据语音信号共振峰的特点,通过MATLAB编写了基于倒谱法和线性预测法的共振峰检测函数,并实现了对指定语音信号的共振峰估计的仿真与验证。  相似文献   

4.
针对宽带线性调频近场源参数估计问题,提出一种基于非相干子空间算法的方向角和距离二维参数估计算法.该算法将宽带信号分解成若干个窄带信号,对每个窄带信号构造MUSIC谱函数,并通过谱峰搜索法估计方向角和距离二维参数,使用传播算子(Propagator Method,PM)直接估计接收信号的噪声子空间,构造谱函数,而不需要进行奇异值分解,可有效降低非相干子空间算法的计算量.该算法具有较高的估计性能,仿真实验证明了算法的有效性.  相似文献   

5.
基于广义旁瓣抵消器(generalized sidelobe canceller,GSC)算法的麦克风阵列语音增强技术已得到广泛研究,但由于其通常需传统的声源定位方法提供声源方位,语音信号信噪比(SNR)低时声源定位精度将明显下降并影响到语音增强效果.提出了一种新的麦克风阵列语音增强方法,该方法在GSC中引入可调波束形成器估计声源方位以抑制背景噪声影响.不同类型背景噪声下的实验室语音增强结果表明了该方法的有效性.  相似文献   

6.
针对在低信噪比环境下语音增强对语音识别率的提升不明显的问题,提出一种用在识别系统前端的麦克风阵列增强算法。该阵列增强算法基于相干滤波和频率带宽波束形成后置改进维纳滤波器。首先将采集到的阵列信号,求相邻通道间的相关函数,利用阵元间信号的相关性进行初始噪声抑制,然后利用频域宽带最小方差无畸变响应(MVDR)通过对目标声源信息的获取,保留目标声源方向的信号并抑制其他方向的信号干扰,再通过改进的维纳滤波器去除噪声残留提升语音可懂度,最后用梅尔频率倒谱系数(MFCC)和隐马尔科夫模型(HMM)对增强后的语音信号做特征提取并识别。仿真过程模仿双耳采集数据,结果表明该语音增强方法在低信噪比环境下获得较好的增强效果,能有效的提高低信噪比环境下的语音识别率。  相似文献   

7.
为提高卷积环境下语音识别系统的鲁棒性,提出了一种基于时/频ICA(independent component analysis)的卷积噪声模型估计方法.所提算法首先使用ICA方法从含噪语音信号中提取纯净语音信号的短时功率谱,然后在MEL滤波器组域内将含噪语音的短时谱减去纯净语音的短时谱,并根据去噪后卷积噪声的短时谱估算其HMM(hidden markov model)模型.在仿真和真实环境下进行了语音识别实验,其识别正确率相比较传统的卷积噪声估计方法分别提升了4.70%和4.75%.实验结果表明,论文所提算法能够实现对卷积噪声的精确估计,并有效提升卷积噪声环境下语音识别系统的性能.  相似文献   

8.
针对欠定混合语音信号模型,提出一种基于独立分量分析和二值掩膜相结合的语音分离新算法.首先,由并列放置的两个全指向性麦克风采集混合声音信号,通过一阶差分麦克风阵列技术使得两路混合信号满足瞬时混合模型;然后,应用两输入两输出独立分量分析方法对两路信号进行分离并估计分离信号的二值掩膜,循环迭代进而提取目标语音信号;最后,合并同源语音信号,增强各独立声源.仿真结果表明:该方法不仅适用于瞬时混合模型,对卷积混合模型同样有效;在瞬时混合条件下信噪比增益平均达到12.41dB,在卷积混合条件下信噪比增益平均为5.28dB.试验结果表明:算法在半消音室环境下能准确分离来自不同方位的三个声源,提取的目标语音都具有较高的清晰度与可懂性.  相似文献   

9.
一种改进的基于子带谱熵的语音激活检测方法   总被引:2,自引:2,他引:0  
语音信号的激活检测(voice activity detection,VAD)是变速率语音编码的关键技术,用来检测通信时是否有语音片存在.在有噪环境下对语音信号的激活检测是非常重要而困难的.对传统子带谱熵算法进行了改进,提出了一种能够用于语音激活检测的新算法.该算法利用语音谱熵和噪声谱熵分布的不同,将信号的数字特征(方差、均值等)与传统子带谱熵相结合,用于区分语音段和非语音段.计算机仿真结果表明,在高斯白噪声环境下,改进后的子带谱熵算法能很好地区分说话人的语音段和非语音段,在某种程度上解决了传统语音激活检测算法结构复杂、参数难调、易受噪声影响等问题.  相似文献   

10.
为了识别一组非特定人、不连续的数字语音信号,本文提出了一种基于支持向量机理论的语音信号识别算法.具体过程主要包括训练过程和识别过程.其中训练过程为:先使用预先建立起来的语音库对选定的支持向量机进行训练,得到一组与该语音信号相关的支持向量;在识别过程中,首先获取被测语音信号,并根据MFFC理论提取特征向量,然后使用训练后的支持向量机进行识别.此外,还提出使用短时区域能量谱的方法对语音信号进行端点检测.结果表明,与目前流行的隐马尔可夫算法比较,本文算法具有识别速度快、准确率高等优点.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号