共查询到10条相似文献,搜索用时 15 毫秒
1.
针对非线性说话人跟踪系统,提出一种基于自适应有限差分粒子滤波算法的麦克风阵列声源定位与跟踪方法.该方法在改进的粒子滤波框架内,采用适应性较强的布朗运动模型,通过计算麦克风阵列波束形成器的输出能量来构建似然函数,有效降低观测误差的不确定性对说话人位置估计的影响,一定程度上提升了说话人跟踪系统的精度.实验结果表明,该方法在基于麦克风阵列的说话人跟踪系统中具有较高的精确性. 相似文献
2.
针对强噪声和强混响条件下, 室内声源定位算法收敛速度慢和定位精度低等问题, 提出一种基于改进时延估计的声源定位方法. 该方法建立在单源多元混响模型下, 首先用四元十字型麦克风阵列估计时延; 然后在广义互相关时延估计算法的基础上, 引入二次相关法以削弱噪声干扰, 同时采用LMS(最小均方)自适应滤波算法弥补广义互相关方法的不足, 提高混响环境下的时延估计精度; 最后, 通过远场近似几何方法定位声源. 实验结果表明, 与相位变换加权广义互相关函数(GCC-PHAT)算法相比, 该方法具有较好的抗噪能力与抗混响能力, 能获得更准确的定位结果. 相似文献
3.
《厦门大学学报(自然科学版)》2017,(5)
在音频/视频会议、人机交互、语音识别等领域,严重的混响干扰导致麦克风阵列语音处理性能急剧下降.针对现有逆滤波等抗混响方法需要获得准确的房间传输响应,而波束形成方法抗混响性能有限的问题,基于广义旁瓣抵消器(generalized sidelobe canceller,GSC)结构提出一种采用旁瓣增强的麦克风阵列抗混响算法(Sidelobeenhanceing reverberation mitigation algorithm for microphone array,SERM).该算法首先进行波束形成,初步获得增强的直达语音信号,并对旁瓣获取的混响分量进行自适应迭代增强,再将旁瓣迭代增强的误差信号作为参考噪声进行自适应噪声抵消,最终输出抗混响语音.实验结果表明,在混响环境下该方法能有效改善麦克风阵列的语音信号质量. 相似文献
4.
针对分布式麦克风网络中的说话人跟踪问题,提出一种自适应交互式多模型粒子滤波算法,以实现复杂环境下对说话人的分布式跟踪.首先,对分布式麦克风网络中的说话人跟踪问题建立状态空间模型,并利用贝叶斯滤波理论求解该问题.然后,将交互式多模型与粒子滤波相结合,提出一种双粒子滤波方法对运动模型的转换概率进行自适应估计,以更好地对多种... 相似文献
5.
《南京大学学报(自然科学版)》2015,(1)
时延估计是阵列信号处理中的关键技术,是麦克风阵列声源定位系统中常用的方法.影响麦克风阵列声源定位性能的因素有很多,混响就是其中之一.通常麦克风阵列定位系统多处于室内环境中,除了其他干扰噪声和环境噪声的影响外,声源本身经过环境反射造成的混响也会对其性能造成较大的影响.本文在互相关原理的基础上,综合两种不同的频域加权算法,PATH加权和ML加权进行改进,弥补了原算法不能同时稳健噪声和混响的不足,并得到多种环境下的最优q值,降低了多径效应对估计阵元间的相对时间延迟的影响,提高了时延估计的准确率和声源定位精度.实验结果证实了新方法的时延估计准确率高和最优q值的有效性. 相似文献
6.
针对传统时延估计方法易受噪声和混响影响的问题,提出了一种基于麦克风阵列的时延估计新方法.该方法充分利用多个麦克风的空域信息和每个麦克风时域信息,以提高算法对环境噪声的抑制能力.该方法在抗噪声和抗混响性能方面都优于常用的PHAT-GCC(Phase Transform-Generalized Cross Correlation) 方法.仿真实验表明,与MCCC(Multichannel Cross Correlation Coefficient)方法相比,在信噪比为20 dB,阵元个数为2~6个,混响时间在200~620 ms条件下,该方法的时延估计错误率明显降低. 相似文献
7.
在语音识别、说话人识别等语音交互应用领域中,麦克风阵列常常工作于多声源工作场景,因而需要更高的波达方向(DOA)估计分辨性能.压缩感知(CS)的DOA估计算法可将声源定位的问题转化成稀疏信号的重构问题,进而提高在高混响、低信噪比环境下的DOA估计性能.基于这一思想,将CS方法应用于多声源方位估计.考虑到传统的基于CS的DOA估计算法利用实测声源传输响应作为混合矩阵时,会因噪声的存在而导致多声源条件下的匹配程度下降,提出了利用基于阵列各阵元之间时延关系所生成的不同方位的声源传输响应来构造CS混合矩阵,即构造房间冲激响应CS(CRR-CS)的DOA估计算法,从而实现多声源的DOA稀疏恢复.通过实验验证了该方法优于传统方法,能更好地实现定位. 相似文献
8.
9.
强噪声背景下鲁棒的说话人跟踪 总被引:1,自引:0,他引:1
《华中科技大学学报(自然科学版)》2015,(Z1)
针对强噪声背景下的说话人跟踪系统,提出了一种适应于噪声统计特性未知的无迹扩展H∞粒子滤波方法,并将其应用于强噪声背景下的说话人跟踪问题.首先,将无迹变换(UT)变换引入到适用于噪声统计特性未知的EHF中取代复杂的雅克比矩阵计算,降低观测方程线性化引起的误差;接着,采用生成的无迹扩展H∞滤波优化重要性概率密度函数,将最新观测信息引入到粒子修正过程;最后,对本方法的粒子采样实现和权重更新步骤进行了详细分析.仿真分析表明:本方法有效提升了在信噪比较低情况下的跟踪精度和鲁棒性. 相似文献
10.
在人与人交流中,人耳能很好地定位出周围声音的位置,而在声源定位技术里,基于传统麦克风声源定位在噪声环境下无法精确地定位出声源.根据人耳能准确地辨别出声源这一特性,提出一种在噪声下基于人耳耳蜗基底膜分频特性的声源定位方法.该方法是利用多个麦克风对声源信号进行采集,将采集到的信号通过基底膜滤波器进行滤波、除去与声源无关的噪声,运用空间映射互相关方法对声源进行定位.该方法所定位出的声源位置比传统声源定位技术所定位的位置误差小、精准度高.实验结果表明,噪声环境下基于耳蜗基底膜分频特性的声源定位比基于传统麦克风声源定位技术更接近声源的真实位置;噪声环境下基于耳蜗基底膜分频特性的声源定位具有更高的精度与更好的鲁棒性. 相似文献