期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

何伟刘雨佶童峰康元勋冯万健《厦门大学学报(自然科学版)》2024,(2):287-295+304

[目的]针对基于深度神经网络频谱估计的麦克风阵列算法存在数据依赖的问题,提出了一种基于深度学习的混响感知麦克风阵列语音增强算法.[方法]首先利用麦克风阵列波束形成输出与原始信号做互相关,以近似房间冲激响应的形式获取当前环境的混响特性作为LSTM网络的输入,网络模型以干净语音为目标进行训练从而输出房间冲激响应泛化向量,最后通过组合近似房间冲激响应与房间冲激响应泛化向量获得后置抗混响滤波器系数,实现语音增强.[结果]仿真和实验结果中,与波束形成、加权预测误差算法和传统深度学习去混响算法相比,所提出的方法在不同混响场景下具有更好的表现.[结论]本文方法在不同混响场景下都具有相对稳定的抗混响能力,具有较好的泛化性能. 相似文献

2.

一种单通道语音倒谱域去混响新方法

余帅何培宇《四川大学学报(自然科学版)》2012,49(4):823-828

大多数去混响的算法都是基于短时分析,不可避免地带来了截断效应;如果对混响语音进行逆滤波,则要求房间冲激响应满足最小相位.本文提出了一种针对单通道的语音长时分帧的去混响算法.算法采用长时帧分析,有效减小了截断效应的影响.首先对混响语音信号进行长时分帧计算其最小相位分量倒谱,然后根据纯净语音和房间冲激响应倒谱的不同分布,在倒谱域阻带滤波得到去混响语音最小相位分量的估计,根据最小相位倒谱理论,进而可以估计出去混响语音频域的模,最后利用人耳对相位信息的不敏感性,用估计的去混响语音的模和混响语音的相位合成,傅里叶反变换得到去混响语音时域波形.实验表明,该算法有良好的去混响效果. 相似文献

3.

单通道的语音盲去混响

沈希忠孟光《上海交通大学学报》2010,44(2):229-0233

针对单通道的语音盲去混响研究中存在的问题，提出了一种盲去混响的方法.首先对语音信号进行可变长度的分段，然后采用复倒谱技术，对房间声学冲激响应进行预估计，得到去混响的初始解，并以此作为盲解卷积算法的初始解进一步去混响.仿真和实验表明，该方法具有很好的去混响效果. 相似文献

4.

面向多声源的压缩感知麦克风阵列的波达方向估计

章宇栋黄惠祥童峰《厦门大学学报(自然科学版)》2018,(2)

在语音识别、说话人识别等语音交互应用领域中,麦克风阵列常常工作于多声源工作场景,因而需要更高的波达方向(DOA)估计分辨性能.压缩感知(CS)的DOA估计算法可将声源定位的问题转化成稀疏信号的重构问题,进而提高在高混响、低信噪比环境下的DOA估计性能.基于这一思想,将CS方法应用于多声源方位估计.考虑到传统的基于CS的DOA估计算法利用实测声源传输响应作为混合矩阵时,会因噪声的存在而导致多声源条件下的匹配程度下降,提出了利用基于阵列各阵元之间时延关系所生成的不同方位的声源传输响应来构造CS混合矩阵,即构造房间冲激响应CS(CRR-CS)的DOA估计算法,从而实现多声源的DOA稀疏恢复.通过实验验证了该方法优于传统方法,能更好地实现定位. 相似文献

5.

基于容积原则的概率假设密度滤波算法

王华剑景占荣《北京理工大学学报》2014,34(12):1304-1309

为改善多目标跟踪问题中概率假设密度滤波精度与算法运行时间之间的关系,提高目标状态和数目的实时估计性能,提出了基于容积原则的概率假设密度滤波算法. 该算法在高斯混合粒子概率假设密度的框架下,利用容积数值积分原则直接计算非线性随机函数的均值和方差, 产生粒子滤波算法的重要性函数,实现高精度粒子的重构,来近似目标状态和数目的概率分布,并且在高斯混合概率假设密度滤波算法中进行采样和更新. 仿真验证了所提出算法的有效性,其Wasserstein误差距离优化了17.32%,目标数估计均值也提高了23.72%. 相似文献

6.

高斯混合模型下的残留回波抑制算法

张琦王霞孙焘《西安交通大学学报》2013,47(4):11-16

为提高通话环境中的回波抑制效果,提出了基于高斯混合模型下的残留回波抑制方法。首先以线性预测系数为特征提取近端用户语音的特征向量,然后在高斯混合模型下对其进行训练,得到用户语音模板,通过对比用户语音模板和残留回波信号特征向量,判断非用户语音帧,最后将非用户语音帧予以消除。仿真实验结果表明,所提算法能正确区分用户语音帧与非用户语音帧,具有更好的回波抑制效果。在误判率约为1%～2%的情况下,可将自适应滤波器的回波消除量提高7～10dB。相似文献

7.

改进GMM谱包络转换性能的语音转换算法研究

赵义正《科学技术与工程》2010,10(17)

高斯混合模型(GMM)在语音转换中得到了广泛应用,但其最大缺点在于进行谱包络转换时存在过平滑问题.研究了过平滑现象主要由转换函数中的均值项造成.因此提出一种替换均值法,在各均值项所对应的高斯混合模型类内,使用后验概率与均值项的后验概率最接近的特征来代替转换函数中的均值项.实验表明,采用该方法的语音转换算法能有效缓解过平滑现象,改善转换语音的听觉感知特性. 相似文献

8.

基于复高斯混合模型的鲁棒VAD算法

雷建军杨震刘刚郭军《天津大学学报(自然科学与工程技术版)》2009,42(4)

针对语音激活检测的鲁棒性问题,提出在非平稳噪声环境下使用基于复高斯混合模型的鲁棒语音激活检测算法.算法中假设纯净语音谱满足复高斯混合模型,先验信噪比利用预先训练好的复高斯混合模型计算得到.复高斯混合模型的引入一方面提高了语音激活检测的性能,另一方面避免了使用基于最小均方误差语音增强的先验信噪比估计过程.实验中使用NOISEX-92噪声库来验证系统在噪声环境下的性能.结果表明,该种算法在非平稳噪声环境下具有良好的检测性能. 相似文献

9.

一种稀少训练数据条件下的语音转换算法

徐宁杨震《南京邮电大学学报(自然科学版)》2010,30(5)

提出了一种新的语音说话人转换算法,利用变分贝叶斯方法估计高斯混合模型参数,进而将其应用于语音转换的声道谱参数映射过程,实现说话人身份转换.将变分贝叶斯算法用于模型参数的估计,一方面解决了训练数据量稀少情况下容易使模型产生"过拟合"的问题,另一方面通过将模型参数概率化,使得参数估计问题不再是"点估计",而成为了"全局估计",因此在一定程度上提高了模型的精度.主观和客观实验结果表明:将基于变分贝叶斯估计得到的统计模型用于语音声道谱参数的转换,明显提高了在训练数据稀少的情况下系统的鲁棒性,同时转换后语音的音质和说话人个性特征均优于经典的语音转换系统. 相似文献

10.

失真控制下的短时谱估计语音增强算法

刘晓明班超帆冯晓荣《西安交通大学学报》2011,45(8):78-84

针对传统谱估计增强算法易产生语音畸变、导致语音清晰度低的问题,提出了一种失真控制下的短时谱估计语音增强的新算法.该算法首先引入语音畸变的客观度量参数,并根据这一参数得到抑制语音畸变的约束条件,然后结合人耳听觉掩蔽特性和无语音概率参数,修正最小均方误差对数谱估计函数,最后联立约束条件和估计函数,得到增强后的语音,从而实现了在噪声抑制和语音畸变之间的折中,改善了语音增强的效果.主观试听和客观测试结果均表明,与其他谱减法相比,在相同的信噪比和去噪度条件下,新算法的语音畸变度最小且几乎察觉不到音乐噪声. 相似文献