首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基于计算听觉场景分析(Computational Auditory Scene Analysis,CASA)的语音分离系统通过模拟人耳的听觉感知系统对混合信号进行处理并分离出感兴趣的目标语音,近年来得到了很大的发展。如何在干扰噪声存在的情况下进行正确的基音提取跟踪一直是CASA系统研究的重点。提出了一种基于目标语音源的改进基音跟踪算法。该算法通过对目标源估计和基音检测两个步骤的反复迭代计算,得到最终的基音轨迹。通过在不同噪声干扰条件下与传统基音跟踪算法对比的实验结果证明,该算法能够有效地抑制噪声,提高输出语音的信噪比和语音质量。  相似文献   

2.
提出一种基于基频状态和帧间相关性的单通道混合语音分离算法.首先,从混合语音中提取2个源语音的基频进行状态编码,基于编码的基频状态构造自适应字典,并通过引入基频信息在字典层面对各源语音信号进行区分.然后,采用频繁模式挖掘算法,提取基频状态为1时字典的频繁1项子集,缩减字典尺寸.最后,以基于正交匹配追踪的分离语音为基础,检测分离效果差的混合语音帧,搜索与其相关度最高的平移后的邻近分离语音帧进行叠加,并采用软掩蔽方法进行第二次分离校正.仿真实验结果表明,该算法获取的分离语音信噪比优于现有的2种经典语音分离算法,并且该算法采用频繁模式挖掘算法大大减小了运算量.  相似文献   

3.
针对基于字典学习语音分离方法的“交叉投影”问题,提出了强约束的优化函数,不仅抑制重构信号和目标信号的误差,约束干净信号在联合字典上的误差,而且抑制干净信号在其他字典上的投影并限制字典间的原子相关性。此外,为了进一步提高两个相似信号的分离效果,提出基于强约束字典联合深度神经网络的单通道语音分离方法,首先利用强约束字典实现目标与干扰语音的初步分离,然后通过联合约束利用深度神经网络实现语音与干扰语音交叉投影残余的分离。实验结果表明,与其他优秀单通道语音分离方法相比,该算法有效提升了语音分离系统的性能。  相似文献   

4.
为了解决语音分离中非负矩阵分解(non-negative matrix factorization,NMF)、深度神经网络(deep neural network,DNN)等算法没有考虑语音时序相关性的问题。结合NMF和长短时记忆网络(long short-term memory,LSTM)算法提出NMFLSTM单通道语音分离算法:将语音信号的幅度谱作为模型的输入特征,通过训练NMF和LSTM模型获得目标语音的基矩阵和系数矩阵,并对其结果进行语音重构最终实现语音分离。实验结果表明:相比于未考虑语音时间连续性的算法,使用NMFLSTM算法分离语音的客观语音质量评估值(perceptual evaluation of speech quality,PESQ)有明显提升,其最大值超过3. 1,获得良好的分离效果。  相似文献   

5.
为提高被噪声干扰的语音的可理解性和语音质量,针对用于语音增强的深度复数网络对语音复数谱中关键声学特征提取不充分、关联信息建模不合理的问题,提出了基于多维度注意力机制和复数Conformer的单通道语音增强方法(SE-MDACC)。在复数U-Net架构下引入复数Conformer,对语音幅度和相位的相关性进行建模;利用多维度注意力机制,构造更加丰富的特征来增强卷积层的表示能力;在残差连接中加入注意力门控机制强化重构语音的细节信息。实验结果显示,相比于深度复数卷积递归网络,SE-MDACC的客观评价指标语音质量感知评估和短时客观可懂度分别提升15.299%、1.462%,表明SE-MDACC可充分提取语音声学特征并对幅度和相位相关性进行合理建模,有效提升语音质量和可理解性。  相似文献   

6.
针对单通道的语音盲去混响研究中存在的问题,提出了一种盲去混响的方法.首先对语音信号进行可变长度的分段,然后采用复倒谱技术,对房间声学冲激响应进行预估计,得到去混响的初始解,并以此作为盲解卷积算法的初始解进一步去混响.仿真和实验表明,该方法具有很好的去混响效果.  相似文献   

7.
NMF是一种近年来常用的降维方法.NMF在图像检索、人脸识别和信号处理等方面得到广泛的应用,其分解后所产生的分量的非负性要求,使数据处理得到很好的效果.NMF在分解过程中未考虑到数据的内在几何性质和局部结构,就存在着不能准确的处理数据的问题.本文提出一种把NMF与LPP相结合的降维方法.该方法应用在图像检索上,因为LPP能够保留数据的内在几何性质和局部结构,降低影响图像检索的的因素,从而提高了图像检索的效率.再从Corel数据库进行实验,来证明此方法确实能够提高了检索准确性.  相似文献   

8.
9.
针对单通道信号盲源分离(blind source separation, BSS)模型的极端欠定问题,提出利用总体经验模态分解(ensemble empirical mode decomposition,EEMD)将单通道混合信号分解成多个瞬时频率本征模态函数(intrinsic mode function,IMF)分量的形式,构建新的观测矩阵,再通过快速独立分量分析(fast independent component analysis,FastICA)实现信号的盲源分离。仿真实验和实验室研究表明:该方法能够抑制宽频和瞬态干扰,有效地将淹没于噪声中的目标信号提取出来。实测数据分析表明该方法可以在飞机发动机噪声干扰下有效地提取背景声舱音信号,证明该方法在舱音信号处理中的有效性。  相似文献   

10.
由于音域信号的语音和音乐常常以混叠的形式出现,因此在许多应用中,希望能有效分离音域信号中的语音和音乐. 普通的分离方法一般采用基于频域信号的处理方式,而频域信号还原时需借助相位信息,导致还原的信息有偏差. 针对时域单通道音域信号分离效果差的问题,提出在对抗生成网络中引入联合训练与时序卷积的方法. 首先,对时域语音进行预处理;然后,将预处理过的数据送入时序卷积生成对抗网络生成器中进行分离;最后,将分离的干扰语音和纯净的干扰语音送到生成对抗网络判别器判别,并把判别结果反馈给生成器. 实验采用MIR-1K和data_thchs30数据集进行算法性能测试,结果表明,提出的单通道音域分离模型的PESQ和STOI指标平均提高了0.31和0.07,证明所提算法有效提升了音域信号中语音和音乐的分离效果.  相似文献   

11.
12.
针对单通道接收情况下通信信号与干扰盲分离的难题,提出了一种基于变异粒子群优化粒子滤波的单通道扰信盲分离新算法。首先建立了受扰通信信号的状态空间模型,并利用变异粒子群重采样粒子滤波进行通信码元和未知参数的联合最大后验估计,有效改善了标准粒子滤波中存在的粒子退化现象,在减少所需粒子数量的同时,又保持了序贯估计过程中粒子集合的多样性和优质性,使新算法在干信比较大时也能保持较好的分离性能。仿真实验表明,对单音干扰,在干信比等于30 dB,信噪比大于15 dB的条件下,新算法可以有效地从单路接收的受扰信号中分离出通信信号与干扰。  相似文献   

13.
针对单通道盲源分离重采样过程中出现的粒子枯竭现象,提出了一种基于人工免疫重采样粒子滤波的新算法.以二进制相移键控调制信号为例,针对传统粒子滤波算法中存在的粒子枯竭现象,利用人工免疫重采样粒子滤波进行信号未知参数和码元的最大后验概率估计,在保证粒子有效性的同时解决了粒子退化问题,有效地缓解了粒子枯竭现象,提高了算法的跟踪估计能力.仿真结果证明了该算法的可行性和有效性,改进后的算法在不加纠错编码,信噪比大于14 dB的情况下,误码率小于10-2,基本实现了信号的盲源分离.  相似文献   

14.
提出了一种基于奇异值分解(Singular Value Decomposition,SVD)的均值聚类单通道盲源分离算法.首先将单通道信号利用SVD分解,依据中值准则进行滤波去除噪声分量,然后在去除噪声分量对应的特征值基础上,根据剩余SVD特征值重构对应分量信号作为盲源分离观测信号.将重构分量信号进行短时傅立叶变换(Short Time Fourier Transform,STFT)进行稀疏化处理,利用散点图判别源信号数目,最后采用均值聚类方法估计混合矩阵,以估计混合矩阵求逆作为分离矩阵实现单通道信号的盲源分离.利用计算机仿真结果证明了算法的有效性.  相似文献   

15.
基于FastICA的语音盲源分离方法   总被引:1,自引:0,他引:1  
独立分量分析(ICA)在处理盲信号分离中被广泛使用,但其收敛速度较慢.为此文章重点介绍了一种更为有效的盲源分离方法——快速独立分量分析(FastICA).文章在介绍了FastICA的基本理论和方法之后,将其应用到语音分离中.在采集了三个实际的声音信号后,将三个原始信号进行混叠,在matlab仿真环境下用FastICA方法对混叠信号进行分离,将分离结果与原始信号波形进行比对,结果说明该算法具有良好的分离效果.  相似文献   

16.
目前基于纯净语音信号的语音识别系统和说话人识别系统都已达到了很高的识别率,但是当信号中含有噪声,特别是含有语音噪声时,识别率就会大大降低.解决这一问题的关键是实现语音与噪声的自动分离.考虑到语音信号的非平稳特性,把时域去相关的思想推广到频域,提出了频域去相关算法,实验结果显示了算法的有效性.  相似文献   

17.
针对复杂电磁环境下单通道无线电混合信号分离困难及分离精度不高的问题,提出2次使用变分模态分解(VMD)算法对单通道无线电混合信号进行分离的方法.首先利用VMD算法对单通道无线电混合信号进行粗分离,并将VMD算法与总体平均经验模态分解(EEMD)算法进行对比,得出前者分离出的信号在时域、频域及信噪比和相似系数等方面均比后者取得的对应结果效果好的结论.然后对VMD算法的参数利用改进的量子粒子群优化算法进行优化,确定所需分量个数和惩罚因子的值.最后对VMD算法分离后的信号使用参数优化后的VMD算法进行细分离.数值模拟和实验信号分析结果均表明,再次分离后所得到的信号精度较利用VMD算法对单通道无线电混合信号进行粗分离时更高,证明了所提算法对单通道无线电混合信号分离的有效性.  相似文献   

18.
传统的人脸识别方法对图像质量要求较高,对含有噪声或复杂背景等真实世界的图像识别率较低,从而限制了人脸识别的应用.基于Alpha散度的NMF分解方法用于人脸识别,用Alpha散度作为距离度量标准,得到对应的NMF分解表达式,通过表达式中参数的取值可以衍生出多种分解迭代表达式,在每步迭代过程中计算差异度,进而确定下一步的最优参数,这样能保证分解收敛于全局最优,提高人脸识别的精度.  相似文献   

19.
通过分析基于神经网络的经典盲分离算法具有容易陷入局部极小点,从而导致收敛速度慢和分离效果不准确的缺点,本文首先利用遗传神经网络算法对分离权值进行初始化,然后通过选择操作、交叉操作和变异操作,进行样本训练控制,在整个搜索空间进行搜索,得到分离矩阵最优值,最后实现了语音信号的盲分离.实验表明:该算法具有分离速度快、效果明显等特点.  相似文献   

20.
当利用传统自然梯度算法对所有语音信号都使用同一个激活函数进行分离时,对语音信号的盲源分离效果都不尽理想.针对这一问题,采用基于皮尔逊系统的分段激活函数对传统自然梯度算法进行改进.通过引入皮尔逊系统,将皮尔逊函数与传统激活函数相结合,再利用信号的矩估计方法,分段选择合适的激活函数代入分离矩阵,有效克服了传统语音分离算法的缺点和不足.仿真结果表明,在对实际的语音信号进行分离时,改进算法的性能明显优于传统自然梯度算法,并且在保持了良好收敛速度的同时大大减少了均方误差.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号