期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

采用聚类神经网络与分离输出语音重构的语音分离算法 总被引：1，自引：1，他引：0

虞晓胡光锐徐雄《上海交通大学学报》2000,34(6):748-751

基于听觉现象分析计算模型 ( CASA)的基本原理 ,对仅有单通道输入混合语音信号时 ,采用振荡器神经网络 ,提出了一种 CASA计算模型语音分离算法结构 .利用实例说明了算法的具体实现步骤和参数设置 .讨论了该算法结构中各语音听觉感知成分 Segments的聚类过程和对分离输出语音的重构处理部分 ,以及如何采用合适的听觉感知成分聚类规则设计相应的聚类神经网络 ,以完成对应不同输入独立语音源信号的各 Segments的聚类 ,从而实现语音分离任务相似文献

2.

一种采用振荡神经网络的CASA计算模型语音分离算法

胡光锐虞晓茅晓泉《上海交通大学学报》2001,35(11):1640-1644

基于听觉现象分析（CASA）模型的基本原理,在仅有单通道输入混合语音信号时,采用振荡器神经网络,提出了一种CASA改进模型语音分离算法结构,文中利用一个实例说明了新算法的具体实现步骤,讨论了新算法机构中语音听觉外围处理部分和分割神经网络处理部分,通过上述两个部分的处理可以将输入混合语音信号在时频域上分割为若干有听觉感知意义的语音听觉感知成分分段Segments,以便于新算法后续处理分部中语音Segments的聚为和分离重构输出处理,最终完成语音分离任务。相似文献

3.

基于改进基音跟踪算法的单通道语音分离

王雨林家骏袁文浩陈宁《华东理工大学学报(自然科学版)》2013,39(3):338-344

基于计算听觉场景分析(Computational Auditory Scene Analysis,CASA)的语音分离系统通过模拟人耳的听觉感知系统对混合信号进行处理并分离出感兴趣的目标语音,近年来得到了很大的发展。如何在干扰噪声存在的情况下进行正确的基音提取跟踪一直是CASA系统研究的重点。提出了一种基于目标语音源的改进基音跟踪算法。该算法通过对目标源估计和基音检测两个步骤的反复迭代计算,得到最终的基音轨迹。通过在不同噪声干扰条件下与传统基音跟踪算法对比的实验结果证明,该算法能够有效地抑制噪声,提高输出语音的信噪比和语音质量。相似文献

4.

基于CASA简化模型的语音增强算法 总被引：2，自引：0，他引：2

虞晓胡光锐崔玉红《上海交通大学学报》2001,35(11):1635-1639

基于听觉现象分析（CASA）模型的基本原理,针对仅有非语音信号干扰情况下的单通道语音增强处理问题,利用人耳的频率掩蔽效应,提出了一种单通道简化CASA计算模型语音增强新算法,新算法通过提取混合语音输入中的有效语音时频成分并利用人耳的听觉掩蔽效应重构合成增强语音输出信号,通过在汽车噪声和白噪声干扰下的仿真实验结果表明,简化的CASA模型语音增强算法的输出信噪比约提高了10dB,且可以有效抑制干扰噪声的听觉影响,增强输出语音信号的可懂度。相似文献

5.

基于伪谐波模型的强鲁棒语音认证算法

张秋余张涛吴东方葛子贤《华中科技大学学报(自然科学版)》2018,(3):58-64

为了使语音认证算法在真实噪声环境下具有更强的鲁棒性,提出一种基于伪谐波模型的强鲁棒语音感知哈希认证算法.该算法首先对待认证语音进行预处理后分帧、加窗;然后通过输入一定的参考频率对每帧信号构造伪谐波模型,使每个频率对应一个单一成分的模型分析信号,并利用模型分析信号的突出幅度信息作为语音信号的感知特征值;最后对感知特征值进行哈希构造,生成二进制感知哈希序列来实现语音认证.实验结果表明:该算法对较强的真实环境噪声和一些常规的内容保持操作具有非常好的鲁棒性,同时区分性和认证效率能够满足语音通信实时性的要求. 相似文献

6.

一种基于衰减-时延聚类估计的欠定语音盲分离算法

陈林夏秀渝代勇周宁《四川大学学报(自然科学版)》2013,50(5):991-997

针对衰减-时延混合模型,提出一种改进的欠定语音盲分离算法.第一步根据独立语音源在时频域上的稀疏性,用势函数法分别聚类估计衰减矩阵和时延矩阵,然后配对以确定各声源混合矩阵.第二步由估计的混合矩阵,采用改进最短路径法恢复出目标语音.为了减少计算量,设置门限对能量较小的时频点直接置零处理,在衰减矩阵和时延矩阵聚类估计时采用了分段聚类算法.仿真实验表明本文算法分离出的语音和源语音相似系数达0.96,0.97,0.93,信噪比达12.66dB,12.86dB,8.87dB,且有效减少了计算量,证明了该算法的可行性和有效性. 相似文献

7.

基于NMF和FCRF的单通道语音分离

《清华大学学报(自然科学版)》2017,(1)

近年来,非负矩阵分解(non-negative matrix factorization,NMF)被广泛应用于单通道语音分离问题。然而,标准的NMF算法假设语音的相邻帧之间是相互独立的,不能表征语音信号的时间连续性信息。为此,该文提出了一种基于NMF和因子条件随机场(factorial conditional random field,FCRF)的语音分离算法,首先将NMF和k均值聚类结合对纯净语音的频谱结构以及时间连续性进行建模,然后利用得到的模型训练FCRF模型,进而对混合语音信号进行分离。结果表明:该算法相比没有考虑语音时间连续特性的基于NMF的算法如激活集牛顿算法(active-set Newton algorithm,ASNA),在客观指标上有明显提高。相似文献

8.

基于非负矩阵分解和长短时记忆网络的单通道语音分离

崔建峰邓泽平申飞史文武《科学技术与工程》2019,19(12)

为了解决语音分离中非负矩阵分解(non-negative matrix factorization,NMF)、深度神经网络(deep neural network,DNN)等算法没有考虑语音时序相关性的问题。结合NMF和长短时记忆网络(long short-term memory,LSTM)算法提出NMFLSTM单通道语音分离算法:将语音信号的幅度谱作为模型的输入特征,通过训练NMF和LSTM模型获得目标语音的基矩阵和系数矩阵,并对其结果进行语音重构最终实现语音分离。实验结果表明:相比于未考虑语音时间连续性的算法,使用NMFLSTM算法分离语音的客观语音质量评估值(perceptual evaluation of speech quality,PESQ)有明显提升,其最大值超过3. 1,获得良好的分离效果。相似文献

9.

基于计算听觉场景分析的语音增强改进算法

王雨林家骏袁文浩《华东理工大学学报(自然科学版)》2012,38(5):617-621

针对单通道语音增强问题,基于计算听觉场景分析(CASA)的原理,提出了一种基于CASA计算模型的语音增强改进算法。该算法在特征提取中选择了目标语音有效能量、信道互相关等特征,对语谱能量和互相关特征的阈值选取进行了改进。在5种低信噪比噪声干扰条件下的仿真实验结果证明,该算法输出增强语音的信噪比平均提高了9.32dB,有效地抑制了噪声。相似文献

10.

基于独立分量分析与二值掩膜的语音分离

钱思冲向阳李胜杨李恒《华中科技大学学报(自然科学版)》2015,(7)

针对欠定混合语音信号模型,提出一种基于独立分量分析和二值掩膜相结合的语音分离新算法.首先,由并列放置的两个全指向性麦克风采集混合声音信号,通过一阶差分麦克风阵列技术使得两路混合信号满足瞬时混合模型;然后,应用两输入两输出独立分量分析方法对两路信号进行分离并估计分离信号的二值掩膜,循环迭代进而提取目标语音信号;最后,合并同源语音信号,增强各独立声源.仿真结果表明:该方法不仅适用于瞬时混合模型,对卷积混合模型同样有效;在瞬时混合条件下信噪比增益平均达到12.41dB,在卷积混合条件下信噪比增益平均为5.28dB.试验结果表明:算法在半消音室环境下能准确分离来自不同方位的三个声源,提取的目标语音都具有较高的清晰度与可懂性. 相似文献

11.

基于心理声学模型的高性能语音质量评价算法

张军张德运高磊赵东平《西安交通大学学报》2006,40(4):437-440

提出了一种高效心理声学模型语音质量评价（EPM-SQE）算法．该算法采用12阶美尔倒谱参数（MFCC）作为语音信号特征向量，其空间复杂度小于巴克谱．对MFCC进行相对谱（RASTA）滤波，可以突出快变信号对听觉感知的影响．将滤波后的参数映射为响度，由此模拟人的感知过程．计算原始语音和受损语音响度之问的感知扰动，并依次在频域和时域进行聚合，从而获得单一的扰动值，该值再经认知模型计算，可以得到最终的客观评分．实验表明，所提算法的平均运行时间比国际电信联盟提出的语音质量感知评价算法减少了41％，内存占用降低了51％，而仅比主观评价的相关度下降6．8％．相似文献

12.

融合MFCC和LPCC的语音感知哈希算法

黄羿博张秋余袁占亭杨仲平《华中科技大学学报(自然科学版)》2015,(2):124-128

为了提高语音感知哈希算法的鲁棒性和识别小范围篡改定位的能力,利用人类听觉模型提出了一种语音感知哈希算法.该算法基于人类听觉特性,首先对倒谱系数MFCC算法每帧的滤波器数量进行控制,得到每帧语音的梅尔频率倒谱参数;其次对自适应梅尔倒谱系数MFCC参数和语音LPCC系数进行融合,并采用分块方法对特征矩阵进行处理,对特征块进行2DNMF分解运算,降低特征矩阵的复杂度;最后对分解后的系数矩阵进行哈希构造,得到语音感知哈希串,利用哈希匹配实现语音认证.结果表明:该算法可以有效提高哈希认证的鲁棒性,并能够实现语音小范围篡改定位功能. 相似文献

13.

基于遗传神经网络的语音信号盲分离算法

李大辉《齐齐哈尔大学学报(自然科学版)》2008,24(6)

通过分析基于神经网络的经典盲分离算法具有容易陷入局部极小点,从而导致收敛速度慢和分离效果不准确的缺点,本文首先利用遗传神经网络算法对分离权值进行初始化,然后通过选择操作、交叉操作和变异操作,进行样本训练控制,在整个搜索空间进行搜索,得到分离矩阵最优值,最后实现了语音信号的盲分离.实验表明:该算法具有分离速度快、效果明显等特点. 相似文献

14.

快速定点独立向量分析在语音信号盲分离中的应用

黄会营李小光洪俊芳《河南师范大学学报(自然科学版)》2012,40(6):147-149,164

针对包括环境噪声的混叠语音信号分离困难问题,提出一种新的频域快速定点独立向量分析模型,对混叠语音信号进行盲分离.该模型中的每个源信号以向量形式混合,模型采用二次泰勒多项式把牛顿迭代算法直接应用于复变量对照函数,通过最优化使牛顿迭代规则更加简单和清晰.对实际采集的语音信号进行仿真,实验证明算法很好地分离了卷积盲源信号,新算法具有良好的收敛性和较高的准确性. 相似文献

15.

多带同步模型用于噪声环境下语音识别

孙吴镇扬《中国工程科学》2006,8(3):31-34

根据人耳听觉特性，提出新的同步多带最大似然线性回归算法用于噪声环境下语音识别。该算法采用最大似然作为参数估计准则，利用各频带信号同步感知和噪声污染假定的方法进行语音模型补偿，有效地提高了识别系统在噪声环境下的识别性能。相似文献

16.

基于双通道神经网络时频掩蔽的语音增强算法

《华中科技大学学报(自然科学版)》2021,49(6):43-49

为提高语音增强算法消除方向性噪声和抑制混响的能力,结合单、多通道处理信号的优势,提出了双通道神经网络时频掩蔽语音增强算法.首先,利用改进的多分辨率耳蜗动静态特征,结合依据信噪比优化的自适应掩模,对双麦克风信号分别进行单通道神经网络初步语音增强,达到全面利用语音非线性特征改善感知度的目的;其次,提出一种基于自适应掩模方向矢量定位法,精确计算语音、噪声的空间协方差矩阵和方向矢量,在带噪和混响的环境下精确定位目标声源;最后,输入信号到卷积波束形成器中,进一步去噪和抑制混响.实验结果表明:与其他单、多通道语音增强算法相比,重构语音具有更好的语音质量和可懂度. 相似文献

17.

基于计算听觉场景分析的改进清音分离方法

王雨林家骏袁文浩陈宁《华东理工大学学报(自然科学版)》2014,(2):212-217

基于计算听觉场景分析(CASA)的单通道语音分离方法在浊音分离领域已发展得较为成熟,然而由于清音信号具有较小的能量且不包含周期性基音特征,因此清音分离具有较大的困难。根据噪声信号分布的不确定性和不稳定性,提出了基于CASA和谱减的改进清音分离方法。改进方法在剔除了浊音块后,通过基于距离加权的残余噪声估计算法得到每个清音单元中所包含的噪声能量,对每个清音单元进行谱减算法并标记,进一步剔除残余噪声单元,提取出清音信号。实验结果证明:与传统清音分离方法相比,改进方法对时变性残余噪声能量的估计结果更加精确,更能提高清音分离的有效性。相似文献

18.

基于压缩感知的盲源信号分离检测方法

《天津大学学报(自然科学与工程技术版)》2016,(11)

接入电网的各种分布式电源、非线性负荷使得电能质量污染问题日益严重,对各种电能质量信号进行特征提取与正确分离是改善电能质量的切入点.针对电能质量信号的结构特点,构建了压缩感知电能质量信号分离模型,并针对该模型提出一种基于压缩感知的盲源信号分离检测算法CS-SCA(compressed sensing-sparse component analysis).根据已有的电能质量信号理论知识,确定电能质量信号在频域的稀疏性,进而对信号预处理降噪.通过两步法解决预处理后电能质量观测信号的分离检测问题.第1步通过观测信号向量方向特性估计出电能质量源信号个数,并利用线性聚类估计混合矩阵;第2步采用压缩感知恢复算法分离得出电能质量源信号.通过实验验证,提出算法所分离出基波、各次谐波信号分离信干比均大于10,dB. 相似文献

19.

基于块对角结构的语音信号盲压缩重构

陈莹钟菲郭树旭陈孝君《吉林大学学报(信息科学版)》2016,34(4):491-495

为在复杂环境中提高语音信号的重构精度, 提出基于正交块对角结构的语音信号盲压缩重构算法, 通过最优求解找到一组对应的正交块对角变换基及稀疏矩阵, 利用二者乘积实现语音信号压缩重构。该算法确保盲压缩感知理论具有唯一解, 能从复杂的环境中恢复原始语音信号, 具有更强的自适应性, 在保证听觉效果的同时, 大大降低了观测维度。实验结果表明, 基于正交块对角结构盲压缩感知(OBD-BCS: Orthonormal Block Diagonal Blind Compressed Sensing)算法能高质量恢复语音信号原始结构。相似文献

20.

基于强约束字典联合深度神经网络的单通道语音分离

孙林慧袁硕张蒙梁文清步云怡《南京邮电大学学报(自然科学版)》2023,(2):1-10

针对基于字典学习语音分离方法的“交叉投影”问题,提出了强约束的优化函数,不仅抑制重构信号和目标信号的误差,约束干净信号在联合字典上的误差,而且抑制干净信号在其他字典上的投影并限制字典间的原子相关性。此外,为了进一步提高两个相似信号的分离效果,提出基于强约束字典联合深度神经网络的单通道语音分离方法,首先利用强约束字典实现目标与干扰语音的初步分离,然后通过联合约束利用深度神经网络实现语音与干扰语音交叉投影残余的分离。实验结果表明,与其他优秀单通道语音分离方法相比,该算法有效提升了语音分离系统的性能。相似文献