共查询到20条相似文献,搜索用时 31 毫秒
1.
2.
3.
为提高语音识别系统在噪音情况下的识别率,提出了一种融合信号级去噪、参数级去噪、模型级去噪的方法.首先用谱减法对带噪的语音信号进行去噪,再利用Mel倒谱系数(MFCC)对处理后的语音信号进行特征提取,最后经过并行模型结合处理法(PMC)处理得到较高识别率的语音信号. 相似文献
4.
LPC谱估计算法摆脱不了全极点模型的束缚,通过提高模型阶数来获得更好的频谱包络,但其在谱的谷值处有很大偏差的缺点.文中对倒谱法通过对对数频谱密度函数定义和对残差的迭代更新,得出了一种对数幅度谱包络的无偏算法.与LPC和MEL-LPC法比较具有较多优点,为语音信号零极模型的估计和对语音特征研究提供依据. 相似文献
5.
提出了一种利用加权Mel倒谱提取语音信号共振峰的算法.首先对短时语音信号进行加权Mel倒谱分析,获得包含频谱主要成分的加权Mel倒谱系数;然后利用离散余弦平滑算法,从加权Mel倒谱系数获得谱包络,并从谱包络的峰值位置获得候选共振峰;最后根据共振峰的连续性约束条件和频率范围,从候选共振峰筛选得到共振峰的估计值.实验结果表明,本算法比倒谱法提取的共振峰误差更小,在噪声环境下具有较好的鲁棒性. 相似文献
6.
谱重排最早被称为改进的滑动时窗法,用来提高常规的时频谱分析的分辨率,其基本原理是将原时频谱中每一点的能量进行聚焦重排。由于该算法仅对信号在频率域进行重排,致使其重排过程是不可逆的。为了优化时频重排算法,将原始的谱重排算法与希尔伯特变换相结合,通过对信号求取导数并使用加窗傅里叶变换对理论信号进行再处理得到改进后的处理结果。结果表明,基于希尔伯特变换的改进谱重排算法不仅兼顾了时频谱重排和加窗傅里叶变换的优势,提高了对信号时频变换的分辨率,而且在地震勘探领域具有广泛的应用前景。 相似文献
7.
8.
语音信号的激活检测(voice activity detection,VAD)是变速率语音编码的关键技术,用来检测通信时是否有语音片存在。在有噪环境下对语音信号的激活检测是非常重要而困难的。对传统子带谱熵算法进行了改进,提出了一种能够用于语音激活检测的新算法。该算法利用语音谱熵和噪声谱熵分布的不同,将信号的数字特征(方差、均值等)与传统子带谱熵相结合,用于区分语音段和非语音段。计算机仿真结果表明,在高斯白噪声环境下,改进后的子带谱熵算法能很好地区分说话人的语音段和非语音段,在某种程度上解决了传统语音激活检测算法结构复杂、参数难调、易受噪声影响等问题。 相似文献
9.
为降低谱包络参数的量化失真,研究了谱包络参数的平滑算法,称为DCT-S算法.谱包络参数用线谱频率(LSF)参数表示,用离散余弦变换(DCT)对多帧线谱频率(LSF)参数每一维组成的矢量进行变换,然后对DCT系数进行截断,再进行反离散余弦变换,得到LSF参数的平滑轨迹.测试表明,应用DCT-S算法,在LSF参数单帧矢量量化时,平均谱失真下降了约 0.23 dB;在LSF参数多帧联合矢量量化时,平均谱失真下降了约0.25~0.45 dB. 实验结果表明,DCT-S算法使谱包络参数的变化轨迹得到了平滑,有效地降低了谱失真. 相似文献
10.
一种改进的基于子带谱熵的语音激活检测方法 总被引:2,自引:2,他引:0
语音信号的激活检测(voice activity detection,VAD)是变速率语音编码的关键技术,用来检测通信时是否有语音片存在.在有噪环境下对语音信号的激活检测是非常重要而困难的.对传统子带谱熵算法进行了改进,提出了一种能够用于语音激活检测的新算法.该算法利用语音谱熵和噪声谱熵分布的不同,将信号的数字特征(方差、均值等)与传统子带谱熵相结合,用于区分语音段和非语音段.计算机仿真结果表明,在高斯白噪声环境下,改进后的子带谱熵算法能很好地区分说话人的语音段和非语音段,在某种程度上解决了传统语音激活检测算法结构复杂、参数难调、易受噪声影响等问题. 相似文献
11.
12.
提出了一种高效心理声学模型语音质量评价(EPM-SQE)算法.该算法采用12阶美尔倒谱参数(MFCC)作为语音信号特征向量,其空间复杂度小于巴克谱.对MFCC进行相对谱(RASTA)滤波,可以突出快变信号对听觉感知的影响.将滤波后的参数映射为响度,由此模拟人的感知过程.计算原始语音和受损语音响度之问的感知扰动,并依次在频域和时域进行聚合,从而获得单一的扰动值,该值再经认知模型计算,可以得到最终的客观评分.实验表明,所提算法的平均运行时间比国际电信联盟提出的语音质量感知评价算法减少了41%,内存占用降低了51%,而仅比主观评价的相关度下降6.8%. 相似文献
13.
陈蕴谷 《安庆师范学院学报(自然科学版)》2010,16(1):19-21
本文提出了一种基于谱减法和经验模式分解的语音增强算法。在低信噪比的情况下用谱减法可以去除语音信号中的大部分背景噪声,再对已处理过的信号进行经验模式分解,对前几个IMF进行阈值处理可以进一步增强语音。实验表明:本算法去噪效果优于传统方法。 相似文献
14.
《中南大学学报(自然科学版)》2020,(9)
基于高精度谐波分析是电力系统谐波污染治理的前提,由于频谱泄漏的影响,经典的谐波分析算法存在参数估计精度不高、计算复杂度较大等问题,为此,在分析信号谱线衰减特征的基础上,提出一种基于谱序列变换的高精度谐波参数分析算法。该算法通过对信号进行FFT运算得到谱序列并对其实施特定的加权变换,加速非真实频率处谱线的衰减速度,从而达到有效抑制频谱泄漏的目的,在此基础上推导谐波幅值和相位的计算公式。研究结果表明,与经典的加窗插值算法和FFT改进算法相比,所提出的算法所得谐波参数估计精度显著提高,且其在基波频率变化及间谐波条件下均表现出优良的估计性能;此外,与经典的加窗插值算法相比,新算法只需对谱序列进行简单处理,具有计算复杂度低的优点。 相似文献
15.
为了提高语音感知哈希算法的鲁棒性和识别小范围篡改定位的能力,利用人类听觉模型提出了一种语音感知哈希算法.该算法基于人类听觉特性,首先对倒谱系数MFCC算法每帧的滤波器数量进行控制,得到每帧语音的梅尔频率倒谱参数;其次对自适应梅尔倒谱系数MFCC参数和语音LPCC系数进行融合,并采用分块方法对特征矩阵进行处理,对特征块进行2DNMF分解运算,降低特征矩阵的复杂度;最后对分解后的系数矩阵进行哈希构造,得到语音感知哈希串,利用哈希匹配实现语音认证.结果表明:该算法可以有效提高哈希认证的鲁棒性,并能够实现语音小范围篡改定位功能. 相似文献
16.
针对传统谱幅值调制方法易受噪声影响的问题,利用参数化S变换得到信号在时频域中的幅值,提出了一种参数化S谱幅值调制方法。该方法首先使用参数化S变换将信号转换到时频域并得到幅值和相位,然后将不同权重赋予时频域中的幅值以改变不同能量频率成分在信号中的占比,最后将调制后的幅值与原相位结合,使用参数化S逆变换重构一系列修正信号并计算其平方包络谱以提取故障特征。仿真和实验结果表明,该方法获得的幅值信息相比传统谱幅值调制方法更加准确和全面,对强噪声环境更具鲁棒性,能够有效实现滚动轴承的外圈、内圈和复合故障诊断。将所提方法与传统谱幅值调制方法和快速谱峭度方法进行对比,证明了参数化S谱幅值调制既能检测强噪声环境下的轴承故障信息,又能同时提取多种故障分量,在滚动轴承的故障特征提取中更具优越性。 相似文献
17.
基于减谱法的语音增强和噪声消除的研究 总被引:8,自引:0,他引:8
介绍了减谱法进行语音增强的一种方法 .分别对语音和噪声信号进行傅立叶变换 ,求得它们的频谱 ,相减得到的是去噪后语音的频谱 ,再进行傅立叶反变换 ,即可得到增强语言信号 ,从而有效地抑制了噪声 相似文献
18.
顾丽萍 《湖南理工学院学报:自然科学版》2009,22(1)
描述了用减谱法进行语音增强的一种方法,利用计算机以及相应的MATLAB标准软件,分别对语音和噪音信号进行傅里叶变换,求得它们的频谱,相减得到的是去噪后语音的频谱,再进行傅里叶反变化,即可得到增强语言信号,从而有效地抑制了噪声. 相似文献
19.
主要讨论了一种使用语音频谱动态特性的倒谱距离测量对通信系统或通信设备进行客观音质评价方法,它是在使用LPC倒谱距离评价普通话语音质量的基础上发展起来的,语音频谱动态特性是利用倒谱对时间的回归分析来表示的,这种度量方法中,使用倒谱系数,倒谱回归系数和能量回归系数3个参数的距离测量,在使用了谱包络信息的基础上,考虑了谱包络随时间的变化量及信号能量随时间的变化,比较了4种距离估算方法和主观音质评价(MO 相似文献
20.
针对快速傅里叶变换(FFT)处理信号时出现的频谱泄漏和栅栏效应问题,利用真实频点附近幅值最大的谱线及其两侧的谱线,给出了基于经典余弦窗三谱线插值FFT的谐波分析方法,并结合最小二乘及多项式拟合方法,推导出谐波参数的修正公式.仿真实验结果表明,相较于传统FFT方法,基于经典余弦窗三谱线插值FFT法能够更好地抑制频谱泄漏和栅栏效应的影响,谐波参数检测精度也进一步提升. 相似文献