首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
基于多窗频谱估计和平滑幅度谱包络的MFCC改进算法   总被引:1,自引:0,他引:1  
语音的特征提取是说话人识别系统中的关键问题。本文在传统的MFCC参数的基础上,提出一种改进的MFCC特征提取算法。该算法着眼于语音的前端处理,在预处理阶段,利用SWCE窗函数,对信号进行多窗频谱估计。并对得到的频谱进行平滑处理,得到信号的谱包络。然后对信号的谱包络进行计算,得到改进的MFCC参数。实验表明,在不同噪声环境下,与传统的MFCC算法相比,改进的算法识别率提高四个百分点以上。  相似文献   

2.
研究了噪声对语音信号的干扰规律,利用语音信号的准周期性,较好的提取了含噪语音信号的频谱包络。通过一些改进算法,对包络峰值特征提取方法进行优化,并使用工程数学软件Matlab对此方法进行了模拟计算。结果表明:该方法可以较好的重建被噪声污染的语音谱包络,从而较好的提取到频谱的包络峰值特征。  相似文献   

3.
为提高语音识别系统在噪音情况下的识别率,提出了一种融合信号级去噪、参数级去噪、模型级去噪的方法.首先用谱减法对带噪的语音信号进行去噪,再利用Mel倒谱系数(MFCC)对处理后的语音信号进行特征提取,最后经过并行模型结合处理法(PMC)处理得到较高识别率的语音信号.  相似文献   

4.
LPC谱估计算法摆脱不了全极点模型的束缚,通过提高模型阶数来获得更好的频谱包络,但其在谱的谷值处有很大偏差的缺点.文中对倒谱法通过对对数频谱密度函数定义和对残差的迭代更新,得出了一种对数幅度谱包络的无偏算法.与LPC和MEL-LPC法比较具有较多优点,为语音信号零极模型的估计和对语音特征研究提供依据.  相似文献   

5.
提出了一种利用加权Mel倒谱提取语音信号共振峰的算法.首先对短时语音信号进行加权Mel倒谱分析,获得包含频谱主要成分的加权Mel倒谱系数;然后利用离散余弦平滑算法,从加权Mel倒谱系数获得谱包络,并从谱包络的峰值位置获得候选共振峰;最后根据共振峰的连续性约束条件和频率范围,从候选共振峰筛选得到共振峰的估计值.实验结果表明,本算法比倒谱法提取的共振峰误差更小,在噪声环境下具有较好的鲁棒性.  相似文献   

6.
谱重排最早被称为改进的滑动时窗法,用来提高常规的时频谱分析的分辨率,其基本原理是将原时频谱中每一点的能量进行聚焦重排。由于该算法仅对信号在频率域进行重排,致使其重排过程是不可逆的。为了优化时频重排算法,将原始的谱重排算法与希尔伯特变换相结合,通过对信号求取导数并使用加窗傅里叶变换对理论信号进行再处理得到改进后的处理结果。结果表明,基于希尔伯特变换的改进谱重排算法不仅兼顾了时频谱重排和加窗傅里叶变换的优势,提高了对信号时频变换的分辨率,而且在地震勘探领域具有广泛的应用前景。  相似文献   

7.
针对基本谱减法的噪声残留以及损伤语音的可懂度和自然度等问题,在基本谱减法原理基础上,提出了基于参数自适应的改进谱减法。引进谱减功率系数和谱减噪声系数,以增强后语音信号的信噪比为输出,以变化的谱减功率系数和谱减噪声系数为输入,自动控制选择最优参数,并且将其与带噪语音输入信噪比相匹配。对信号进行语音增强时,通过计算其输入信噪比,利用最优参数曲线得到最优参数值,然后结合平滑处理的过程实现语音增强最大化。实验表明,本文算法有效提高了基本谱减法的语音增强性能。  相似文献   

8.
语音信号的激活检测(voice activity detection,VAD)是变速率语音编码的关键技术,用来检测通信时是否有语音片存在。在有噪环境下对语音信号的激活检测是非常重要而困难的。对传统子带谱熵算法进行了改进,提出了一种能够用于语音激活检测的新算法。该算法利用语音谱熵和噪声谱熵分布的不同,将信号的数字特征(方差、均值等)与传统子带谱熵相结合,用于区分语音段和非语音段。计算机仿真结果表明,在高斯白噪声环境下,改进后的子带谱熵算法能很好地区分说话人的语音段和非语音段,在某种程度上解决了传统语音激活检测算法结构复杂、参数难调、易受噪声影响等问题。  相似文献   

9.
为降低谱包络参数的量化失真,研究了谱包络参数的平滑算法,称为DCT-S算法.谱包络参数用线谱频率(LSF)参数表示,用离散余弦变换(DCT)对多帧线谱频率(LSF)参数每一维组成的矢量进行变换,然后对DCT系数进行截断,再进行反离散余弦变换,得到LSF参数的平滑轨迹.测试表明,应用DCT-S算法,在LSF参数单帧矢量量化时,平均谱失真下降了约 0.23 dB;在LSF参数多帧联合矢量量化时,平均谱失真下降了约0.25~0.45 dB. 实验结果表明,DCT-S算法使谱包络参数的变化轨迹得到了平滑,有效地降低了谱失真.  相似文献   

10.
一种改进的基于子带谱熵的语音激活检测方法   总被引:2,自引:2,他引:0  
语音信号的激活检测(voice activity detection,VAD)是变速率语音编码的关键技术,用来检测通信时是否有语音片存在.在有噪环境下对语音信号的激活检测是非常重要而困难的.对传统子带谱熵算法进行了改进,提出了一种能够用于语音激活检测的新算法.该算法利用语音谱熵和噪声谱熵分布的不同,将信号的数字特征(方差、均值等)与传统子带谱熵相结合,用于区分语音段和非语音段.计算机仿真结果表明,在高斯白噪声环境下,改进后的子带谱熵算法能很好地区分说话人的语音段和非语音段,在某种程度上解决了传统语音激活检测算法结构复杂、参数难调、易受噪声影响等问题.  相似文献   

11.
基于HMM的孤立字识别   总被引:1,自引:0,他引:1  
本文以HMM(隐马尔可夫模型)为基础研究孤立字的汉语语音识别。孤立字的汉语语音样本首先经过人工切分去除寂静段,然后进行分帧处理;对每一帧语音进行频域预加重和时域汉明窗加权处理后,提取该帧的39维的MFCC混合参数(Mel频率倒谱参数);把该字所有帧的MFCC混合参数作为该字HMM模型的观察序列对其进行训练。通过在小人群范围内对0-9这十个孤立数码语音的大量实验,得到了很好的识别效果。  相似文献   

12.
提出了一种高效心理声学模型语音质量评价(EPM-SQE)算法.该算法采用12阶美尔倒谱参数(MFCC)作为语音信号特征向量,其空间复杂度小于巴克谱.对MFCC进行相对谱(RASTA)滤波,可以突出快变信号对听觉感知的影响.将滤波后的参数映射为响度,由此模拟人的感知过程.计算原始语音和受损语音响度之问的感知扰动,并依次在频域和时域进行聚合,从而获得单一的扰动值,该值再经认知模型计算,可以得到最终的客观评分.实验表明,所提算法的平均运行时间比国际电信联盟提出的语音质量感知评价算法减少了41%,内存占用降低了51%,而仅比主观评价的相关度下降6.8%.  相似文献   

13.
本文提出了一种基于谱减法和经验模式分解的语音增强算法。在低信噪比的情况下用谱减法可以去除语音信号中的大部分背景噪声,再对已处理过的信号进行经验模式分解,对前几个IMF进行阈值处理可以进一步增强语音。实验表明:本算法去噪效果优于传统方法。  相似文献   

14.
基于高精度谐波分析是电力系统谐波污染治理的前提,由于频谱泄漏的影响,经典的谐波分析算法存在参数估计精度不高、计算复杂度较大等问题,为此,在分析信号谱线衰减特征的基础上,提出一种基于谱序列变换的高精度谐波参数分析算法。该算法通过对信号进行FFT运算得到谱序列并对其实施特定的加权变换,加速非真实频率处谱线的衰减速度,从而达到有效抑制频谱泄漏的目的,在此基础上推导谐波幅值和相位的计算公式。研究结果表明,与经典的加窗插值算法和FFT改进算法相比,所提出的算法所得谐波参数估计精度显著提高,且其在基波频率变化及间谐波条件下均表现出优良的估计性能;此外,与经典的加窗插值算法相比,新算法只需对谱序列进行简单处理,具有计算复杂度低的优点。  相似文献   

15.
为了提高语音感知哈希算法的鲁棒性和识别小范围篡改定位的能力,利用人类听觉模型提出了一种语音感知哈希算法.该算法基于人类听觉特性,首先对倒谱系数MFCC算法每帧的滤波器数量进行控制,得到每帧语音的梅尔频率倒谱参数;其次对自适应梅尔倒谱系数MFCC参数和语音LPCC系数进行融合,并采用分块方法对特征矩阵进行处理,对特征块进行2DNMF分解运算,降低特征矩阵的复杂度;最后对分解后的系数矩阵进行哈希构造,得到语音感知哈希串,利用哈希匹配实现语音认证.结果表明:该算法可以有效提高哈希认证的鲁棒性,并能够实现语音小范围篡改定位功能.  相似文献   

16.
针对传统谱幅值调制方法易受噪声影响的问题,利用参数化S变换得到信号在时频域中的幅值,提出了一种参数化S谱幅值调制方法。该方法首先使用参数化S变换将信号转换到时频域并得到幅值和相位,然后将不同权重赋予时频域中的幅值以改变不同能量频率成分在信号中的占比,最后将调制后的幅值与原相位结合,使用参数化S逆变换重构一系列修正信号并计算其平方包络谱以提取故障特征。仿真和实验结果表明,该方法获得的幅值信息相比传统谱幅值调制方法更加准确和全面,对强噪声环境更具鲁棒性,能够有效实现滚动轴承的外圈、内圈和复合故障诊断。将所提方法与传统谱幅值调制方法和快速谱峭度方法进行对比,证明了参数化S谱幅值调制既能检测强噪声环境下的轴承故障信息,又能同时提取多种故障分量,在滚动轴承的故障特征提取中更具优越性。  相似文献   

17.
基于减谱法的语音增强和噪声消除的研究   总被引:8,自引:0,他引:8  
介绍了减谱法进行语音增强的一种方法 .分别对语音和噪声信号进行傅立叶变换 ,求得它们的频谱 ,相减得到的是去噪后语音的频谱 ,再进行傅立叶反变换 ,即可得到增强语言信号 ,从而有效地抑制了噪声  相似文献   

18.
描述了用减谱法进行语音增强的一种方法,利用计算机以及相应的MATLAB标准软件,分别对语音和噪音信号进行傅里叶变换,求得它们的频谱,相减得到的是去噪后语音的频谱,再进行傅里叶反变化,即可得到增强语言信号,从而有效地抑制了噪声.  相似文献   

19.
主要讨论了一种使用语音频谱动态特性的倒谱距离测量对通信系统或通信设备进行客观音质评价方法,它是在使用LPC倒谱距离评价普通话语音质量的基础上发展起来的,语音频谱动态特性是利用倒谱对时间的回归分析来表示的,这种度量方法中,使用倒谱系数,倒谱回归系数和能量回归系数3个参数的距离测量,在使用了谱包络信息的基础上,考虑了谱包络随时间的变化量及信号能量随时间的变化,比较了4种距离估算方法和主观音质评价(MO  相似文献   

20.
针对快速傅里叶变换(FFT)处理信号时出现的频谱泄漏和栅栏效应问题,利用真实频点附近幅值最大的谱线及其两侧的谱线,给出了基于经典余弦窗三谱线插值FFT的谐波分析方法,并结合最小二乘及多项式拟合方法,推导出谐波参数的修正公式.仿真实验结果表明,相较于传统FFT方法,基于经典余弦窗三谱线插值FFT法能够更好地抑制频谱泄漏和栅栏效应的影响,谐波参数检测精度也进一步提升.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号