首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 250 毫秒
1.
王彪 《科学技术与工程》2012,12(10):2462-2464
为了提高语音信号的识别率,提出了一种基于经验模态分解(EMD)法的语音信号特征参数提取方法。该方法先对语音信号进行EMD分解,获得其内模函数;再进行FFT和DCT变换,得到特征分量,以此构成语音信号新特征参数。最后采用高斯混合模型(GMM)进行说话人语音识别,实验表明新特征参数取得了较好的识别率。  相似文献   

2.
为研究短波语音通信下的飞机识别,提出利用2种方式对目标声信号进行分析处理.为实现对语音进行抑制,分别利用全局经验模态分解(EEMD)和经验模态分解(EMD)将信号进行重构,然后根据重构后的目标信号进行Bark域频率感知的小波包分解(BWPD)和高阶累积量(HOC)分解,对目标声信号分别提取了听觉感知的特征和展现信号的物理特性的特征;分别利用EEMD和EMD分解对信号进行重构,然后选择Mel 频率倒谱系数和高阶累积量对重构后的信号进行特征提取.对比实验表明:EEMD-BWPD-HOC方法能够抽取出有效的飞机舱内背景声音信号特征,实现语音抑制,并且以较高的识别率识别出4种飞机.  相似文献   

3.
主要对文本无关的说话人识别技术进行一些探讨。与语音识别不同,说话人识别技术必须提取说话人依赖特点,而语音特征量的选取是利用说话人声音的频谱通过分离傅立叶变换(DCT)获得的。在训练阶段,每一个说话者通过矢量量化产生一个码书(语音数据库)。在认识阶段期间,通过对欧几里德距离代表VQ的计算来减少失真。在一定范围的说话人的语音库中,测试结果表明有很高的识别率,可以达到96%。  相似文献   

4.
在语音情感识别系统中,语音情感特征的提取尤为重要,本文在前期已有对EMD分解研究的基础上,将EMD分解与Teager能量算子相结合,用于语音情感识别。文中首先利用EMD分解得到一组IMF分量,再对各阶IMF分量提取Teager能量,然后通过对不同语种的不同情感语音的Teager能量在Mel频率的分析,提出了一种新的情感特征:基于EMD分解的Mel频率的Teager能量谱系数(ETMC),最后利用SVM分类方法对不同语种的不同情感进行识别,实验结果表明,该方法有很好的识别结果。  相似文献   

5.
说话人识别技术是通过判断待识别人语音与预先提取的说话人语音特征是否匹配来鉴别说话人身份的一种生物认证技术,环境噪声是说话人识别技术走向实用化的一个主要障碍.针对噪声环境中说话人识别性能较差的不足,结合小波变换的优点,提出了将小波变换技术与传统的特征参数提取方式相结合的方法.该方法首先对语音信号进行小波分解,在此基础上再对小波系数进行阈值处理,仅保留阈值以上的数据,而后提取相关性不大的传统特征参数进行组合,分别作为说话人识别系统的输入矢量.仿真结果表明:在噪声环境中,说话人识别系统能较好识别出说话人,经过小波变换后再提取特征参数的方法可以得到更高的识别率,大大提高说话人识别系统的识别性能.  相似文献   

6.
一种基于EMD技术的语音信号去噪算法   总被引:5,自引:0,他引:5  
分析了基于经验模态分解(EMD)方法的含噪语音信号尺度滤波特性,并根据清音和浊音的不同特点,应用软门限方法对以宽带随机噪声为背景的语音信号IMF分量作门限处理,提出了一种基于EMD的语音信号噪声处理的算法,计算机实验仿真结果表明,该算法具有较好的语音去噪效果和较小的语音失真性能。  相似文献   

7.
随着普通话水平考试的普及,普通话水平测试系统的自动化变得日益迫切。为了建立自动的普通话水平测试系统,如何快速准确的对普通话测试命题说话内容进行缺时检测是一个关键问题。将语音信号分成若干窗口,采用EMD分解算法将窗口信号分解为若干IMF。在每一窗口上利用Hilbert-Huang变换获取每个IMF分量的瞬时幅值和频率。利用瞬时幅值和频率构造每个IMF分量的能频值。将所有IMF分量的能频值组成该段的能频值特征向量,利用该能频值特征向量来区分信号中的静音段和语音段。最后通过计算相邻静音段的最大时长判断是否缺时,并采用一种规则消除因强噪声信号而引起的某一段能频值过大的影响。实验表明,笔者所设计的算法对普通话水平考试中的缺时检测有良好的效果。  相似文献   

8.
环境失配问题严重影响着说话人识别的性能,这一问题在非平稳噪音条件下表现得更为显著.为了增强说话人识别在环境失配条件下的鲁棒性,基于稀疏表示提出了一种高维鲁棒语音特征的生成方法,并针对上述高维语音特征的稀疏特性提出了一个说话人模型.在该说话人识别方法中,首先以优化的联合基作为稀疏表示的基,在此基础上对信号进行分解,用于从带噪语音中剥离噪音成分,并从中提取语音信号的内蕴时频结构;之后在此基础上提出了一种鲁棒的稀疏谱语音特征,并根据该特征的高维稀疏特性给出了基于混合k-means的说话人模型.实验结果显示,与基于梅尔倒谱系统特征的基线系统相比,提出的说话人识别方法在NIST SRE-2003语料库条件下的等错误率下降了28.16%,在Chinese-863语料库和不同信噪比(5dB和0dB)的非平稳汽车噪音环境下的等错误率分别下降了9.84%和14.21%.上述结果表明,在环境失配情况下,提出的说话人识别方法的性能明显优于基于梅尔倒谱系数特征的基线系统.  相似文献   

9.
由于噪声信号的干扰,导致机器人难以实现对微弱信号的远距离语音识别,影响最终的识别效果.为此,本文提出基于微信号增强的机器人远距离语音识别仿真研究.首先采用谱减法对微信号进行增强处理,由于语音信号中噪声功率谱具有一定的稳态属性,可估算出噪声的功率谱,再利用谱减计算求出纯净语音的功率谱,对傅里叶变换后的各个相位信号进行差异化赋权后,再对去噪功率谱进行拟合,完成对信号相位的恢复.在语音识别阶段,将增强后的原始语音信号分解为若干个独立的语音帧,在梅尔三角滤波器组中提取语音信号的Mel频谱参数,将其与语音频率之间的关系作为识别特征参数,最后利用梯度下降算法,在损失函数的约束下匹配与识别特征拟合度最高的内容,实现语音识别.仿真测试结果表明,本文提出的设计方法在噪声、不同信噪比、不同测试距离下对语音的识别率均达到了95.00%以上,与对照组相比具有更好的识别效果.  相似文献   

10.
基于EMD与小波阈值的爆破震动信号去噪方法   总被引:1,自引:0,他引:1       下载免费PDF全文
针对小波阈值法去噪效果有限和EMD低通法去噪存在信号失真问题,综合EMD方法分解、重构方便和小波阈值法灵活、可调的优点,提出一种EMD-小波阈值爆破震动信号去噪方法.基于某矿地表实测数据,借助EMD的自适应分解特性,在原始信号分解的基础上,识别属于高频噪声的IMF1和IMF2分量,并对其进行小波阈值去噪处理,提取淹没在噪声中的有用特征信息MF1和MF2,最后,将MF1、MF2与剩余IMF分量及余量R进行重构,得到干净信号.通过频谱和小波包能量分析知:EMD-小波阈值法既能有效去除噪声,又能很好保留真实信号,还可避免EMD分解的端点震荡效应,是一种高效的爆破震动信号去噪方法.  相似文献   

11.
阐述了分析非线性、非平稳信号的Hilbert—Huang变换(HHT)算法。针对非平稳语音信号,提出了一种基于HHT的提取语音特征参数HHT—IF的新方法,设计了基于VQ的说话人辨认系统,分别采用HHT-IF和LPCC从不同角度进行说话人辨认实验。结果表明,特征参数HHT-IF用于说话人识别是可行的。  相似文献   

12.
说话人特征提取是说话人识别系统中的关键环节,优良的特征提取算法既能有效反映说话人的基本特征,又能为识别的有效性提供保证.根据量子势阱理论,论文以透射系数、能量和频率的对应关系为切入点,构造出使频率和势阱一一对应的势阱组.针对语音信号的特点,将一帧语音信号视为一个量子态,利用势阱分离能量的特性,通过势阱组提取出信号的能量谱特征,并以此作为特征参数,探索了一种基于量子势垒组的说话人特征提取方法.仿真结果表明,在相同条件下,该方法可以降低算法的复杂性并能够有效的提取说话人特征,为说话人特征提取提供了新的研究方向.  相似文献   

13.
In this paper, the frequency characteristics of Chinese whispered speech were investigated by a filter bank analysis. It was shown that the first and the third formants were more important than the other formants in the speaker identification of Chinese whispered speech. The experiment showed that the 800?1200 Hz and 2800?3200 Hz ranges were the most significant frequency ranges in discriminating the speaker. Based on this result, a new feature scale named whisper sensitive scale (WSS) was proposed to replace the common scale, Mel scale, and to extract the cepstral coefficient from whispered speech signal. Furthermore, a speaker identification system in whispered speech was presented based on the modified Hidden Markov Models integrating advantages of WSCC (the whisper sensitive cepstral coefficient) and LPCC. And the new system performed better in solving the problem of speaker identification of Chinese whispered speech than the traditional method.  相似文献   

14.
提出了一种在自相关域对语音信号进行线性预测分析的方法。证明了只要时域信号是一个全极模型信号,则其相应的自相关序列也是一个全极模型序列,且其全极模型是稳定的,具有更好的抗干扰性能。还提出了一种有效地降低这种模型阶数的算法。将这种模型的功率谱作为语音的特征参数,进行中文讲话者识别实验,取得了满意的结果。  相似文献   

15.
核磁共振(NMR)在孔隙结构评估和流体识别方面具有独特的优势,但NMR信号很容易受到噪声影响。根据NMR噪声的时域和频域特征,提出了基于一种经验模态分解(EMD)的NMR去噪方法。首先,利用EMD将信号由高频到低频分解为一系列的本征模态函数,以此分解噪声和噪声NMR信号,然后,使用曲线趋势法和改进的过零点率曲线确定信号噪声分离准则,将有用信号叠加到剩余项以获得去噪信号。通过岩芯数据和测井数据对比发现,基于EMD的去噪方法可以提高信噪比的同时保留孔隙结构信息,其去噪效果优于小波阈值和EMD小波阈值法,计算得到的孔隙度接近实际孔隙度。  相似文献   

16.
在VC++环境下,提取PLAR特征参数,基于听觉特性和语谱特性的语音增强器作为预处理器,对语音信号首先进行降噪处理,建立了基于DTW的抗噪声说话人识别系统.实验结果表明,即使在信噪比比较低的情况下,该系统都会在一定程度上提高多种噪声环境下说话人识剐系统的识别性能.  相似文献   

17.
把Gabor谱应用于离散时间域,对典型信号进行处理和分析,并与短时傅里叶变换和离散Wigner分布相比较,证明了离散Gabor谱不仅在时频域具有和离散Wigner分布相同的高分辨率,优于短时傅里叶变换,而且能有效地消除离散Wigner分布中交叉干扰的影响.文中还进一步应用离散Gabor谱,对汉语语音信号进行了处理,结果表明它可以较好地描述语音信号频谱的时变特性,为语音识别和话者识别开创了一种新的途径.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号