首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
语音信号识别系统预处理阶段中一个关键步骤是语音信号的端点检测,其精准性直接决定了整个语音识别系统的识别效果. 传统的短时能量和短时过零率双门限检测法中后端点检测存在偏差,且在有噪声的情况下鲁棒性较差. 从动态阈值、短时平均过零率、端点修复、动态检测等方面入手,改进了双门限检测法. 优化了的端点检测算法,使得语音识别系统能够更精确地识别和提取语音,减少了语音识别时间,提高了识别率. 进一步将无用信号和语音信号完全分离开来,有利于后续语音识别的研究.  相似文献   

2.
针对在低信噪比环境下语音增强对语音识别率的提升不明显的问题,提出一种用在识别系统前端的麦克风阵列增强算法。该阵列增强算法基于相干滤波和频率带宽波束形成后置改进维纳滤波器。首先将采集到的阵列信号,求相邻通道间的相关函数,利用阵元间信号的相关性进行初始噪声抑制,然后利用频域宽带最小方差无畸变响应(MVDR)通过对目标声源信息的获取,保留目标声源方向的信号并抑制其他方向的信号干扰,再通过改进的维纳滤波器去除噪声残留提升语音可懂度,最后用梅尔频率倒谱系数(MFCC)和隐马尔科夫模型(HMM)对增强后的语音信号做特征提取并识别。仿真过程模仿双耳采集数据,结果表明该语音增强方法在低信噪比环境下获得较好的增强效果,能有效的提高低信噪比环境下的语音识别率。  相似文献   

3.
基于语音信号与心电信号的多模态情感识别   总被引:1,自引:0,他引:1  
通过采集与分析语音信号和心电信号,研究了相应的情感特征与融合算法.首先,通过噪声刺激和观看影视片段的方式分别诱发烦躁情感和喜悦情感,并采集了相应情感状态下的语音信号和心电信号.然后,提取韵律、音质特征和心率变异性特征分别作为语音信号和心电信号的情感特征.最后,利用加权融合和特征空间变换的方法分别对判决层和特征层进行融合,并比较了这2种融合算法在语音信号与心电信号融合情感识别中的性能.实验结果表明:在相同测试条件下,基于心电信号和基于语音信号的单模态情感分类器获得的平均识别率分别为71%和80%;通过特征层融合,多模态分类器的识别率则达到90%以上;特征层融合算法的平均识别率高于判决层融合算法.因此,依据语音信号、心电信号等不同来源的情感特征可以构建出可靠的情感识别系统.  相似文献   

4.
语音识别系统的识别率十分依赖基于Hidden Markov Models(HMM)模型的训练技术.然而,经典的训练算法(Baum-Welch算法)有一个致命的缺陷,即所得最终解依赖于初始值的选取,只得局部最优解,这就影响了系统的最终识别率.针对传统语音识别系统识别率较低的现状,提出了一种改进的小波变换HMM语音识别算法.该算法首先通过小波变换对原始语音信号进行了降噪处理,然后使用语音样本对利用遗传算法改进后的HMM模型进行训练,并用于语音识别.实验结果表明:所提出的算法实用有效,识别率显著提高.  相似文献   

5.
为提高语音识别系统在噪音情况下的识别率,提出了一种融合信号级去噪、参数级去噪、模型级去噪的方法.首先用谱减法对带噪的语音信号进行去噪,再利用Mel倒谱系数(MFCC)对处理后的语音信号进行特征提取,最后经过并行模型结合处理法(PMC)处理得到较高识别率的语音信号.  相似文献   

6.
汽车噪声中自动语音的识别技术   总被引:6,自引:0,他引:6  
汽车中的话音拨号系统是自动语音识别技术的应用热点.自动语音识别系统是一个基于训练的系统.在汽车噪声中,由于实际应用环境与形成系统参数的训练环境的失配,传统语音识别系统的性能会大幅度地下降,从而无法实用.为了提高语音识别系统在特定环境下的识别率及实用性,首先根据汽车环境中语音的失真模型分析了系统性能下降的原因,然后针对加性汽车噪声与信道失真对系统的影响,讨论了在汽车噪声中改善语音识别系统性能的方法.提出了在识别系统中用基于子带的语音增强算法和倒谱均值相减算法相结合的方法.对大量的多人连续数字串语音的识别实验表明,这一方法大大提高了系统在汽车噪声环境中的识别率,它还可以简便、实时的实现,具有一定的实用性.  相似文献   

7.
针对噪声环境下语音识别系统性能下降的问题,提出一种基于语音时频相关性的Mel特征矢量聚类补偿算法。该算法首先实现掩码估计,利用纯净语音信号时域和频域的相关性,实现了时频块的有效划分和基于时频块的语音特征聚类。在此基础上,对带噪语音的Mel语谱进行特征补偿。采用HTK工具和TIDIGITS数据库加入不同类别噪声的语音测试结果表明:该算法在不同信噪比条件下,获得了较基于频域相关性聚类特征补偿算法更好的性能。  相似文献   

8.
噪声鲁棒性问题是当前语音识别的一个重点,作者提出了一个在已有数据库下通过人为地将噪声和语音信号混合的方法,实现实际环境下的连续英文数字语音识别系统.即通过自设计的程序将采集到的噪声文本根据不同的信噪比随机地添加到现有的语音数据库的语音文本中,使新的数据库中的语音文本符合实际的语音环境.实验结果表明,本系统对带噪声环境下的英文数字的识别率效果好,单词的总体正确识别率达到95.86%.  相似文献   

9.
为提高卷积环境下语音识别系统的鲁棒性,提出了一种基于时/频ICA(independent component analysis)的卷积噪声模型估计方法.所提算法首先使用ICA方法从含噪语音信号中提取纯净语音信号的短时功率谱,然后在MEL滤波器组域内将含噪语音的短时谱减去纯净语音的短时谱,并根据去噪后卷积噪声的短时谱估算其HMM(hidden markov model)模型.在仿真和真实环境下进行了语音识别实验,其识别正确率相比较传统的卷积噪声估计方法分别提升了4.70%和4.75%.实验结果表明,论文所提算法能够实现对卷积噪声的精确估计,并有效提升卷积噪声环境下语音识别系统的性能.  相似文献   

10.
语音去噪技术是语音识别系统走向实用化的一个关键性难题.针对语音信号为非平稳信号的特点,提出了一种基于EEMD和ICA相结合的语音去噪方法,首先利用集合经验模态分解(EEMD)算法将含噪语音信号分解为若干个独立的固有模态函数(IMF),消除了经验模态分解(EMD)算法处理语音信号时产生的模态混迭现象;然后将固有模态函数通过改进的独立分量分析(ICA)算法分离出若干个有效的语音信号分量;最后对其进行语音重构,从而达到消除噪声干扰的目的.实验结果表明,该方法在输入信噪比为-10dB的汽车噪声条件下,可以将语音信号的信噪比提高到2.741 2 dB.  相似文献   

11.
作者在分析小波变换时频局部化特性的基础上,选取样条小波函数对语音信号进行处理,给出了基于小波变换极大模的基音周期检测方法和实验结果。  相似文献   

12.
利用正弦信号和Chirp信号分别在频域、分数阶傅立叶域的优良能量聚集特性,设计一种频带复用的通信系统。该系统在相同频带内同时传输多路分别以Chirp信号和余弦信号为载波的BPSK信号,通过在接收端进行相应阶分数阶傅立叶域变换,使Chirp信号达到最优能量聚集,进而通过分数域滤波将集中于某一窄带内的Chirp信号滤出,再反变换到时域完成解调过程。仿真分析表明,该方法可获得有较好的误码率性能。  相似文献   

13.
自动语音切分是语音识别、声纹识别、语音降噪等语音应用中非常重要的预处理环节,切分算法的优劣直接影响了系统输出结果的精度.在空管地空通话中,传输信道噪声、天气因素以及说话人工作状态均会对语音信号产生影响,进而在一定程度上影响语音切分性能.在分析空管地空通话语音特性基础上,提出了一种基于CGRU网络多输入特征的自动语音切分方法.该方法结合地空通话的特点,采用深度学习的方法进一步提取语音信号的时域和频域非线性特征,将语音信号帧分类为语音帧、结束帧以及其他帧三类.实验对比了多种语音特征作为输入对切分效果的影响,同时验证了GMM、CNN、CLDNN、CGRU等切分算法在真实地空通话测试集上的表现,并提出了一种简单预测结果平滑算法.实验结果表明,文中提出的自动切分方法在地空通话中具有明显优势,分类模型的AUC值达到了0.98.  相似文献   

14.
基于小波变换的语音基音周期检测   总被引:5,自引:2,他引:5  
本文根据语音信号在声门闭合时刻(GCI)的锐变特性,利用小波变换的时频局部化性质,构造了一个基音检测系统.通过使用不同的压扩因子,根据语音信号小波变换的局部最大值的位置,确定出对应的语音信号的锐变时刻(即GCI),而相邻两个GCI的间隔即为基音周期.本方法具有准确性高、抗嗓声性能好、检测范围宽、动态性能好等传统方法所不具备的特点.  相似文献   

15.
提出改进的倍频程小波过零刺激方案(WZCS),以改善电子耳蜗语音编码策略的性能.在语音信号倍频程小波变换域的过零点通过幅度调制合成刺激脉冲,并基于Matlab对该算法和连续间隔采样(CIS)、通道专用采样序列(CSSS)、频率幅度联合调制编码(FAME)等编码策略进行仿真,将合成信号与原始语音、合成信号频谱与原始语音频谱进行了相关性分析.仿真结果表明,WZCS算法合成信号的频谱与原始语音信号的频谱相关系数最大,WZCS算法合成信号频谱与原始语音最为相关,且相关显著,即与其他算法相比其保留了原始语音信号的更多频率和相位成分.  相似文献   

16.
大多数去混响的算法都是基于短时分析,不可避免地带来了截断效应;如果对混响语音进行逆滤波,则要求房间冲激响应满足最小相位.本文提出了一种针对单通道的语音长时分帧的去混响算法.算法采用长时帧分析,有效减小了截断效应的影响.首先对混响语音信号进行长时分帧计算其最小相位分量倒谱,然后根据纯净语音和房间冲激响应倒谱的不同分布,在倒谱域阻带滤波得到去混响语音最小相位分量的估计,根据最小相位倒谱理论,进而可以估计出去混响语音频域的模,最后利用人耳对相位信息的不敏感性,用估计的去混响语音的模和混响语音的相位合成,傅里叶反变换得到去混响语音时域波形.实验表明,该算法有良好的去混响效果.  相似文献   

17.
考虑到传统单通道语音增强算法对噪声抑制的局限性,本文采用由两个微型麦克风阵列组成的双微阵列,利用该阵列空间结构的时空域特性对含噪语音进行处理,提出了一种适用于双微阵列的语音增强算法。该增强算法是将各通道采集到的带噪语音信号先使用对数最小均方误差(Logarithmic Minimunm Mean Square Error,LogMMSE)提升其信噪比,然后利用频域宽带最小方差无畸变响应(MVDR)通过对目标声源信号的获取,保留目标声源方向的信号并抑制其他方向的信号干扰,最后通过一个改进可懂度结合改进最小控制递归平均(Improved Minimum Controlled Recursive Average Algorithm,IMCRA)噪声估计的维纳滤波器来去除噪声残留提升语音质量。仿真实验结果表明,相比传统的单通道语音增强算法,该算法具有良好的噪声抑制性能。  相似文献   

18.
研究了小波包变换在声音编码中的应用,通过利用小波包变换在时域和频域都具有良好局部性的特点,提出了一种新的中低码率混合域声音编码算法。这是一种可调码率算法,它根据输入信号段的特性来进行变换和编码,使得编码过程可以同时在时域、频域以及从时域向频域过渡的任一时频域中进行,从而使编码算法不仅在量化编码阶段,而且在变换阶段就对输入信号具有自适应性。其编码效果比在单一固定时频域中进行变换与编码有较大改善,有助于和高码率的声音编码算法相接轨。  相似文献   

19.
为了提高跨模态人脸表示与合成的性能,针对语音与人脸图像2种模态数据,提出一种基于人脸参数化表示与稠密深度网络相结合的面部生成方法。针对输入语音模态,通过对信号进行频谱变换,将一维时域信号转换到二维频率域,可提取频域上稳健的特征描述;针对输出图像模态,利用主动外观模型对不同面部区域独立建模以降低区域间的相关性,并提取紧凑的人脸参数化特征;为了获得有效的跨模态学习性能,提出采用稠密连接的深度卷积神经网络学习语音、图像2种模态的回归预测,并通过预测的人脸参数进行面部重构,所采用的深度网络模型可以加强特征传播与特征复用,有利于增强面部细节的合成。在2组音视频数据集上验证了提出方法的有效性。  相似文献   

20.
对录制的语音信号进行采样,分析其时域波形和频谱图。给定数字滤波器的性能指标,采用窗函数法和双线性变换法设计数字滤波器,并对语音信号进行滤波,得到滤波前后的信号幅频响应。通过对比两种滤波处理结果,简单而有效地论证了两种数字滤波器在语音信号处理上的优势。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号