首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
语音信号时间动态规正新方法   总被引:5,自引:0,他引:5  
利用函数逼近原理,提出了一种语音信号时间动态规正的新方法,并由此导出了可用于神经网络语音识别的新特征。重点讨论了时间动态规正的原理、新特征的提取方法和性质。实验及理论分析表明,新特征对于神经网络语音识别及语音压缩具有很好的效果。  相似文献   

2.
为提高语音增强算法消除方向性噪声和抑制混响的能力,结合单、多通道处理信号的优势,提出了双通道神经网络时频掩蔽语音增强算法.首先,利用改进的多分辨率耳蜗动静态特征,结合依据信噪比优化的自适应掩模,对双麦克风信号分别进行单通道神经网络初步语音增强,达到全面利用语音非线性特征改善感知度的目的;其次,提出一种基于自适应掩模方向...  相似文献   

3.
一种时间规整算法在神经网络语音识别中的应用   总被引:6,自引:0,他引:6  
提出一种新的网络结构,这种网络能够很好地解决神经网络语音识别中的时间规整问题。该网络从输入语音信号的特征矢量序列中提取一组固定数目的特征矢量,然后将这组特征矢量馈入神经网络分类器进行识别。和其他的神经网络语音识别方法相比较,用这种网络进行前端处理,可以缩短后端神经网络分类器的训练和识别时间,简化分类器的网络结构并保持较高的识别率。  相似文献   

4.
根据声道模型与AR模型的对应关系,提出一种可用于神经网络语音识别的新特征———语音信号的全局时频特征,从整体上描述LPC倒谱系数的变化规律.其特点是:(1)特征长度固定,为传统的静态神经网络应用于语音识别创造了良好条件;(2)与其他语音识别系统所用的神经网络相比,新特征极大地降低了神经网络的规模及训练时间;(3)基于新特征的系统的识别性能明显优于传统的HMM方法及GMDS算法.  相似文献   

5.
语音情感识别是实现自然人机交互的重要组成部分,传统语音情感识别系统主要集中于特征提取和模型构建.本文提出一种将深度神经网络直接应用于原始信号的语音情感识别方法.原始语音数据携带了语音信号的情感信息、二维空间信息和时序上下文信息.建立的模型以端到端的方式进行训练,网络自动学习原始语音信号的特征表示,无需手工特征提取步骤....  相似文献   

6.
采用径向基函数神经网络在时域上对含噪语音信号进行降噪处理.针对语音信号的短时平稳性以及噪声的随机性,对语音信号进行分帧预处理;用分帧后的纯净语音信号作为径向基函数网络的教师信号,并利用Matlab神经网络工具箱设计和训练网络.实验结果表明,径向基函数网络作为语音信号滤波器,可有效地抑制语音信号中的白噪声,具有良好的降噪性能.  相似文献   

7.
提出了一种用神经网络模型和信号子空间特征分解相结合进行语音增强的方法,该方法利用了神经网络并行处理、高速计算的能力和语音信号的短时平稳的特性.它既克服了传统的谱相减法中残留“音乐噪声”的缺陷,又可以实时、有效地增强语音,能够满足一些语音处理与识别系统的需要.  相似文献   

8.
应用倒谱特征的带噪语音端点检测方法   总被引:7,自引:0,他引:7  
传统的语音端点检测方法以信号的短时能量、过零率等简单特征为判决特征参数。这些方法在实际应用中,尤其当信号噪比比较低时,无法满足系统的需要。文中利用语音信号的倒谱特征作为判决抽样信号帧是否为语音信号的依据,并提出了倒谱距离测量法和循环神经网络法,通过对宽带噪声-白噪声干扰情况和一种特殊噪声-汽车噪声情况的实验,发现倒谱特征参数的语音信号端点检测方法在噪声环境下具有传统的能量方法无法比拟的优越性,更适  相似文献   

9.
语音信号是受说话人、环境等因素影响的复杂函数,人工神经网络(ANN)模型进行语音识别具有自适应、自组织及联想等特征,适合用于语音识别。主要研究了传统BP神经网络在实际语音识别中的改进方案。利用改进后的方案实现语音识别、网络结构简化、运算速度加快、训练时间缩短。  相似文献   

10.
传统的语音端点检测方法以信号的短时能量、过零率等简单特征作为判决特征参数.这些方法在实际应用中,尤其当信号信噪比比较低时,无法满足系统的需要.文中利用语音信号的倒谱特征作为判决抽样信号帧是否为语音信号的依据,并提出了倒谱距离测量法和循环神经网络法.通过对宽带噪声-白噪声干扰情况和一种特殊噪声——汽车噪声情况的实验,发现倒谱特征参数的语音信号端点检测方法在噪声环境下具有传统的能量方法无法比拟的优越性,更适合于实际应用.  相似文献   

11.
基于混沌神经网络的语音识别方法   总被引:4,自引:0,他引:4  
基于语音信号的时变特性,研究了神经网络语音识别的方法.把混沌特性引入到神经元,构造了一种新的多层混沌神经网络结构,同时推导了相应的学习算法.把这种混沌神经网络用于语音识别,并与常用的神经网络语音识别方法作了比较.实验结果表明,混沌神经网络方法的平均识别率要高于同等条件下常用神经网络方法的识别率.  相似文献   

12.
根据语音信号的“可视”特点,提出了一种基于简化脉冲耦合神经网络(PCNN)实现孤立词语音识别的方法。将语谱图输入到PCNN中得到相应的时间序列标识,作为语音信号的特征参数,然后通过模板匹配法和概率神经网络(PNN)相结合的方法实现语音分类识别。仿真结果表明,该方法能够达到较高的语音识别率。  相似文献   

13.
语音情感识别是人机交互的重要方向,可广泛应用于人机交互和呼叫中心等领域,有很大应用价值。近年来,深度神经网络在识别情感方面取得了巨大成功,但现有方法对高层语音特征提取会丢失大量原始信息并且识别准确率不高,本文提出了一种新的语音情感识别方法,由卷积神经网络从原始信号中提取特征,并在其堆叠一个2层长短时记忆神经网络,最终识别准确率达到91.74%,本文方法显著优于基于EMO-DB数据集等其他方法。  相似文献   

14.
针对基于字典学习语音分离方法的“交叉投影”问题,提出了强约束的优化函数,不仅抑制重构信号和目标信号的误差,约束干净信号在联合字典上的误差,而且抑制干净信号在其他字典上的投影并限制字典间的原子相关性。此外,为了进一步提高两个相似信号的分离效果,提出基于强约束字典联合深度神经网络的单通道语音分离方法,首先利用强约束字典实现目标与干扰语音的初步分离,然后通过联合约束利用深度神经网络实现语音与干扰语音交叉投影残余的分离。实验结果表明,与其他优秀单通道语音分离方法相比,该算法有效提升了语音分离系统的性能。  相似文献   

15.
基于BPNN/HMM神经网络的声学模型研究   总被引:1,自引:0,他引:1  
研制了一种基于BP神经网络和隐马尔可夫模型(HMM)的混合声学模型,BP神经网络的主要功能是把失真语音特征矢量转换成纯净语音特征矢量,而删则对转换后的纯净语音特征矢量进行分类,从模型级补偿的方面来提高语音识别系统的鲁棒性.讨论了一种基于线性预测的MKCC语音特征提取方法,该方法把提取出的失真语音特征矢量作为神经网络的输入,从而实现了特征参数级去噪处理的目的.  相似文献   

16.
 由于说话人的语音信号具有时变性、随机性,其特征参数也呈现出高维及相邻帧变化较大等特点。从量子信息处理理论出发,将一帧语音信号视为一个量子态,在传统神经网络的基础上,利用量子逻辑线路构造神经网络,实现说话人语音信号的有效聚类,探索一种基于量子逻辑线路神经网络的说话人识别模型与方法。利用模型固有的大量全局吸引子,可有效降低语音信号处理的时间及复杂度。通过在经典计算机上模拟仿真,并与BP神经网络说话人识别模型进行对比,表明该方法能够加快说话人识别模型的收敛速率,对参数变化具有更好的鲁棒性,且其系统识别率比BP神经网络方法平均提高了3.34%。  相似文献   

17.
为了进一步提高基于深度神经网络的语音增强方法的性能,针对单独使用卷积神经网络难以对含噪语音中的长期依赖关系进行建模的问题,提出一种基于卷积门控循环神经网络的语音增强方法.该方法首先采用卷积神经网络提取含噪语音中的局部特征,然后采用门控循环神经网络将含噪语音中不同时间段的局部特征进行关联,通过结合两种网络的不同特性,在语音增强中更好地利用含噪语音中的上下文信息.实验结果表明:该方法能够有效提高未知噪声条件下的语音增强性能,增强后的语音具有更好的语音质量和可懂度.  相似文献   

18.
为解决使用语音信号准确识别动物以保护和研究野生动物的问题,提出一种全连接算法与稀疏连接算法相结合的全卷积神经网络(FCNN: Fully Convolutional Neural Network),用于语音的自动识别.利用全连接算法提取更多的组合特征,稀疏连接算法筛选重要特征可加快收敛速度.同时给出了具体的模型结构及算...  相似文献   

19.
LM算法在神经网络语音识别中的应用   总被引:1,自引:1,他引:0  
孙峰 《科学技术与工程》2011,11(9):2021-2024,2033
输入语音信号中声音的特征提取和分类识别可以通过多层前馈神经网络大量学习实现,但基于误差反向传播的前馈神经网络(BP神经网络)标准算法收敛速度慢,在训练中效率不高。采用一种快速稳定的Levenberg-Marquardt算法进行语音识别,通过对语音信号的预处理、特征提取和网络结果优化,建立了网络训练样本集,用MATLAB进行了仿真,仿真结果表明,该算法优于传统的BP算法,具有更好的收敛性。  相似文献   

20.
混合蛙跳算法神经网络及其在语音情感识别中的应用   总被引:3,自引:1,他引:2  
该文将混合蛙跳算法(SELA)优化方法应用于人工神经网络训练中,对6种语音情感进行了语音情感特征的分析与识别。研究了谐波噪声比特征随情感类别的变化特性。利用混合蛙跳算法训练随机产生的初始数据优化神经网络的连接权值,快速实现了网络收敛。实验比较了BP神经网络、RBF神经网络和SFLA神经网络的语音情感识别性能。结果表明,SFLA神经网络的平均识别率分别高于BP神经网络和RBF神经网络4.7%和4.3%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号