首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 78 毫秒
1.
为了解决语音识别中由网络加深导致的低层特征消失、参数量大及网络训练困难的问题,基于Inception V3网络的非对称卷积思想,提出了一种改进的密集连接卷积神经网络(densely connected convolutional neural networks, DenseNet)模型。根据语音识别的长时相关性,通过密集连接块建立起不同层之间的连接关系,从而保存低层特征、加强特征传播;为了得到尺度更丰富的声学特征,将卷积核的范围进行扩大;利用非对称卷积思想分解卷积核,以减少参数量。实验结果表明,相较经典深度残差卷积神经网络模型和原始DenseNet模型,提出的模型在THCHS30数据集上的语音识别性能更好,在保证识别率的情况下,还减少了网络参数量,提高了模型训练效率。  相似文献   

2.
为了提高人工神经网络处理动态信号能力 ,在时延神经网络 ( TDNN )和卷积神经网络 ( CNN)的基础上 ,针对孤立音节的特点 ,提出了一个新的网络结构 ,研究了其学习算法。新网络在进一步改进后用于汉语孤立数码语音识别 ,对特定人和非特定人任务 ,分别达到了 97.7%和 95 .6%的正确识别率 (无拒识 ) ,其性能远远高于多层前向感知机( ML P)和时延神经网络 ,与传统的隐马尔科夫模型 ( HMM)方法是可以相比的。  相似文献   

3.
论述了基于神经网络模型的特定人汉语语音识别,并建立了一基于3层BP神经网络的汉语语音识别系统,对汉语10个数字(1 ̄10)进行识别实验,获得了较满意的识别结果。  相似文献   

4.
研究一种基于神经网络的端到端中文语音识别算法.算法将语音信息处理为频谱图,基于频谱图,设计和实现一种基于卷积神经网络和循环神经网络的深度学习模型结构用于中文语音识别.模型以汉字作为标签样本,运用训练算法和序列损失函数进行模型迭代训练最终模型;采用开源数据集,通过实验验证网络结构对识别效果的影响,同时对比传统的语音识别算...  相似文献   

5.
针对语音情感识别过程中特征不充分的问题,提出了约束式双通道模型,从全局和局部两方面充分挖掘特征所包含的情感信息,从而提高情感识别率.通道1是针对语音特征的全局信息,通过改进门控循环单元,构建了BAGRU(bidirectional attention gate recurrent unit)模型,提高了语音特征之间的相关性;通道2是针对语音特征的局部信息,卷积神经网络与对抗训练结合,避免了局部信息相互干扰.通过双通道融合模型,根据通道特征重要程度生成不同权重,同时引入正交约束,解决了融合时产生特征冗余的问题.研究结果表明,在IEMOCAP和EMO-DB情感语料库上分别达到了62.83%和82.19%的识别精度,表现出了良好性能.  相似文献   

6.
一种时间规整算法在神经网络语音识别中的应用   总被引:6,自引:0,他引:6  
提出一种新的网络结构,这种网络能够很好地解决神经网络语音识别中的时间规整问题。该网络从输入语音信号的特征矢量序列中提取一组固定数目的特征矢量,然后将这组特征矢量馈入神经网络分类器进行识别。和其他的神经网络语音识别方法相比较,用这种网络进行前端处理,可以缩短后端神经网络分类器的训练和识别时间,简化分类器的网络结构并保持较高的识别率。  相似文献   

7.
基于覆盖的神经网络集成在语音识别中的应用   总被引:3,自引:0,他引:3  
神经网络集成通过训练多个神经网络并将各网络的结论进行合成,从而得到最终结果.集成可以显著的提高学习系统的泛化能力.讨论了基于覆盖思想而设计的神经网络集成方法,并将其应用于汉语孤立数码语音识别系统中,通过在集成过程中加入基于覆盖思想的控制算法降低系统的泛化误差,从而使系统的识别效果有了进一步的提高.  相似文献   

8.
提出了一种新颖的语音情感识别结构,从声音文件中提取梅尔频率倒谱系数(Melscale frequency cepstral coefficients,MFCCs)、线性预测倒谱系数(linear predictive cepstral coefficients,LPCCs)、色度图、梅尔尺度频谱图、Tonnetz表示和频谱对比度特征,并将其作为一维卷积神经网络(convolutional neural network,CNN)的输入.构建由一维卷积层、Dropout层、批标准化层、权重池化层、全连接层和激活层组成的网络,并使用Ryerson情感说话/歌唱视听(Ryerson audio-visual database of emotional speech and song,RAVDESS)数据集、柏林语音数据集(Berlin emotional database,EMO-DB)、交互式情绪二元运动捕捉(interactive emotional dyadic motion capture,IEMOCAP)数据集这3个数据集的样本来识别情感.为提高分类精度,利用增量方法修改初始模型.为...  相似文献   

9.
语音情感识别是人机交互的重要方向,可广泛应用于人机交互和呼叫中心等领域,有很大应用价值。近年来,深度神经网络在识别情感方面取得了巨大成功,但现有方法对高层语音特征提取会丢失大量原始信息并且识别准确率不高,本文提出了一种新的语音情感识别方法,由卷积神经网络从原始信号中提取特征,并在其堆叠一个2层长短时记忆神经网络,最终识别准确率达到91.74%,本文方法显著优于基于EMO-DB数据集等其他方法。  相似文献   

10.
孙峰 《科学技术与工程》2011,11(9):2021-2024,2033
输入语音信号中声音的特征提取和分类识别可以通过多层前馈神经网络大量学习实现,但基于误差反向传播的前馈神经网络(BP神经网络)标准算法收敛速度慢,在训练中效率不高。采用一种快速稳定的Levenberg-Marquardt算法进行语音识别,通过对语音信号的预处理、特征提取和网络结果优化,建立了网络训练样本集,用MATLAB进行了仿真,仿真结果表明,该算法优于传统的BP算法,具有更好的收敛性。  相似文献   

11.
深度学习通过建立深层神经网络来模拟人脑进行分析、学习和解释数据,被广泛用于图像识别领域.首先,简述了深度学习在图像识别中的研究现状;其次,介绍了卷积神经网络、深度置信网络、循环神经网络和生成对抗网络等几种常用于图像识别领域的深度学习网络模型;然后,从人脸识别、动作识别、跌倒检测等方面,论述了深度学习在图像识别领域的典型应用;最后,探讨了该领域的研究难点及发展前景.深度学习可以从不同的图像中自动提取相似的特征并进行分类,识别率高,鲁棒性强,推动了人工智能背景下图像识别的发展.无监督学习、对抗网络等将成为深度学习领域的热点.  相似文献   

12.
IntroductionIn recentyears,speech recognition has made greatprogress.Commercial systems such as Via Voice( IBM Company) and Naturally Speaking 1 .0( Dragon System Company ) lead the field.Although the recognition ratio has greatlyimproved,many issues still need further research,such as,real- time in processing,systemcomplexity[4 6] ,very large scale integrated circuit( VLSI) implementation,etc.Among these issues,the implementation in VLSI is the most criticalchallenge for wide use of s…  相似文献   

13.
针对传统的RBF网络求取隐层基函数中心的K-均值聚类算法的缺点,利用文化算法的全局搜索性能,将文化算法用于语音识别系统的RBF网络的训练过程中,基于实验数据,指出该方法的识别结果较k-均值聚类算法有了明显的改善。  相似文献   

14.
混合蛙跳算法神经网络及其在语音情感识别中的应用   总被引:3,自引:1,他引:2  
该文将混合蛙跳算法(SELA)优化方法应用于人工神经网络训练中,对6种语音情感进行了语音情感特征的分析与识别。研究了谐波噪声比特征随情感类别的变化特性。利用混合蛙跳算法训练随机产生的初始数据优化神经网络的连接权值,快速实现了网络收敛。实验比较了BP神经网络、RBF神经网络和SFLA神经网络的语音情感识别性能。结果表明,SFLA神经网络的平均识别率分别高于BP神经网络和RBF神经网络4.7%和4.3%。  相似文献   

15.
在传统的HMM语音识别方法的基础上,提出了两种改进的竞争神经网络算法,分别用于语音识别的两个不同方面.首先提出了一种基于选择机制的新的竞争算法,这种算法可以有目的性地避免局部最优,而且可以克服模拟退火算法(SA)的随机性.然后,针对分类器的特性,对竞争算法进行改进,把安全拒识措施结合到竞争算法中,提出了一种新颖的神经网络——并行、自组织、层次神经网(PSHNN).实验结果表明,基于竞争神经网络算法的语音识别系统比传统的语音识别系统在识别能力和识别速度上都有明显提高,从而证明了与竞争神经网络算法结合的语音识别方法是可行的,而且具有良好的发展和应用前景.  相似文献   

16.
语音识别中HMM与自组织神经网络结合的混合模型   总被引:9,自引:0,他引:9  
基于隐马尔可夫模型和自组织神经网络模型提出了一种用于语音识别的混合模型,给出了训练调整权向量的算法,实验结果表明其在语音识别中具有很好的性能·  相似文献   

17.
为了提升变电站巡检机器人对自身所处环境的理解能力,将深度学习技术应用于变电站巡检机器人对道路场景的识别中,提出了一种全卷积道路场景识别网络(road scene recognition net,RSRNet)。该网络主要由相对浅层的编码网络和镜像结构与跳层融合结构相结合的解码网络组成,通过编码网络提取图像特征后由解码网络识别出图像目标信息。通过实验表明,本文提出的网络在同类型网络中识别精度及效率更高,同时在实际变电站场景中也表现出了优良的场景识别性能。  相似文献   

18.
基于混沌神经网络的语音识别方法   总被引:4,自引:0,他引:4  
基于语音信号的时变特性,研究了神经网络语音识别的方法.把混沌特性引入到神经元,构造了一种新的多层混沌神经网络结构,同时推导了相应的学习算法.把这种混沌神经网络用于语音识别,并与常用的神经网络语音识别方法作了比较.实验结果表明,混沌神经网络方法的平均识别率要高于同等条件下常用神经网络方法的识别率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号