首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
针对连接时序分类模型需具有输出独立性的假设,对语言模型的依赖性强且训练周期长的问题,提出一种基于连接时序分类模型的语音识别方法.首先,基于传统声学模型的框架,利用先验知识训练基于注意力机制的语谱图特征提取网络,有效提高了语音特征的区分性和鲁棒性;其次,将语谱图特征提取网络拼接在连接时序分类模型的前端,并减少模型中循环神经网络层数进行重新训练.测试分析结果表明,该改进模型缩短了训练时间,有效提升了语音识别准确率.  相似文献   

2.
通过提出一种多路融合卷积神经网络(multi-mixed convolutional neural network,MMCNN)对网购商品评论数据进行文本情感分类。采用skip-gram模型进行词向量的训练,并用训练好的向量表示评论数据。针对评论数据长短不一的情况,提出了循环词向量填充和随机词向量填充算法,有助于提升模型分类的准确率。针对传统卷积神经网络特征提取方式单一的问题,将多路卷积特征和池化特征在全连接层进行了特征融合,以此提升网络的文本分类效果。选择京东网站上45 000条婴儿奶粉的评论数据进行试验,并与支持向量机、最大熵模型、朴素贝叶斯等传统机器学习方法以及经典卷积神经网络方法进行对比。试验结果表明,提出的多路融合卷积神经网络具有较高的分类正确率。  相似文献   

3.
[目的]针对健康肉与病害肉的快速鉴别问题,本文对健康与病害肉的表面拉曼谱图的特征信息提取和分类方法进行研究,以实现对健康肉与病害肉的快速鉴别.[方法]以羊肉的表面增强拉曼谱图为样本,分别采用主成分分析-支持向量机和卷积神经网络两种方法进行分类.通过提取谱图的精细化特征,实现谱图数据的降维和干扰信息的过滤,为分类模型提供更加准确和丰富的特征信息.并以240份包含健康与病害羊肉的拉曼谱图为训练集样本,建立了分类模型,以另外的120份样本进行健康与病害肉的辨别效果验证.[结果]实验表明经过精细化特征提取后构建的主成分分析-支持向量机模型能清晰的找到健康与病害肉的分类边界,验证样本的识别准确率从82.5%上升到93.3%,同时使用卷积神经网络对精细化提取的特征进行学习与分类,识别准确率从常规方法的90.2%上升到95.5%.[结论]本文提出的基于表面增强拉曼的肉类谱图的精细化特征信息提取和分类方法能够有效实现对羊肉样品中健康肉与病害肉的快速分类和鉴别,该方法同样可以应用于其他肉类的检测分类,对保障食品安全具有重要的意义.  相似文献   

4.
为解决标记样本缺乏、提升分类精度及增强模型容错性等问题,提出一种基于辅助分类器生成对抗网络(ACGAN)的分类方法.首先,将预训练的ACGAN模型作为光谱特征提取器,采用局部二值模式(LBP)算法提取图像的纹理特征;然后,融合光谱特征和纹理特征,由卷积神经网络(CNN)进行分类.在2个广泛使用的数据集上进行实验,结果表明:相较于其他方法,文中方法可显著提高分类精度.  相似文献   

5.
基于多波束对长江河道底质分类关键问题进行了研究,对多波束反射强度数据进行改正并对多波束声呐图像进行预处理,采用灰度共生矩阵对底质反向散射强度图像进行纹理特征提取,最后将提取底质图像样本作为自组织特征映射神经网络和随机森林两种分类方法的训练数据,使用训练好的预测分类模型对反向散射强度图像进行全图底质分类.实验结果表明,SOM与随机森林分类方法的总体分类精度分别达到了82.5%与85.4%,对底质声呐图像实现了较好的预测分类效果.  相似文献   

6.
提出了一种基于卷积循环神经网络的文本特征提取方法,同时对比使用统计学中的TF-IDF以及Word2vec方法的文本特征表示,将提取的特征分别放入SVM与随机森林分类器中对来源于中国知网的中文学术论文数据集进行分类。实验结果表明,使用卷积神经网络和卷积循环神经网络特征提取模型提取的特征所取得的分类效果比TF-IDF、Word2vec特征提取方法得到的分类效果更好,同时使用SVM和随机森林分类器取得的分类效果略好于原生的神经网络。  相似文献   

7.
研究一种基于神经网络的端到端中文语音识别算法.算法将语音信息处理为频谱图,基于频谱图,设计和实现一种基于卷积神经网络和循环神经网络的深度学习模型结构用于中文语音识别.模型以汉字作为标签样本,运用训练算法和序列损失函数进行模型迭代训练最终模型;采用开源数据集,通过实验验证网络结构对识别效果的影响,同时对比传统的语音识别算...  相似文献   

8.
针对在构建深度学习模型过程中,神经网络隐藏层的层数和每层神经元节点数主要通过人工专家的主观经验设置,深度学习模型智能化不够、适应性不强的问题,提出了一种应用于网络入侵检测的自适应、智能化的深度学习特征提取方法.该方法采用逐层贪婪训练的策略,通过改进稀疏自编码神经网络训练的方式,形成了一个自适应、智能化的特征提取神经网络...  相似文献   

9.
针对现有的网络攻击检测方法检测精度不高的问题,提出一种基于并行卷积神经网络的在线网络安全攻击检测方法.该并行的深度卷积神经网络一共包含2个深度卷积神经网络用于提取特征:CNN1和CNN2,然后通过全连接层两个特征提取层,并通过软最大化操作将网络攻击的检测转换为攻击的分类模型.采用KDD Cup99作为仿真数据集,并采用训练数据来对深度模型进行训练,当模型的训练误差小于一定阈值时,采用测试数据进行测试.结果表明:将本文所提方法与文献[8]以及文献[9]所提的卷积神经网络进行比较,其结果表明了所提方法不仅具有较高的检测准确率而且具有较低的误报率上.  相似文献   

10.
为解决传统音乐情感分类特征单一,导致训练效果差的问题,提出了一种多模态注意力融合网络模型,首先将执行情感分类使用的歌词和音频分离,将上下文特征提取方法与分类器相结合,从而提高特征提取效率;其次通过注意机制融合多模态特征,从而加快模型训练效率及情感分类准确率;接着提出了一种自适应孤立森林噪声方法增强模型对不均衡样本的适应性,并在一定程度上缓解模型过拟合问题.最后,将模型与LSTM、GRU、BI-LSTM、BI-GRU等模型进行仿真比较,结果表明所提模型性能最优,情绪分类准确率可达96.46%.  相似文献   

11.
环境声音识别在音频检索、监控方面有着广泛的应用,是听觉识别任务中的一个热门研究领域。但由于其声音信号的复杂多变,使得该任务在识别率提升方面依然面临许多挑战。针对这一问题本文提出了基于改进卷积神经网络的环境识别模型(S-CNN),该模型采用反复堆叠的递减型卷积核提取不同尺度的局部特征,并在每层卷积层后采用Batch Normalization(BN)层对特征进行归一化操作。同时,利用动态衰减的学习率训练模型,以提高模型收敛速度与收敛稳定性。实验结果表明,相比于传统的机器学习与卷积神经网络模型,本文所设计的改进卷积神经网络模型S-CNN具有更好的识别率。在ESC-10环境声音数据库上,识别精度达到91.3%。  相似文献   

12.
基于改进型BP神经网络的音频多分类   总被引:1,自引:0,他引:1  
音频信号作为多媒体信息的重要载体之一, 为满足人们对信息知识的获取提供了有效途径.为了提高音频分类的精度,提出一种将音频信号的梅尔频率倒谱系数(Mel frequency cepstrum coefficient,MFCC)参数作为特征向量,采用基于改进型传输函数的误差反向传播神经(back propagation, BP)网络模型对6种音频进行分类.实验证明,该方法在音频分类精度方面性能良好,改进的传输函数具有收敛速度快的优点.相对于传统BP算法,该方法不仅缩短了训练时间,而且进一步提高了分类精度,其分类准确率达到90%以上.  相似文献   

13.
针对网络安全态势要素获取中大规模复杂攻击样本分类困难的问题,提出一种基于条件变分自编码网络的安全态势要素分类架构。该架构分为编码网络和生成网络两部分,均采用深度神经网络作为其基础框架。编码网络用于对高维数据进行降维,提取其隐含特征;生成网络用于对降维后的样本进行重构,生成新的样本。在生成网络中引入混合密度模型优化其特征提取能力,提高重构数据的准确性。采用训练数据对该架构进行训练,训练后的编码网络作为分类器,识别样本类型;生成网络生成指定类别的样本数据,以平衡复杂样本中各类攻击样本的数量,提高分类精度。仿真结果表明,与其他对比模型相比,所提分类架构具有较好的降维效果和较高的态势要素分类精度。  相似文献   

14.
基于遗传算法的神经网络指纹自动分类   总被引:9,自引:2,他引:7       下载免费PDF全文
研究指纹的自动分类问题对解决大容量指挥库的匹配实时性有着重要的意义。笔者提出了一种新的指纹自动分类方法。该方法通过求取指纹方向图抽取了指纹的纹形特征,并将其送入神经网络进行分类识别,网络连接权系数采用遗传算法进行学习寻优,克服了单纯BP算法训练时间长、易陷入局部极值的缺点,同时提高了网络全局收敛的效率。测试结果表明,基于遗传算法的多层前向神经网络分类器对指纹图象的分类有良好的性能。  相似文献   

15.
针对汽车尾气排放的非线性、时变性问题,提出一种三维谱特征下的汽车尾气评估方法。该方法利用频谱分析的原理对汽车尾气进行时频转换,得到尾气的三维谱特征。这些三维谱特征作为输入被提交给径向基神经网络,在K均值聚类算法的驱动下,径向基神经网络完成训练与测试,实现对三维谱特征的分类,从而评估相应的汽车尾气排放水平。数值实验结果表明,提出的汽车尾气评估方法具有较高的准确性。  相似文献   

16.
目的构造音乐情感分类器,为计算机理解情感提供途径。方法首先分析现有音乐情感模型,然后提取音乐情感特征并采用神经网络构造音乐情感分类器,最后采用相关反馈对分类结果进行标注并进一步训练分类器,直至训练样本的错误分类率在一定误差范围内。结果对测试样本进行情感分类,达到了最高89%的分类准确率,实现了音乐情感分类器的构建和音乐片断的情感标注。结论研究成果是音乐情感检索的基础工作,也可用于其他音频的情感识别和分类。  相似文献   

17.
现有的数字音频取证技术很难做到录音地点的识别,因此司法机关就不易对音频证据的有效性做出判断.针对现状,本文设计了一种基于BP神经网络的录音地点识别方法.该方法是将电网频率(ENF)作为识别根据.进行地点识别操作时,首先将电网ENF作为训练样本训练BP神经网络,然后从待取证的音频文件中提取电网频率数据并作为输入样本,用训练好的BP神经网络对输入样本进行识别,最后用模拟退火算法从识别结果中搜索出最佳识别结果,从而识别出录音的地点.实验结果表明,该方法的识别准确率最低达到90.6%,可靠性满足一定的要求.  相似文献   

18.
鞋印图像识别是计算机视觉在公安一线工作中的一项重要应用。当前公安侦查工作中鞋印图像无法进行精准识别的问题制约了工作效率与质量的提高,归纳起来主要是囿于鞋印现场提取的复杂情况、鞋印花纹图样的复杂特征以及鞋印图像的残缺不全。针对残缺鞋印,为了进一步提高残缺鞋印检索结果,设计了一种融合特征筛选的双塔网络鞋印检索算法。一方面,在网络中引入分区策略,将鞋印图像分为足掌区和足跟区用两个特征网络分别提取图像特征进行融合;另一方面,选择融合ResNet网络和Transformer网络的新型卷积神经网络convNeXt网络作为骨干网络,加入注意力机制模块,提取最后一层卷积特征后用不同的特征筛选方法去除鞋印图像中的无关特征,最后拼接展开成为特征描述符进行相似度计算。在训练阶段,优化学习策略,将其作为完整的图像分类网络进行训练。实验结果表明,本文选取的网络模型优于其他卷积神经网络,在CSS-200和FID-300两个鞋印数据集上取得了较高的准确率。  相似文献   

19.
为了提高模型在文本分类任务中的分类性能,针对图神经网络中存在的过度平滑问题,同时增强模型在处理文本特征与文本表示方面的能力,提出了一种基于多状态图神经网络的文本分类算法(multi-state graph neural network, MSGNN)。多状态图神经网络是利用网络层的多个历史状态信息对图神经网络进行强化,构建合理的文本图结构数据作为模型输入。在缓解网络层过度平滑问题的同时,结合2种改进后的不同类型的图神经网络来增强模型的特征提取与特征聚合能力。利用多头自注意力机制对文本关键词的挖掘与利用能力,从多个文本子空间来生成高质量的文本表示,进而完成文本分类。通过在几个公开的文本分类数据集上进行实验分析,相较于其他神经网络的文本分类算法,该方法取得了较好的分类准确率。  相似文献   

20.
近年来卷积神经网络(convolutional neural network,CNN)在行为识别任务中取得了较大的进展.然而,现有的神经网络方法往往只注重高层语义信息的利用,对浅层特征信息挖掘利用不够.针对这一问题,提出一种基于3D卷积(convolution 3D,C3D)的多尺度3D卷积神经网络的行为识别方法.该方法受到特征金字塔结构的启发,在原C3D的基础上融合C3D的浅层特征信息,实现端到端的行为识别.同时该方法以现有的深度学习理论为基础,利用迁移学习的思想,将C3D和该方法中相同模块部分的参数迁移到本方法中,以降低模型的训练时间.通过在UCF101数据集上进行实验,实验结果表明,提出行为识别方法的分类精度达到84.56%,分类效果优于原C3D分类网络.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号