首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
为了对灾难场景图像进行快速分析和识别,提出了一种基于多分辨率卷积神经网络和残差注意力机制(attention module)相结合的图像分类模型.首先,对灾难场景数据集进行预处理,在相同类型的条件下将其随机划分为训练集和测试集.基于改进的卷积神经网络(convolutional neural network,CNN),提取训练集的图像特征.使用训练集图片的特征进行训练,并且在测试集图片上实现分类测试.选取DenseNet、Xception和MobileNetV2三种模型,以灾难场景数据集(Disaster_Data_Scenes)为数据集进行实验验证.结果表明:改进的Xception和MobileNetV2网络在灾难场景数据集上进行的图像分类实验测试,比原网络精度分别提升了4.56%和3.04%.其中改进的DenseNet网络比原网络模型精度分别提升9.13%、17.88%和10.27%.可见改进的卷积神经网络模型的分类精度得到有效提高.  相似文献   

2.
李笑雪  黄煜峰  李忠智 《江西科学》2021,39(6):1103-1109
合成孔径雷达(Synthetic Aperture Radar,SAR)目标识别技术广泛应用于道路、船舶等检测任务中,但合成孔径雷达图像易受散斑噪声干扰,直接将卷积神经网络(Convolutional Neural Network,CNN)应用在SAR数据集上难以高效准确地提取有效特征.针对以上问题,提出了一种嵌入特征预提取和注意力机制的SAR图像目标识别算法(Convolutional Automatic Encoder-Convolutional Neural Network-Channel and Spatial Atten-tion Mechanism,CAE-CNN-CSAM),即利用优化的Lee滤波算法降低SAR图像斑点噪声,通过编解码技术对SAR图像进行特征预提取,而后在卷积神经网络中引入注意力机制,提高算法对通道和空间特征的表达能力.在公开的Statoil/C-CORE数据集上,该算法对目标的识别准确率达到了94%,相比于目标识别准确率约为88%的CNN等基准模型具有更高的目标识别性能.  相似文献   

3.
随着卷积神经网络(Convolutional Neural Networks,CNN)的不断改进,基于CNN的图片匹配成为图像处理的关键,然而,许多基于CNN的图像相似度检测算法对图像特征的表达能力较差,且曼哈顿距离或欧式距离的计算方式导致在计算损失函数时模型不一定能很好地收敛.针对此问题,提出一种基于孪生网络和注意力机制的方法(CSNET)来提升图像匹配的性能,主要步骤如下:使用将激活函数改进为Mish函数的VGG16网络作为主干网络提取图像的特征,在模型的卷积层加入注意力机制模块(Convolutional Block Attention Module,CBAM),这提高了模型的特征提取能力和鲁棒性,保证训练可以收敛.对模型输入图片对的特征向量的欧氏距离,再利用网络全连接层输出的相似度分数来度量被检图片是否相似.将提出的CSNET与其他图片匹配方法在Omniglot和SigComp2011等数据集上进行比较,实验结果表明,CSNET能有效提高图像相似度匹配的准确性.  相似文献   

4.
针对杂草的精确喷洒问题提出一种基于卷积神经网络(Convolution Neural Network, CNN)的棉花植株和杂草的检测识别方法。首先采集不同环境下棉田中棉花植株和不同种类的杂草图像作为网络模型的数据集,对数据集进行数据增强来增加数据集的数量,将其分为训练集与测试集;然后构建CNN模型,在模型中添加Dropout层,以防止网络出现过拟合,将训练集数据输入网络模型,使模型学习棉花植株和杂草的特征信息;最后将测试集数据输入CNN模型,测试CNN模型对棉花植株和杂草的识别能力。研究结果表明CNN对于棉花植株和杂草的分类结果精度超过了99.95%,识别时间为197.2s,证明CNN可以快速高效的识别棉田中棉花植株和杂草,为农业智能精确除草装备的研发提供研究基础。  相似文献   

5.
针对花样滑冰运动人体运动轨迹复杂、动作类型多样、普通人肉眼难以区分且常规的行为识别方法识别准确率低的问题,提出了一种基于时空图卷积网络与多通道注意力机制融合方法 (SAT-GCN)的花样滑冰动作识别算法。该算法首先将视频提取成连续的单独帧,使用OpenPose算法提取人体骨骼关键点数据,降低背景噪声干扰;然后使用时空图卷积算法对骨骼关键点数据进行动作分类。算法对时空图卷积算法进行改进,加入了多通道时空注意力机制融合模块,使得模型更加关注重要的关键点、时间帧片段、特征;使用时序卷积网络(TCN)提取人体骨架关键点在时间序列上的特征;使用SoftMax对提取后的特征进行动作分类。在花样滑冰数据集FSD-10和公开的人类行为数据集Kinetics-Skeleton上进行训练和测试,与改进前的时空图卷积网络(ST-GCN)进行对比,本文所提算法的预测准确率在2个数据集上均有所提升,验证了多通道注意力机制融合方法在花样滑冰选手动作检测任务中的有效性。  相似文献   

6.
针对直接集成简单分类器对交通标志数据库进行识别出现的类别预测效果较差的问题,提出一种基于卷积神经网络(CNN)和Bagging集成学习的交通标志识别算法,采用爬虫和图像增强技术实现交通标志数据集的扩充,以CNN网络提取交通标志图像的特征,通过采用最大池化层实现图像数据下采样,采用较浅的网络深度以简化整体网络结构。在CNN网络特征提取的基础上,利用软投票机制对多项Logistic、K近邻、SVM个体学习器进行集成,实现较准确的交通标志识别。实验结果表明,该算法在TSRD交通标志识别数据库测试集上的识别准确率达到了93.00%,相对于未改进的卷积神经网络模型识别准确率提高了11.99个百分点,并较高于通过VGG16和ResNet50迁移学习实现的识别准确率,具有较快的收敛速度。  相似文献   

7.
近年来,卷积神经网络(CNN)已经成为很多科学领域的研究热点之一.卷积神经网络作为一种深度模型可以直接作用于原始输入,不需要手动设计特征描述子.与传统神经网络相比识别效果有很大的提高.它已经建立了一类强大的模型来处理图像识别,并对其扩展到三维卷积神经网络(3D CNN)来处理视频识别问题.在此基础上,笔者对三维卷积神经网络做了如下改进:用Gabor小波核来初始化卷积操作,以达到模拟人类视觉系统对视觉刺激的响应;在网络训练的过程中加入Dropout技术,随机选择删除部分神经元,以此来提高网络的泛化能力,有效防止过拟合.提出的方法在KTH和UCF-YouTube数据集上进行验证,取得了很好地识别效果.  相似文献   

8.
为了解决银行、邮局等场合的实时数字识别问题,提出了一种优化的卷积神经网络(Convolutionnal Neural Network,CNN)数字识别方法。以Lenet-5模型为基础改进了卷积神经网络结构并推导了改进后的前向和反向传播算法,将改进的卷积神经网络在手写、印刷数字组合数据库上进行测试,分析了不同样本数量、训练迭代次数等参数对识别准确率的影响,并与传统算法进行比较分析。结果表明改进后的CNN结构简单,处理速度快,识别准确率高,具有良好的鲁棒性和泛化性,识别性能明显高于传统网络结构。  相似文献   

9.
给出了一种多通道卷积神经网络(Convolutional Neural Network,CNN)方法实现中文文本端到端的关系抽取.每个通道用分层的网络结构,在传播过程中互不影响,使神经网络能学习到不同的表示.结合中文语言的难点,加入注意力机制(Attention Mechanism,Att)获取更多的语义特征,并通过分...  相似文献   

10.
卷积神经网络(Convolutional Neural Networks,CNN)已广泛应用于步态识别领域,但CNN进行分类时仅考虑单张步态图片,未考虑到步态的连续性特征,这直接影响到最终识别准确率。因此,提出利用长短期记忆网络(Long Short-Term Memory networks,LSTM)来获取步态的连续特征,结合步态能量图(Gait Energy Image,GEI)构建一种新的步态识别模型。将该模型在OU-ISIR Treadmill dataset B数据库上进行测试,识别准确率和网络训练时间两个方面都优于CNN,表明LSTM在步态识别领域上具有良好的应用前景。  相似文献   

11.
提出了一种基于卷积神经网络(Convolutional Neural Network,CNN)的多姿态人脸识别方法。利用该方法可以将输入的人脸投影到高维特征空间并输出具备姿态鲁棒性的人脸特征,从而进行精确的多姿态人脸识别。经过大量的实验验证,该模型在多个数据集上取得了良好效果。与传统的单路CNN网络层次结构不同,本文方法采用双路CNN网络层次结构并结合度量学习来优化传统的CNN模型。最后,使用Tensorflow深度学习框架进行实验,实验结果表明,该框架的识别准确率比目前几种常用的多姿态人脸识别算法的识别准确率更高。  相似文献   

12.
为实现IFC构件精确、高效分类,提出一种改进的多视图卷积神经网络(Multi-view Convolutional Neural Network, MVCNN)模型,该模型引入了自注意力模块和长短期记忆(Long Short-term Memory,LSTM)网络,针对MVCNN模型特征融合的局限性,设计了LSTM_ATT模块;通过对各视图数据特征关系的自适应调整,并结合注意力权重对输入的各视图数据进行融合,得到一个更具辨识性的3D形状描述符,从而提高模型对各相似IFC构件的分类检测性能. 使用IFCNet数据集对建筑领域20个主要类别的IFC构件进行训练并在测试集上对改进MVCNN模型与MVCNN模型进行实验对比. 实验结果表明,改进模型的分类准确率和F1值分别达到了88.27%、86.72%,相比改进前准确率提高了9.46%,对相似构件之间的分类识别效果明显.  相似文献   

13.
针对原有双流时空卷积网络模型中网络深度不足,从而导致人体行为识别结果偏低的问题,针对该网络模型进行改进,且融入Kinect骨骼序列数据.对于输入数据,通过Kinect相机对人体动作转化为骨骼序列;改进双流卷积网络模型是在原有的模型框架下,用RestNet-50网络结构替代原VGG-16网络结构,再对数据进行一系列处理.在HMDB-51和UCF-101两个公开数据集上进行模型的训练和验证,其识别结果分别为70.8%和91.4%,通过对比结果表明,本文提出的改进双流卷积网络融合Kinect骨骼数据能够有效提升人体行为识别的正确率.  相似文献   

14.
针对抽油机故障数据不足、样本分布不均衡的问题,提出一种基于自注意力机制的条件深度卷积生成对抗网络(CDCGAN:Conditional Deep Convolutional Generative Adversarial Networks)模型。该模型在CDCGAN的基础上引入自注意力机制,并在损失函数中加入约束生成图像分布的正则项,提高了生成图像的质量和多样性,有效地防止了模式崩溃的发生。采用Alexnet、VGG16等网络对生成的抽油机故障样本进行分类测试,实验结果表明,改进网络的生成数据质量更高,能够有效平衡抽油机故障数据,进一步提升了抽油机故障诊断的准确率。  相似文献   

15.
针对使用卷积神经网络结构结合循环神经网络结构的模型在手语翻译任务中难以关注到手语视频序列中关键帧的问题,提出了一种结合全局注意力机制的手语翻译模型.该模型在长短时记忆网络中嵌入全局注意力机制,通过计算当前隐藏状态和源隐藏状态之间的相似度并得出对齐向量,让模型学习对齐权重,使模型关注到长手语视频序列中的关键帧,从而提升模型翻译的准确率.实验结果表明:加入全局注意力机制的模型在DEVISIGN_D数据集上的准确率优于3DCNN、CNN+LSTM等主流模型,并且在100分类的短手语词和长手语词数据集上,分别与未使用注意力机制的模型进行了对比,其准确率提升0.87%和1.60%,证明该注意力机制可以有效地提升模型翻译的准确率.  相似文献   

16.
针对互联网广告数据具有高维稀疏性的特点,在现有的点击率(Click-Through Rate, CTR)预测问题的相关理论和技术基础上,给出了一种基于梯度提升决策树(Gradient Boosting Decision Tree, GBDT)的卷积神经网络(Convolutional Neural Networks, CNN)在线广告特征提取模型(CNN Based on GBDT,CNN+). CNN+模型不仅能从原始数据中提取出深度高阶特征,还能解决卷积神经网络在稀疏、高维特征中提取特征困难的问题.在真实数据集上的实验结果表明,与主成分分析(Principal Component Analysis,PCA)和梯度提升决策树这两种特征提取方法相比, CNN+模型提取的特征更加有效.  相似文献   

17.
随着人机交互技术的发展,手势动作作为一种自然、方便以及高效的交互方式受到人们的关注。因而对此从理论和程序执行的角度提出一个针对9种手势识别的卷积神经网络(Convolutional Neural Networks,CNN)模型。首先,从组成CNN的基本单元神经元开始,然后上升到神经网络,最终到反向传播算法。通过调整卷积神经网络中的参数(迭代次数、步长),观察不同参数对网络的均方误差和测试准确度的影响。实验结果表明,该模型和算法可以有效识别9种手势,识别准确率最高可达93. 33%.  相似文献   

18.
利用卫星遥感技术融合深度学习算法,可以快速、动态、高效识别露天煤矿开采区,以我国和其他煤炭资源大国的典型露天煤矿开采区为研究对象,基于高分二号多光谱遥感影像,制作数据集及标签,构建基于卷积神经网络(convolutional neural networks, CNN)的深度学习目标检测算法.通过加入特征金字塔网络,充分挖掘开采区及背景区的低分辨率语义信息和高分辨率纹理信息,实现快速卷积神经网络的深度学习目标检测算法模型的改进及参数优化.结果表明改进后的模型平均检测精度提高到98.48%,总体识别精度达到96.7%,有效提高了复杂背景下的多尺度、多类型露天开采目标的识别精度,为全球煤炭资源大国能源合作、生态环境保护及我国矿产资源的合理利用和修复提供了科学、精准手段.  相似文献   

19.
为解决图像分类中深度卷积神经网络(Convolutional neural networks,CNN)中较为复杂的人工网络设计与调参问题,提出基于ResNet模块的进化卷积、神经网络(Evolutionary convolutional neural network,ECNN)的自动设计方法,并将其运用到图像分类中.该方法基于ResNet模块与2D卷积层,采用进化算法(Evolutionary algorithm,EA)对网络结构及参数进行优化.在NLM官方发布的疟疾数据集下进行实验,不同比例的测试集划分可以达到95.6%的分类准确率,文中算法与AlexNet、VGG16、Xception等人工设计的深度学习分类算法进行了比较,实验结果表明,其准确率提升了约1%.在斯坦福大学发布的Stanford cars车辆图像数据集中进行了算法泛化验证,结果表明,文中算法在不同比例数据的测试中准确率均在94.5%以上,将该算法与深度学习分类算法VGG16进行比较,准确率效果相当,模型测试图像分类耗时仅为VGG16耗时的1/13,且训练参数量较少.两组对比测试实验数据表明,相比人工设计的深度学习算法,本文方法具有较好的图像分类性能与较快的图像分类速度.  相似文献   

20.
针对日益增长的汉字书法学习需求,将滑动窗口自注意力(Swin Transformer, ST)模型和卷积神经网络(Convolutional Neural Network, CNN)模型相结合,提出手写体汉字识别ST-CNN模型,进而开发了汉字书法教学系统。实测结果表明,ST-CNN模型识别准确率约为91.6%,较传统的ST模型提升了约0.5个百分点,较传统的CNN模型与ST模型,在收敛速度上分别提升了约10和30个百分点,开发的汉字书法教学系统性能良好。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号