首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对传统卷积神经网络随着深度加深而导致网络退化以及计算量大等问题,提出一种改进残差神经网络的遥感图像场景分类方法。该方法以残差网络ResNet50作为主框架,在残差结构中引入深度可分离卷积和分组卷积,减少了网络的参数量和计算量,加快模型收敛的同时也提升了分类精度。此外在网络中嵌入多尺度SE block模块对通道特征进行重校准,提取出更加重要的特征信息,进一步提升了网络的分类性能。在AID和UCMerced_Land Use两个公开数据集上的分类精度分别为91.92%和93.52%,相比常规残差网络分类精度分别提高了3.38%和10.24%,证明所提方法在遥感图像场景分类任务中的可行性和有效性。  相似文献   

2.
【目的】为解决因土壤图像纹理复杂、没有结构性特征导致的传统卷积神经网络模型难以提取其中关键性特征、识别准确率低的问题,提出了一种大核注意力(large kernel attention,LKA)机制模块与ResNet模型融合的土壤种类识别网络模型VAR(visual attention ResNet),以解决土壤种类样本不平衡和难分类样本造成的模型泛化能力弱的问题。【方法】以ResNet为主干网络,在主干中引入LKA机制,减少其中的残差块,构建土壤种类识别网络VAR,并改进网络的焦点损失函数(Focal Loss)。【结果】1) 与传统模型ResNet18、ResNet34、VGG、GooleNet、VAN等相比,VAR模型在特定模型参数下对紫色土土壤图像数据集中土壤种类的识别精度更高;2) 用3种不同大小VAR模型之一的VAR_small与以ResNet18为主干并嵌入传统注意力机制SE、CBAM、ECA和SK的网络进行对比,实验结果显示LKA机制在土壤识别方面更加优秀;3) 改进的Focal Loss可让VAR更能注意到难分类的土壤图像样本。【结论】将LKA机制模块与ResNet模型融合的土壤种类识别网络模型VAR增强了网络提取土壤图像中关键性结构特征能力,同时还减少了网络参数,能更加有效地识别土壤种类。  相似文献   

3.
针对铁路隧道复杂背景下细小裂缝存在图像特征难以提取的技术问题,提出一种基于改进残差网络(Residual Network,ResNet)的铁路隧道裂缝检测算法.该算法采用ResNet对裂缝进行检测,并在此基础上对网络进行了改进:首先将具有不同扩张率的空洞卷积块与传统的卷积块组合形成金字塔空洞卷积模块;其次将该模块放在R...  相似文献   

4.
高光谱图像具有丰富的光谱信息和空间信息,综合运用空间特征和光谱特征是提高高光谱图像分类精度的关键.针对传统二维的卷积神经网络无法充分利用高光谱丰富光谱信息的问题,设计一种基于三维卷积神经网络(Three-dimensional convolutional neural network, 3D-CNN)的深度卷积编解码网络,将三维卷积神经网络引入编码结构,同时提取光谱和空间特征,并且在池化层引入池化索引策略;解码部分利用最大池化索引上采样操作.两个高光谱遥感影像公开数据集的分类实验结果表明,实现了高光谱的空间和光谱特征的融合提取,较基于2D-CNN的分类方法能够获得更高的分类精度.  相似文献   

5.
为解决立体匹配网络模型轻量化与高精度不能共存的问题,本文提出新的立体匹配算法CSA-Net。算法具体是在特征提取阶段,利用类ResNet进行特征提取,训练空洞金字塔池化(ASPP)模块扩大感受野,提取多尺度上下文信息,加入联合注意力机制(CSM),在空间和通道维度提高表征能力,关注重要特征并抑制不必要的特征。在特征融合阶段,将2D深度可分离卷积提升到3D来代替原网络中标准3D卷积在空间维度和通道维度分别进行卷积运算,以降低特征融合网络的参数量与模型运行时间。最终实验表明,本文所提出的立体匹配网络模型在KITTI 2012和2015数据集进行验证,在三像素匹配误差率为1.44%和2.24%,模型运行时间减少近1/3。因此,相比于其他实现了更高的匹配精度和更快的运行速度。  相似文献   

6.
针对单幅图像的室内深度估计缺少显著局部或全局特征问题,提出了一种基于多种网络(全卷积网络分别与通道注意力网络、残差网络结合)构成的编码器解码器结构.该网络采用端到端的学习框架.首先使用全卷积网络与通道注意力网络结合的全卷积通道注意力网络模块作为编码器,通过信道信息获取全局感受野,提高特征图精度,并适当地将全连接层改为卷积层以达到减少网络参数的目的.然后将全卷积网络与残差网络结合构成的上采样模块作为解码器,利用ResNet的特点——跳层连接,将解码器网络加深,提高深度图的精度,将卷积网络与残差网络结合,实现端对端,并减少网络运行所用时间.最后,使用L1损失函数优化模型.在公开数据集NYUDepth v2的测试下,实验结果表明,和现有的其他单目深度估计方法相比,本文所提出的网络模型不仅精简了繁琐的精化粗图的过程,而且所预测的深度图精度更高,阈值精度的提升不少于0.5%,运行网络结构的平均用时21 ms,为实现实时性奠定了基础,具有一定的理论研究价值和实际应用价值.  相似文献   

7.
针对多数高光谱影像分类方法提取信息不够充分导致分类准确率不够高的问题,提出了一种双通道时间稠密网络的高光谱影像分类方法。该方法利用时间卷积网络模型提取高光谱数据的光谱特征信息,利用稠密网络模型提取高光谱影像数据的空间信息特征,然后将两个网络各自提取到的特征进行融合,最后将融合后的特征送入Softmax分类器进行分类。在Pavia大学经典数据集上进行了仿真实验,将该方法分别同传统高光谱影像分类方法、单空间信息高光谱影像分类方法、单光谱信息分类方法进行了对比。实验结果表明,与多种经典分类方法相比,所提出的方法可以有效地从空间结构和光谱通道提取目标的特征信息,在常用的经典数据集上分类精度可达到99%分,较其他方法高出2%~3%。  相似文献   

8.
为解决传统3D卷积中难以提取时空信息的缺点,提出一种适用于3D卷积网络的多重注意力机制模块.该模块是由通道结合时间子模块和空间子模块组成的多维度特征调整模块.在通道结合时间模块中,通过调整池化层和卷积层的顺序,保留更多的有效通道信息和时间信息;在空间模块中,压缩冗余时间信息以减少计算量.该模块的整体计算量较少,可嵌入到各3D卷积网络中.为验证多重注意力机制模块的性能,基于3D ResNet网络设计部署了该多重注意力机制模块,并在UCF-101和HMDB-51两个行为识别数据集上分别进行训练.结果表明,改进后的3D ResNet在UCF-101上可提升1.50%的精度,在HMDB-51可提升1.24%的精度,而参数量只增加0.24%.  相似文献   

9.
为了提高图像分类精度,降低训练复杂度,提出一种采用无监督学习算法与卷积构造的图像分类模型.首先,从输入无标签图像中随机抽取大小相同的图像块构成数据集,进行预处理.其次,将预处理后的图像块通过两次K-means聚类算法提取字典,并采用离散卷积操作提取最终图像特征.最后,采用Softmax分类器对提取的图像特征进行分类,得出准确率.将该模型与卷积神经网络(CNN),Dropout CNN网络进行比较,结果表明:在对大规模高维图像分类上,文中模型具有分类精确度高、简单、训练参数少、适应度高等优点.  相似文献   

10.
针对Faster-RCNN算法在遥感图像当中对小目标的漏检、检测精度不高等问题作出改进.用特征提取能力更强的ResNet50网络替换VGG16;同时为了加强对遥感小目标信息的提取,引入特征金字塔,添加多尺度扩张卷积模块来增强特征金字塔的上下文特征,扩充小目标信息,使用通道注意力机制来减少特征融合过程中带来的信息混淆,提高模型对遥感小目标的检测效果.实验表明,所改进的方法在HRRSD遥感数据集达到86.7%的检测精度,较改进前提升了5.2%,同时检测效果也优于当前的一些主流检测模型,证明了改进后模型的有效性.  相似文献   

11.
汪志成  赵杰  沈博韬  王哲 《科学技术与工程》2023,23(33):14278-14286
针对婴儿全身运动质量评估问题,本文基于姿势识别对婴儿运动特征进行提取与分析,提出基于ResNet和反卷积层的婴儿姿势热力图识别模型,平均识别率达到86.9%;利用婴儿的二维姿势坐标,建立基于DenseNet的3D人体姿势识别模型,使用1D卷积网络及1D连接层,实现婴儿的2D姿势坐标到3D姿势坐标的升维推算;使用四元数作为空间向量表示方式,对婴儿主要肢体运动的角度、角速度、角加速度进行提取,并提出基于SVM的由婴儿肢体运动角度特征进行判定的婴儿异常行为识别模型。针对模型参数过多的问题,在保证模型整体识别率的情况下,使用主成分分析的方式对模型进行特征降维,提高整体识别速度,将维度由18维度降低至8维度后,整体运行时间减少近50%,且对于不同的视频样品均能正确分类。  相似文献   

12.
针对多数淡水鱼类识别方法特征的提取进程复杂,在自然外部场景下很难进行高效识别问题,构造了残差模型及注意力机制相融合的ResNet50-SE-Fish网络对不同发育程度的8种淡水鱼类进行识别,并测试构造的网络识别性能.研究在原残差块内添加SE模块,增加所关注特征数据权重,减小外部场景噪声以及背景无关特征数据权重,并使用迁移学习来对不同发育程度幼鱼、成鱼特征数据进行识别.通过Grad-CAM方法对ResNet50-SE-Fish网络每个残差块提到的淡水鱼类特征数据可视化以解释注意力表示作用,并与7种常用网络所提到的热力图比较,以评估网络对淡水鱼类特征数据提取能力.结果表明,ResNet50-SE-Fish网络对不同发育程度淡水鱼类有很高的识别精度,验证时准确率高达95.53%,测试时准确率达90.16%,相较于AlexNet、VGG16、ResNet18、GoogleNet、VGG19、ResNet34、ResNet50,测试时准确率依次增大14.93%、6.32%、2.51%、3.55%、3.69%、2.14%、1.73%,注意力机制利用调节通道关注程度能够提高模型淡水鱼类特征的提取效果...  相似文献   

13.
鉴于卷积神经网络能够自动学习和获取图像特征,提出一种基于RetinaNet模型的火焰检测算法.首先RetinaNet在残差网络之上使用特征金字塔网络作为骨干网计算和生成丰富的卷积特征金字塔,然后通过分类子网络和边框预测子网络分别对骨干网的输出进行分类和回归,通过调整训练策略和参数,最后在自建数据集上使用该算法得到的火焰检测模型实现了实时的端到端火焰识别与定位,对复杂目标背景下的小火点检测也保持较高的检测准确率,对火灾初期的检测预警有一定的实用意义.  相似文献   

14.
垃圾分类已经成为当前社会生活的新风尚.本论述针对当前垃圾分类工作环境差和容易分类出错的问题,研究基于深度学习的垃圾自动分类方法,并设计基于深度残差卷积神经网络ResNet50的垃圾识别方法.为避免垃圾图像数据集中训练数据量的不足,采用对使用ImageNet训练好的ResNet50模型进行迁移微调的方法来优化网络参数.在...  相似文献   

15.
为改善现有深度学习方法获取图像特征尺度单一、提取精度较低等问题,提出多尺度空洞卷积金字塔网络建筑物提取方法。多尺度空洞卷积金字塔网络以U-Net为基础模型,编码-解码阶段采用空洞卷积替换普通卷积扩大感受野,使得每个卷积层输出包含比普通卷积更大范围的特征信息,以利于获取遥感影像中建筑物特征的全局信息,金字塔池化模块结合U-Net跳跃连接结构整合多尺度的特征,以获取高分辨率全局整体信息及低分辨率局部细节信息。在WHU数据集上进行提取实验,交并比达到了91.876%,相比其他语义分割网络交并比提升4.547%~10.826%,在Inria数据集上进行泛化实验,泛化精度高于其他网络。结果表明所提出的空洞卷积金字塔网络提取精度高,泛化能力强,且在不同尺度建筑物提取上具有良好的适应性。  相似文献   

16.
近年来,研究人员们在卷积神经网络的基础上保证效率的条件下提出了轻量化卷积神经网络,其中SqueezeNet轻量化卷积神经网络在保证精度的前提下,压缩了参数,提高了整体效率。本文针对SqueezeNet网络中由于压缩参数,存在准确率不理想的问题,提出了引入残差网络,增加跳层结构和网络宽度的改进方法 VansNet,相较于AlexNet、ResNet和SqueezeNet三种卷积神经网络其计算量最小且参数量很小。实验结果表明,改进后的VansNet轻量化结构在略增加参数的前提下提高了图像分类的准确率和效率。  相似文献   

17.
针对高分辨率网络中存在不同分支特征交叉融合导致参数量大、运算复杂度高等问题,提出了一种基于高分辨率检测网络(HRNet)的人体姿态估计优化网络模型.引入空洞空间卷积池化金字塔替代多分辨率分支网络交叉融合过程,同时引入注意力机制,提高网络输出特征图质量,从而保证改进后网络检测的准确度.在环境配置和网络输入图像分辨率一致的情况下,所提出的模型在COCO数据集上实验结果较HRNet相比参数量下降38.6%,运算复杂度下降35.2%.实验结果表明:改进后网络在检测精度略微下降的情况下,能有效降低参数量、运算复杂度.  相似文献   

18.
在高光谱图像分类中,原始的图卷积网络作用在数据量较大的数据集上时,会出现内存开销大、时间成本高的问题,而且单一的图卷积网络模型不能对高光谱图像进行充分的特征提取。为了在数据量较大时降低时间成本并充分提取特征以提高分类精度,本文研究了Gabor滤波和批处理的图卷积网络级联卷积神经网络的融合网络对高光谱图像进行特征提取的方法,并在3个数据集上进行了验证。实验结果表明,本文的方法在对数据量较大的数据集分类时可以较好地降低时间成本,提高分类精度。  相似文献   

19.
针对现有细粒度图像分类算法普遍存在的模型结构复杂、参数多、分类准确率较低等问题,提出一种注意力特征融合的SqueezeNet细粒度图像分类模型.通过对现有细粒度图像分类算法和轻量级卷积神经网络的分析,首先使用3个典型的预训练轻量级卷积神经网络,对其微调后在公开的细粒度图像数据集上进行验证,经比较后选择了模型性能最佳的SqueezeNet作为图像的特征提取器;然后将两个具有注意力机制的卷积模块嵌入至SqueezeNet网络的每个Fire模块;接着提取出改进后的SqueezeNet的中间层特征进行双线性融合形成新的注意力特征图,与网络的全局特征再融合后分类;最后通过实验对比和可视化分析,网络嵌入Convolution Block Attention Module(CBAM)模块的分类准确率在鸟类、汽车、飞机数据集上依次提高了8.96%、4.89%和5.85%,嵌入Squeeze-and-Excitation(SE)模块的分类准确率依次提高了9.81%、4.52%和2.30%,且新模型在参数量、运行效率等方面比现有算法更具优势.  相似文献   

20.
随着深度卷积神经网络的快速发展,基于深度学习的目标检测方法由于具有良好的特征表达能力及优良的检测精度,成为当前目标检测算法的主流.为了解决目标检测中小目标漏检问题,往往使用多尺度处理方法.现有的多尺度目标检测方法可以分为基于图像金字塔的方法和基于特征金字塔的方法.相比于基于图像金字塔的方法,基于特征金字塔的方法速度更快,更能充分利用不同卷积层的特征信息.现有的基于特征金字塔的方法采用对应元素相加的方式融合不同尺度的特征图,在特征融合过程中易丢失低层细节特征信息.针对该问题,本文基于特征金字塔网络(featurepyramidnetwork,FPN),提出一种多层特征图堆叠网络(multi-featureconcatenationnetwork,MFCN)及其目标检测方法.该网络以FPN为基础,设计多层特征图堆叠结构,通过不同特征层之间的特征图堆叠融合高层语义特征和低层细节特征,并且在每个层上进行目标检测,保证每层可包含该层及其之上所有层的特征信息,可有效克服低层细节信息丢失.同时,为了能够充分利用ResNet101中的高层特征,在其后添加新的卷积层,并联合其低层特征图,提取多尺度特征....  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号