首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
杨一  卢佩  刘效勇  谢峰 《科学技术与工程》2023,23(19):8288-8295
生成对抗网络(generative adversarial networks, GANs)技术正逐步成为合成图像的主流方法,合成的人脸图像对社会稳定和国家安全具有潜在的风险隐患,因此识别GAN生成的人脸已成为一个重要问题。为解决卷积神经网络(convolutional neural networks, CNN)在训练过程中无法获取图像全局表示的问题,提出了一种CNN-Transformer双流网络检测框架,在最大限度提取局部特征的同时,进一步保留图像的全局信息。首先,在CNN分支流中引入空间注意力和通道注意力,关注图像关键信息并提取局部特征;其次,利用Transformer分支流提取图像的全局信息;最后,中间利用桥接双分支的MixBlock交互模块分别将两者提取的局部特征和全局信息融合在一起。实验结果表明:与现有两种方法相比,本文所提方法在公共伪脸数据集上的分类检测精度分别提升了5.42%和1.95%,并且在后处理的图像上表现出一定的鲁棒性。  相似文献   

2.
由于热图像存在无颜色信息,边缘模糊,细节信息较弱等问题,较难获得高质量的图像分割效果.为解决这个问题,在编码-解码(encode-decode)架构的基础上,本文增加了多级像素空间注意模块(multi-level pixel spatial attention module, MPAM)、边缘提取模块(edge extraction module, EEM)和小目标提取模块(tiny target extraction module, TTM).其中,MPAM能使网络充分保留细节的同时捕捉到语义信息,EEM和TTM分别提取具有语义信息的边缘和小目标等细节特征.为提高各类别边缘相交区域像素点和小目标物体的预测精度,设计了专门的损失函数对已获得的边缘和小目标特征进行监督训练,提高各类别边缘相交区域像素点和小目标物体的预测精度.将该方法分别应用于课题组构建的热图像数据集SCUT_SEG、公开的热图像数据集SODA和合成热红外数据集Cityscpae,实验结果表明:本文方法比FCN、PSPNet、Deeplabv3+、MCNet、EC-CNN等5种网络分割算法效果略好,性能提升约2.2个百分点...  相似文献   

3.
目前许多肺炎图像分类网络大多采用单分支网络对输入图像进行特征提取,这在一定程度上忽略了图像不同维度的特征信息。为了优化这种问题,提出一种融入注意力机制的双分支肺炎图像分类网络,利用VGG16网络和加入可分离卷积以及融入卷积注意力模块(convolution block attention module, CBAM)的CNN卷积神经网络进行双分支特征提取,能够关注到肺炎图像不同层次的特征信息,将2种网络分支的特征进行不同维度的融合,最后输入全连接层进行分类判决。结果表明,该网络在正常肺部、病毒性肺炎、新型冠状病毒肺炎(COVID-19)X-ray图像组成的测试集上取得了95%的平均准确率。经过消融试验证明,该网络加入的可分离卷积模块、注意力模块和特征融合对减少网络参数、提高网络分类的准确率起到明显作用。与其他网络的性能对比也表明该网络在肺炎图像分类上表现出较高的准确率和较强的鲁棒性。  相似文献   

4.
高分辨率遥感图像场景分类广泛应用于土地监测、环境保护及城市规划等诸多领域.现有场景分类方法不能很好地结合局部纹理信息和全局语义信息,同时各通道特征之间的关系没有得到有效挖掘.因此,本文提出了一种基于多通道自注意力网络的遥感图像场景分类模型.通过卷积网络提取遥感图像的多尺度特征;随后采用特征融合单元建立多尺度特征间的局部-全局关系,基于多头自注意力机制的Inter-Channel Transformer在通道维度对融合后的特征建模,并推导特征在通道间的关系,进一步扩大全局感受野,以捕捉其语义结构信息,有效提高了网络的分类精度.在数据集AISC和SIRI-WHU上,本文所提算法的整体分类准确率(OA)分别为95.70%和94.00%,超过了当前最新的研究算法,证明了所提模型在高分辨率遥感图像场景分类任务中的有效性.  相似文献   

5.
知识蒸馏能提高神经网络的泛化能力,可解决遥感图像场景分类时标注数据不足的问题。遥感图像存在的类间高相似性会导致中间知识特征丢失,针对该问题,本文提出一种基于自蒸馏级联注意力机制的特征提取方法(SDCASA)。首先构造权值共享的教师、学生网络;然后使用级联注意力模块精细化深层教师网络所提取到的特征,同时保留被浅层神经网络过滤的中间边缘信息;再利用精细化之后的特征指导学生网络学习;最后在下游训练一个线性分类器完成特征分类。在3个公开数据集AID、MLRSNet、EuroSAT上使用20%和50%的样本训练,分类准确率分别达到85.17%、90.10%、 91.13%和85.50%、92.13%、91.17%。此方法能有效提高遥感图像场景分类准确率,性能优于主流自监督图像分类方法 SimSiam、SwAV、MoCov2、Deepcluster,具有良好的应用价值。  相似文献   

6.
面部表情自动识别技术已在人工智能领域受到广泛使用。然而,由于姿态变化和遮挡,人脸表情识别中的一个关键挑战是提取细粒度特征的方法。文章提出一种基于注意机制的多粒度匹配模型,特别地,在多粒度匹配模块中部署了多粒度模块和关注度估计模块。通过多粒度模块将细节图像划分为多个细粒度局部区域,并计算局部特征的关注度权重来构造全局特征。图像细节处理模块用于获取原始图像的细节特征。在CK+和Fer2013上进行了大量实验,结果证明了本文方法的有效性。  相似文献   

7.
针对目前网络安全态势评估方法在特征提取、高效性等方面存在的不足,该文提出了一种基于并行特征提取和改进双向门控循环单元(BiGRU)的网络安全态势评估方法,设计了一个由并行特征提取网络(PFEN)和基于注意力机制改进的BiGRU组成的深度学习模型(PFEN-ABiGRU)。PFEN模块由并行的稀疏编码器组成,用于差异化地提取不同网络威胁的关键信息并将提取的特征与原始信息融合;ABiGRU模块通过注意力机制对关键特征进行加权以提高模型的准确性。将训练好的PFEN-ABiGRU模型用于网络威胁检测,根据威胁检测结果,结合提出的网络安全态势量化指标,计算网络安全态势值。实验结果表明,PFEN-ABiGRU在精确率和召回率上均优于对比的其他模型。  相似文献   

8.
为充分提取3D点云的深层特征以提高复杂室内点云场景的语义分割精度,提出一种结合局部特征和全局特征的室内点云语义分割网络GSFNet.在局部特征部分,加入几何特征信息,并设计几何与语义特征信息编码模块,以更好地捕获室内点云局部信息.对全局特征部分,在编码解码器结构中间层加入全局关系依赖模块,构建不同邻域对象之间的关系提取有效分割信息.使用斯坦福大规模室内数据集(S3DIS)进行实验验证,在测试数据集上测试的总体精度(OA)和平均交并比(mIoU)分别为87.2%和61.1%,实验结果表明,GSFNet对复杂室内环境有较好的语义分割效果.  相似文献   

9.
传统物体识别方法是从单一图像中通过人工提取图像特征,存在成本高、质量低等问题。针对上述问题,提出一种基于多视图和注意力推荐网络的三维物体识别方法,多视图很好地保留了物体在局部和全局上的特征;注意力模块可以有效地对视图上关键的特征聚焦,忽略无关或干扰特征。该方法利用一组多视图作为输入数据,通过卷积神经网络端到端提取物体特征,在卷积层加入注意力模块,实现视图关键区域的定位和剪裁,将处理后的视图送入另外一个卷积层,两个相同卷积操作提取的特征在池化层聚合,利用稀疏表示分类器对特征描述子进行分类识别。通过两个公开数据集的实验表明,所提算法对物体图像的识别准确度优于传统算法。  相似文献   

10.
针对传统海洋浮游生物利用人工提取特征的传统检测方法,存在检测精度低、检测过程冗余等问题,基于深度学习技术,提出了多模块融合的浮游生物检测器(multi module fusion single shot detector,MMFSSD).首先,提出了特征信息增强模块,在不增加网络复杂性的前提下增加了网络的感受野,将下采样图像注入该模块中,以增强特征图的低级特征信息.在此基础上,进一步提出了选择性特征融合模块,在网络中学习融合时的权重,选择性地融合不同尺度的特征.有效性验证试验结果表明,在数据集PASCAL VOC和MS COCO中的平均精度均值分别为80.70%和32.20%,在浮游生物数据集PMID2019中的平均精度均值达到90.41%.  相似文献   

11.
人脸图像修复旨在修复输入人脸图像中的缺失区域,生成令人满意的高质量修复结果.然而当存在大面积缺失时,直接修复缺失人脸图像十分困难,此时修复网络的全局上下文信息感知能力是影响修复结果的关键.鉴于此,本文提出了软硬注意力相结合的双重自注意力模块.该模块通过全局相似度计算来获得软硬两种注意力特征,之后对两种注意力特征进行自适应融合,进而提高修复网络对全局上下文信息的感知能力.此外,本文进一步提出了多尺度生成对抗网络以加强对修复结果的监督,促使修复网络生成更高质量的修复结果.实验结果表明,本文方法在定量和定性评测上均优于五种先进的对比方法.  相似文献   

12.
针对现有文本分类模型上下文信息挖掘不足、全局特征表示提取不充分等问题,提出了一种基于张量的残差图卷积网络模型.首先,以归纳学习方式构建文本图,挖掘文本中蕴含的句法关系、语义关系和序列关系并整合构建邻接张量,捕获文档的高阶上下文信息与关键局部特征信息;然后,利用残差连接加深网络深度,处理图卷积网络过平滑问题,提升模型的泛化能力;最后,设计图读出机制聚集所有节点特征,提取文本的全局特征表示.在R8和MR数据集上进行了实验评估,实验结果表明与已有文本分类方法相比,所提方法取得了优越的分类效果.  相似文献   

13.
糖尿病视网膜病变(Diabetic Retinopathy,DR)是一种致盲率很高的眼科疾病。不同病变等级的视网膜图像之间差异小且病灶点分布无规律。针对现有深度模型对DR中的相似病灶点识别率低,严重影响模型分类精度的问题,本研究以深度学习为基础,构建新的模型架构进行训练,提出一种集成MobileNetV2和EfficientNetB0深度模型的注意力网络:ME-ANet。模型集成分为头部和主干两部分,将深度模型的浅层部分融合构成网络的头部,训练时采用迁移学习的策略对网络模型参数进行初始化,减少训练中的过拟合问题。主干部分利用上述两种模型的核心结构,设计3个阶段集成模块进行特征提取。同时设计全局注意力机制(Global Attention Mechanism,GAM)并分别嵌入到3个阶段的集成模块中。模型的改进加速了网络的收敛速度,该网络模型实现了对图像浅层信息的特征融合提取,减少了微病灶特征信息在训练过程中的卷积丢失问题,模型的分类精度进一步得到改善。通过模型集成构建特征提取主干网络,提高了模型对低级特征信息的学习,注意力机制抑制非病变特征信息,强化典型病灶特征学习,从而实现细粒度分类,进一步提升了模型的分类性能。  相似文献   

14.
特征提取是合成孔径雷达(synthetic aperture radar, SAR)图像自动识别与分类中的重要环节。由于SAR图像有相干斑噪声及几何畸变等特性,一般网络模型难以提取到有判别性的特征。为增强特征提取能力,提高分类准确率,提出将注意力机制与胶囊网络结合的一种注意力胶囊网络模型。注意力机制可聚焦寻找具有重要局部信息的特征,在图像识别过程中抑制干扰特征,定位重要特征。胶囊网络可捕捉图像中目标的位置与空间关系,使提取到的SAR图像特征含有更多便于分类的重要信息。结果表明:文中方法对SAR图像分类数据集中运动和静止目标的获取与识别(moving and stationary target acquisition and recognition, MSTAR)有显著效果。  相似文献   

15.
基于文本的行人重识别模型通常依赖于全局特征对齐和局部特征对齐,但模态间和模态内的相关信息常被忽略。提出了一种基于关系挖掘的跨模态行人重识别方法,该方法包括双流主干网络、负相似度挖掘模块、关系编码器。首先,通过双流主干网络实现了全局和局部特征对齐;其次,通过负相似度挖掘模块提升了图像-文本对特征辨别的细粒度;最后,通过关系编码器模块分别学习图像和文本中隐含的关系信息,实现关系级别的特征对齐。在CUHK-PEDES数据集和ICFG-PEDES数据集上的实验结果证明,文中方法能够达到较高的识别精度。  相似文献   

16.
复杂场景语义分割任务是对场景图像逐像素进行分类并标记.图像中目标种类多,尺度多样的特点给分割任务增加了难度,提出了特征增强U形卷积神经网络(feature enhanced U shape networks,FEUNet)是一种改进的编码器加解码器的结构,编码阶段引入局部特征增强模块(local feature enhanced,LFE)提取局部感知特征来改善非显著目标的分割效果;考虑到神经网络深层和浅层之间特征表达的差异,在解码阶段利用全局池化方法(global pooling)设计全局特征增强模块(global feature enhanced,GFE),实现选择性地从深层特征图提取上下文信息作为对浅层特征图的指导,改善深层和浅层特征图的融合,保证同类像素预测的一致性.采用CamVid和Cityscapes数据集进行试验,模型mIOU测评值分别达到64.5%和73.2%,对比其他主流语义分割算法,该方法在分割性能和模型体积上具有一定竞争力.  相似文献   

17.
光场相机传感器有限的空间分辨率阻碍了光场图像处理相关研究的进展.提出一种融合全局和局部特征的光场图像空间超分辨率算法,提高了对光场子视点全局关系建模的能力.由于光场相机捕捉的图像亮度较低,严重影响了超分辨率图像的质量,提出一个改进的4D零参考深度曲线估计网络(4D Zero-DCE-Net),充分利用光场全部子视点信息来提高光场图像的亮度.为了解决光场图像空间分辨率低的问题,提出一个基于生成对抗网络的光场图像空间超分辨率网络模型.生成器包含三个部分:第一部分是Transformer和4D卷积以并行方式结合的网络结构,能以较浅的网络层捕捉图像的全局和局部细节信息;第二部分是一个交互融合注意力模块IFAM(Interactive Fusion Attention Module),能有效地融合上述两个分支得到的全局自注意力和局部细节信息;第三部分是一个重建模块PS-PA(Pixel Shuffle-Pixel Attention),能提高整个光场的空间分辨率.最后,利用相对判别器来指导生成器的训练.实验结果表明,提出的算法和其他算法相比,峰值信号比(PSNR)至少提升了1 dB.  相似文献   

18.
基于视觉Transformer的自监督模型掩码自编码器因其优秀的全局特征捕捉能力,被广泛应用于遥感图像分类领域。但该模型存在图像重建训练时局部上下文语义信息易丢失从而限制其分类精度的进一步提升。针对以上问题,本文提出了融合掩码重建和对比学习的三阶段自监督遥感图像分类新模型——对比掩码自编码器。第一阶段进行掩码重建预训练,以提取遥感图像全局特征;第二阶段则通过对比学习中的正负样本补充第一阶段掩码建模过程中丢失的局部上下文信息;最后通过训练线性分类器完成特征分类。在公开遥感图像数据集AID和NWPU-RESISC45上将本文方法与主流自监督分类方法、监督分类方法进行对比实验。实验结果表明,该模型在两个数据集上分类精度分别达到95.37%和95.14%,性能优于DINO、MoCo、SSGANs等主流自监督模型,接近GLANet、CANet、MG-CAP (Sqrt-E)等主流监督模型,具有良好的应用价值。  相似文献   

19.
提出了一种基于特征融合的人脸识别方法.该方法首先对预处理后的人脸图像进行全局特征及局部分量的提取,分别采用离散余弦交换(DCT)提取包含图像大量信息的低频部分特征和奇异值分解(SVD)抽取图像的代数特征作为图像的全局特征,采用非负矩阵分解(NMF)提取图像的局部分量特征,然后将此两类特征以独立成份分析(ICA)进行融合,获取用于人脸识别的特征向量.在本文的实验中,我们将此特征向量应用于支持向量机(SVM)进行分类训练及识别测试,并获得较好的结果.  相似文献   

20.
针对图像修复算法存在的语义不连贯、纹理不清晰等问题,提出一种基于生成对抗网络的新型级联密集生成网络CDGAN(Cascade Densely Generative Adversarial Network),采用encoder-decoder作为生成器主干,利用下采样提取图像特征;为使网络关注修复图像的高频纹理和颜色保真度等有效信息,引入级联的注意力模块,并加入密集特征融合模块扩大网络的整体感受野,充分学习图像特征,提高编码器提取特征的利用率,最后将处理后的图像特征进行上采样重建。在Celeb A和Places2数据集的测试结果表明,CDGAN在语义连贯性、纹理清晰度等方面都有所提升。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号