首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
针对ResNet50和FPN结构无法将浅层的细节信息和深层的语义信息充分融合利用等问题,提出了一种改进ResNet50和FPN结构的算法,在ResNet50网络结构不同层次中引入了改进的通道和空间注意力模块,充分利用不同特征层的细节信息和语义信息。此外,在FPN结构中,为了能让浅层特征层更好的利用深层特征层的语义信息,在FPN自上而下的路径中,不同特征层之间增加了旁路来加强特征的重用。实验结果表明,在MS COCO数据集训练以后在PASCAL VOC 2012测试的均值平均精度(mAP)达到了83.2%,提升了2.7%,在MS COCO数据集上的mAP提升了1.5%,具有不错的检测性能。  相似文献   

2.
现有基于卷积神经网络的无约束人脸表情识别方法侧重于网络结构的设计,对网络学习到的通道间深层特征相关性的研究较少,没有充分利用神经网络提取表达力较强的特征。为解决此问题,设计了一种基于二阶有效通道注意力网络(second-order efficient channel attention network,SECA-Net)的无约束人脸表情识别方法。该方法采用轻量级的网络提取表情图像的深层特征,使用二阶有效通道注意力模块统计深层特征的二阶信息并捕捉跨通道特征间的依赖关系来自适应地缩放通道特征,进而获得更具判别力的表情特征。SECA-Net利用Softmax损失和中心损失联合优化模型进行表情分类,该模块具有较少的参数量、较低的显存需求和计算量,并且没有使用额外的数据预训练模型。同时,所提出的模块还能提取到人脸表情微小变化的局部特征。在RAF-DB和FER-2013无约束人脸表情数据集上的实验结果表明,提出的方法是有效的。  相似文献   

3.
人脸阴影检测通常作为人脸图像相关任务的预处理步骤,避免阴影带来干扰。提出基于深度学习的人脸阴影检测方案,在解决方案中,首先根据光照和人脸结构信息,对耶鲁人脸数据库中1 600张光照不均匀人脸图像的阴影区域进行标注,构建人脸阴影检测数据集;之后设计基于嵌套U-Net结构和注意力模块的人脸阴影检测网络,嵌套U-Net结构被用于提取图像的高分辨率信息和全局特征,注意力模块被用于融合各个嵌套U-Net的输出,同时抑制低阶子层带来的噪声信息;最后在标注的人脸检测数据集上对网络进行了评估,实验结果表明,所提方法的平均检测错误率比对照组中最优方案降低了14.2%,可以有效地检测图像中的小面积阴影,并提供更精确的阴影边缘定位。  相似文献   

4.
针对小目标物体检测精度差的问题,同时不以牺牲速度为代价,本文提出了一种基于全局注意力的多级特征融合目标检测算法。算法首先由卷积神经网络生成多尺度的特征图,然后采用多级特征融合的方法,将浅层和深层特征图的语义信息相结合,提高特征图的表达能力,接着引入全局注意力模块,对特征图上下文信息进行建模,并捕获通道之间的依赖关系来选择性地增强重要的通道特征。此外,在多任务损失函数的基础上增加一项额外的惩罚项来平衡正负样本。最后经过分类回归、迭代训练和过滤重复边框得到最终检测模型。对所提算法在PASCAL VOC数据集上进行了训练和测试,结果表明该算法能有效地提升小目标物体检测效果,并较好地平衡了检测精度与速度之间的关系。  相似文献   

5.
针对图像语义分割中,存在细节信息丢失、分割类别边缘模糊而粗糙的问题,在编码解码结构的基础上,结合残差模块和注意力机制,设计一种残差注意力模块.通过注意力机制加强特征图通道之间的联系,以提升语义分割的细腻度.为提高模型对多尺度物体的识别能力,结合金字塔模型,设计一种金字塔上采样模块.利用编码过程中产生的不同尺度的特征图,...  相似文献   

6.
针对泡沫图像的高度复杂性导致其难以被准确分割的难题,本文提出了一种新的I-Attention U-Net网络用于泡沫图像分割.该算法以U-Net网络作为主干网络,使用Inception模块替换第一卷积池化层来提取泡沫图像的多尺度、多层次浅层特征信息;引入金字塔池化模块,通过对不同尺度的特征图求和来提升分割效果;并对自注意力门控单元进行改进,使注意力单元更适合于浮选泡沫图像的分割,强化深层特征的重要性并对不同尺寸的泡沫边界进行强化学习.研究结果表明:本文所提出算法的Jaccard系数为91.73%,Dice系数为95.66%.与同类其他分割算法结果相比,Jaccard系数及Dice系数分别提高了1.59%、0.88%.该模型能够较好地对锌浮选泡沫图像进行分割,解决欠分割与过分割的问题,为后续的泡沫特征提取奠定基础.此外,该方法检测时间和模型参数少,具备可以部署在工业现场计算机的能力,有一定的实际应用价值.  相似文献   

7.
本研究针对现有图像修复方法不能有效地分离结构和纹理信息,修复结果往往会出现边界模糊、结构扭曲等伪影问题,提出了基于潜在特征重构和注意力机制的人脸图像修复方法。人脸图像修复方法分为两阶段,第一阶段,通过结构重建器网络提取样式向量,按照StyleGAN所述的原理分为粗尺度特征、中尺度特征和精细特征三组,插入到预先训练好的StyleGAN生成器中,产生初步的修复结果;第二阶段通过构建纹理生成网络并使用上下文注意力机制,注意力分数由注意力计算模块计算,注意力转移模块根据较高级别特征图和注意力分数来填充较低级别特征图中的对应缺失区域,以细化上一阶段初步的人脸修复结果。在CelebA-HQ数据集上的训练并进行测试,本文的方法在定量和定性分析两个方面均优于现有方法。因此,基于潜在特征重构和注意力机制的人脸图像修复方法能够有效地修复缺损人脸图像,大大减少了边界过度平滑和存在纹理伪影的问题。  相似文献   

8.
采用加强特征提取网络为MobileNetV2的融合多特征金字塔场景解析网络(PSPnet)来实现复杂场景下的图像语义分割.相对于深度残差网络ResNet50和MobileNetV1,引入了线性瓶颈结构和反向残差结构,利用金字塔池化模块(PPM)来处理不同层级的图像特征信息,并将其进行特征拼接,有效避免了不同分割尺寸下,子区域之间关键特征信息的缺失.在此基础上,引入注意力机制模块,结合通道注意力机制(CAM)和空间注意力机制(SAM),进一步提高分割精度.实验结果表明:该方法可以提高图像识别的准确率,并节省训练时间.  相似文献   

9.
注意力机制能够挖掘与任务密切相关的重要信息并抑制非重要信息,在语义分割的深层特征表示中发挥着越来越重要的作用。本研究基于广泛应用的U-Net模型,提出了一种基于注意力机制的神经网络模型,针对边缘分割模糊的问题,将U-Net的压缩路径和扩展路径中的双卷积替换为卷积核选择模块,该模块允许网络的每一层根据输入信息进行自适应调整接受野的大小;另外,针对人像分割网络存在不同尺度的全局上下文信息被忽略的问题,采用多尺度预测融合的方法来利用不同尺度的全局信息,并采用双注意力模块汇总空间和通道两方面的注意力信息。大量实验表明,本文中方法的性能与U-Net、UNet++和Attention U-Net等网络相当或更好。  相似文献   

10.
当前政务领域中涵盖大量复杂异构表格,其结构检测困难,识别准确率较低并且单元格边缘拟合效果较差.针对该问题,在掩膜区域卷积神经网络(Mask R-CNN)的基础上,以政务表格单元格结构为对象,提出一种改进的政务表格单元格结构检测方法 .首先,在Mask R-CNN算法的主干网络及特征金字塔中加入通道注意力机制,增强有效特征通道权重;然后,对分割产生的掩膜结果使用基于规则和形态学方法进行优化以提升单元格分割边缘拟合度.实验结果表明:改进后的表格单元格结构检测模型在此数据集G-Tab及公开表格数据集ICDAR2013上的精确率和召回率都有明显提升,能够验证改进模型的有效性.  相似文献   

11.
针对当前卷积神经网络未能充分利用浅层特征信息, 并难以捕获各特征通道间的依赖关系、 丢失高频信息的问题, 提出一种新的生成对抗网络用于图像超分辨率重建. 首先, 在生成器中引入WDSR-B残差块充分提取浅层特征信息; 其次, 将GCNet模块和像素注意力机制相结合加入到生成器和鉴别器中, 学习各特征通道的重要程度和高频信息; 最后, 采用谱归一化代替不利于图像超分辨率的批规范化, 减少计算开销, 稳定训练. 实验结果表明, 该算法与其他经典算法相比能有效提高浅层特征信息的利用率, 较好地重建出图像的细节信息和几何特征, 提高超分辨率图像的质量.  相似文献   

12.
针对以往剩余使用寿命(RUL)预测方法均等对待深层特征中具有不同重要性的空间域和通道域特征,导致大量的计算资源浪费在不重要的特征上,进而造成RUL预测值偏差过大、不能对失效设备进行及时的维护以避免潜在的安全隐患的问题,提出一种采用残差网络与卷积注意力机制的端到端的RUL预测方法。该方法以卷积层和池化层对原始监测信号进行浅层特征提取与压缩;利用堆叠残差模块在学习深层特征的同时,缓解梯度弥散以及网络退化现象的发生;由卷积注意力模块对设备的深层退化特征进行加权赋值,分别在其空间维度上和通道维度上强化更重要的特征并抑制相对不重要的特征,使网络的注意力集中在对RUL预测任务更关键的信息上;将加权后的特征输入到全连接网络中映射得到RUL预测值。通过PHM2012轴承数据集进行了实验验证,实验结果表明,卷积注意力和残差结构皆对改善模型的预测性能有着积极的作用,所提方法在测试轴承上的均方根误差和平均绝对误差分别为0.107 9和0.083 1,远低于其他对比方法。  相似文献   

13.
针对当前深度神经网络在处理遥感影像语义分割过程中存在的模型庞大、处理耗时长、实时性低、小目标分割准确率不高的问题,提出了一种嵌入多重注意力机制的Multi-AttnDeepLabv3+(Multiple Attentionbased on DeepLabv3+)语义分割模型.该模型在编码部分使用轻量神经网络作为主干特征提取网络,加入混合注意力机制增强重要特征通道和空间像素的权值比重;在解码部分,在特征融合过程中加入通道压缩激活注意力模块,通过压缩激活操作再次增强重要特征通道的权重,提升模型分割准确率.该模型在多个数据集上取得较好的实验结果 .在相同条件下,此模型训练速度较传统网络模型有明显提升.与同类型轻量级语义分割模型相比,该模型在提升分割效果上具备优势.  相似文献   

14.
针对SSD多尺度目标检测过程中存在的目标漏检和错检问题,提出了一种融入多维空洞卷积和多尺度特征融合的目标检测算法。在卷积神经网络输出的多尺度特征中,浅层具有更多的细节信息,深层具有更多的语义信息,根据这一特点,对浅层网络采用了3种多维空洞卷积的浅层特征增强模块,获得具有语义信息的特征图,将增强后的特征图进行下采样,融合不同层的特征;同时在深层网络引入通道注意力模块,对通道进行权重分配,抑制无用信息,提高目标的检测性能。研究结果表明:该算法在PASCAL VOC数据集上检测精度为79.7%,比SSD算法提高了2.4%;在KITTI数据集上检测精度为68.5%,比SSD算法提高了5.1%,检测速度达到了实时性的要求,有效地改善了目标的漏检和错检。  相似文献   

15.
针对高分辨率眼部图像的瞳孔、虹膜特征快速识别与检测问题,提出了一种轻量化语义分割网络DIA-UNet (double input attention UNet).它采用对称双编码结构同步获取眼部灰度图及其轮廓图特征,并通过双注意力机制实现了解码端的特征筛选,将深层融合特征作为语义分割输出.在CASIA-Iris-Interval和高分辨率瞳孔数据集上测试结果表明,与其他轻量化语义分割网络相比,本文提出的DIA-UNet在保证虹膜、瞳孔分割准确率的同时网络参数个数仅有0.076 Million,处理速度高达123.5 FPS.   相似文献   

16.
人脸图像修复旨在修复输入人脸图像中的缺失区域,生成令人满意的高质量修复结果.然而当存在大面积缺失时,直接修复缺失人脸图像十分困难,此时修复网络的全局上下文信息感知能力是影响修复结果的关键.鉴于此,本文提出了软硬注意力相结合的双重自注意力模块.该模块通过全局相似度计算来获得软硬两种注意力特征,之后对两种注意力特征进行自适应融合,进而提高修复网络对全局上下文信息的感知能力.此外,本文进一步提出了多尺度生成对抗网络以加强对修复结果的监督,促使修复网络生成更高质量的修复结果.实验结果表明,本文方法在定量和定性评测上均优于五种先进的对比方法.  相似文献   

17.
为了提高基于深度学习网络方法在真实图像上的复原效果,提出了一种基于多尺度残差注意网络的复原方法。将退化图像输入到该模型中,利用浅层特征网络提取原始低质量图像的浅层特征;利用残差注意网络模块提取深层特征信息和通道相关性,使用局部连接和短跳跃连接进行残差学习;将浅层特征、通道相关性以及上下文深层特征信息输入到重构网络,利用具有不同感受野的特征进行图像复原。实验结果表明,相较于其他对比方法,该方法在图像去噪、图像增强和超分辨率等多个任务中获得最优的结果,能够在不引入伪影的情况下生成纹理细节丰富的清晰图像。  相似文献   

18.
为规范工人生产行为、减少安全事故发生,提出一种监控工人使用手机行为检测算法.该算法以YOLO v5模型为基础,对其网络结构和损失函数进行改进.首先,优化主干网络,将ConvNeXt Block和SPP结构引入浅层网络增加浅层特征的提取;然后,在主干网络与特征聚合网络之间构建CBAM注意力机制层,过滤冗余信息;最后,选取EIoU损失函数代替GIoU损失函数,提高模型收敛速度与检测结果的定位精度.通过自建工人使用手机行为数据集,分别对YOLO v5原模型、改进模型以及主流模型进行对比.试验结果表明,在人体和手机目标检测中,改进模型有更好的检测精度和检测速度.  相似文献   

19.
图像融合利用了红外与可见光图像在时空上的相关性及信息上的互补性,让图像更有利于人眼的识别和机器的自动探测。现有的方法许多都存在伪影或目标信息模糊的情况,针对这些问题本文提出了一种带有残差块的编码器融合框架以提取红外与可见光图像中的深层特征;为了更好地融合红外光图像的目标信息和可见光图像所包含的细节信息,在特征融合阶段加入注意力机制得到注意力图对深层特征进行融合;最后通过跳跃连接将第一二层得到的特征图,即浅层特征传递到相应的反卷积层进行处理,得到融合图像。实验结果表明,本文方法的融合结果在主观感觉上更清楚,且在平均梯度、空间频率、结构相似性和峰值信噪比等客观指标上取得了比现有方法更好的结果。  相似文献   

20.
计算机断层扫描(CT)产生的辐射风险已成为公众关注的问题.降低剂量将影响CT图像的质量以及医生的诊断结果.传统的基于深度网络算法中,同一层中的特征通道间的地位是平等的,影响信息的提取.为此,提出了一种具有注意力机制的U-Net残差网络.在U-Net中引入通道注意力模块驱使网络将更多的注意力集中于含有噪声和伪影信息的通道...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号