首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 125 毫秒
1.
为了获得卷积神经网络特征图中不同特征点之间的长距离依赖关系,使卷积神经网络更好地区分前景目标和背景信息,提出了一种具有全局特征的空间注意力机制。通过通道融合层将多通道的原始特征图组合成单通道的特征融合图,消除了通道间信息分布对获取空间注意力权重的影响;将特征融合图经过全局特征获取处理,获得能够反应特征融合图中某个特征点与特征融合图中所有点之间相关性的全局特征图;全局特征图与初始值为0的可学习变量相乘,并且通道域复制自身大小为原始特征图大小,扩展后的全局特征图与原始特征图对应元素相加,获得具有注意力机制的特征图。在不同卷积神经网络中加入具有全局特征的空间注意力机制后,实验结果:在脑电波二分类任务中,算法分类准确率最高提升了0.839%;在CIFAR-10数据集多分类任务中,算法分类准确率最高提升了0.484%;在夜间车辆单类别检测中,在交并比阈值大于0.5的平均精度值评判标准下算法最高提升了3.860%,在交并比阈值大于0.75的平均精度值评判标准下算法最高提升了11.726%;在voc2007数据集多类别检测中,在交并比阈值大于0.5的平均精度值评判标准下算法最高提升了0.778%,在交并比阈值大于0.75的平均精度值评判标准下算法最高提升了1.232%。  相似文献   

2.
单次多边界框检测器(single shot multibox detector, SSD)算法因其性能优良已被应用于许多场景中,但该算法对小目标物体的检测精度偏低,主要原因是高层的语义信息没有被充分利用。为解决该问题,文章将其基础网络替换为残差网络(residual network, ResNet),同时融合深浅层的特征信息来增强浅层特征图的语义信息,此外还引入注意力模块,保留更多的目标特征信息,抑制无关信息,进一步提升对小目标物体的检测效果。在PASCAL VOC2007数据集上进行实验测试,平均精度均值为80.2%,优于其他SSD改进算法。由于增加了特征融合和注意力模块,所提算法检测速度有所下降,但相比于SSD改进算法,检测速度仍有明显的优势。  相似文献   

3.
针对SSD多尺度目标检测过程中存在的目标漏检和错检问题,提出了一种融入多维空洞卷积和多尺度特征融合的目标检测算法。在卷积神经网络输出的多尺度特征中,浅层具有更多的细节信息,深层具有更多的语义信息,根据这一特点,对浅层网络采用了3种多维空洞卷积的浅层特征增强模块,获得具有语义信息的特征图,将增强后的特征图进行下采样,融合不同层的特征;同时在深层网络引入通道注意力模块,对通道进行权重分配,抑制无用信息,提高目标的检测性能。研究结果表明:该算法在PASCAL VOC数据集上检测精度为79.7%,比SSD算法提高了2.4%;在KITTI数据集上检测精度为68.5%,比SSD算法提高了5.1%,检测速度达到了实时性的要求,有效地改善了目标的漏检和错检。  相似文献   

4.
在小目标物体检测、多类别物体检测尤其是轻量化检测模型等关键技术研究方面仍面临较大的挑战,基于此,本文提出一种轻量化自适应特征选择目标检测网络.该网络以特征金字塔为基础,提取多尺度图像特征并从空间维度上对特征图进行滤波,从通道维度上自适应地选择特征图中更重要的通道,降低多通道下噪声和干扰对目标特征的稀释作用,减少特征图在传递过程中的信息丢失.除此之外,构建深度可分离卷积的分类网络,降低后续处理的计算量,加快检测速度,实现网络的轻量化处理.在PASCAL VOC 2007数据集上的检测平均精度为77.7%,检测速度为14.3帧/s.在MS COCO数据集上的测试结果表明,该网络在精度损失小于5%的情况下,检测速度远超FPN,比Mask R-CNN可以更好地兼顾检测速度和检测精度.  相似文献   

5.
无人机技术的不断成熟,使得搭载高效视觉系统的无人机应用也更加广泛。针对无人机航拍图像中小目标较多、分辨率低等原因导致的检测精度不高的问题,提出了一种改进RetinaNet的无人机航拍目标检测算法。算法针对特征图中小目标信息提取不足的问题,设计了多阶段特征融合方法,并将其与注意力机制串联设计了特征挖掘模块,可以在浅层特征图中融入深层的语义信息,丰富小目标特征;设计了基于中心点检测的无锚框(Anchor-free)方法,网络通过对中心点的回归来定位目标,而不是通过固定大小的锚框去匹配,这样做可以使网络对小目标的回归更加灵活,提高了算法的整体性能;且通过深度可分离卷积方法对网络进行轻量化设计,以压缩模型大小并提高检测速度。实验结果表明,改进算法较原RetinaNet算法平均精度提升了8.5%,检测速度提升了6帧/s,且与其他先进算法相比也具有性能优势,达到了检测精度与检测速度的均衡。  相似文献   

6.
图像语义分割模型在提取特征的过程中由于不断的下采样使得空间位置丢失,分割效果较差,针对该问题,提出了融合空间和通道注意力多级别特征来构造学习网络的方法。首先针对具有高级别特征的语义信息路径引入了通道注意力模块,在预训练模型Resnet101提取的特征图上,显式地建模通道之间的相互依存关系,确定每层特征图上需要重点关注的内容,协助完成目标识别任务;其次针对具有低级别特征的空间信息路径引入空间注意力模块,在保留了丰富空间信息的特征图上提取空间注意力矩阵,并将提取的空间注意力矩阵作用于语义信息路径的相应特征图上,以确定需要重点关注的位置,协助完成目标定位任务。最后在CamVid数据集上进行实验,所提方法具有良好表现。  相似文献   

7.
高分辨率遥感图像场景分类广泛应用于土地监测、环境保护及城市规划等诸多领域.现有场景分类方法不能很好地结合局部纹理信息和全局语义信息,同时各通道特征之间的关系没有得到有效挖掘.因此,本文提出了一种基于多通道自注意力网络的遥感图像场景分类模型.通过卷积网络提取遥感图像的多尺度特征;随后采用特征融合单元建立多尺度特征间的局部-全局关系,基于多头自注意力机制的Inter-Channel Transformer在通道维度对融合后的特征建模,并推导特征在通道间的关系,进一步扩大全局感受野,以捕捉其语义结构信息,有效提高了网络的分类精度.在数据集AISC和SIRI-WHU上,本文所提算法的整体分类准确率(OA)分别为95.70%和94.00%,超过了当前最新的研究算法,证明了所提模型在高分辨率遥感图像场景分类任务中的有效性.  相似文献   

8.
针对安全帽佩戴检测时易受复杂背景干扰,解决YOLOv4网络检测速度慢、内存消耗大、计算复杂度高、对硬件性能要求较高等问题,引入改进YOLOv4算法优化安全帽佩戴检测方法。引入MobileNet网络轻量化YOLOv4、跨越模块特征融合,实现高层语义特征和低层语义特征有效融合。针对图像中小目标分辨率低,信息特征少,多尺度并存,导致在连续卷积过程中易丢失特征信息等问题,采用改进特征金字塔FPN和注意力机制等颈部优化策略聚焦目标信息,弱化安全帽检测时背景信息的干扰。仿真结果表明,基于改进的YOLOv4颈部优化网络安全帽佩戴检测算法在CPU平台下的检测速度为34.28 FPS,是基础YOLOv4网络的16倍,检测精度提升了4.21%,检测速度与检测精度达到平衡。  相似文献   

9.
在目标检测算法中,尺度变化是目标检测的关键问题之一.针对不同目标拥有不同尺度的问题,构建一个三分支网络,生成能表示对应尺度的特征图,每个分支对应特定的感受野,分别负责检测大、中、小物体.通过筛选合适尺度的对象实例进行训练,保持各分支的尺度不变性.为保证小物体的检测效果,没有对检测小物体的分支采用下采样,同时使用膨胀卷积增加语义信息;检测大物体的分支则采用更大膨胀率的膨胀卷积,扩大感受野,获得更多的语义信息.在保证尺度不变性的情况下,特征融合必不可少,因此使用多尺度融合的思想,在不影响并行的三分支网络的情况下,对低层特征与高层特征进行了选择性融合.  相似文献   

10.
针对点云分割中分割目标不明确,边缘不清晰,全局特征与边缘特征未能有效融合等问题,提出 了一种融合边缘检测的 3D 点云语义分割算法。 首先,通过 3D 点云语义分割网络对点云数据进行初步提取 区域内的全局语义特征;然后,采用引入了注意力机制的语义边缘检测网络,能够更好地对点云数据中的物 体进行特征提取增强,抑制非边缘信息的产生,得到了具有丰富的语义信息的边缘特征;最后,通过融合模块 将属于同一物体的语义特征融合起来进行分割细化处理,使得分割目标更精确;此外,使用了双重语义损失 函数,使网络产生具有更好边界的语义分割结果。 通过搭建实验平台和使用 S3DIS 标准数据集进行测试,改 进后的算法在数据集上的平均交互比为 70. 21%,在精度上较 KPConv 语义分割算法有所提高。 实验结果表 明:该算法能够有效改善物体边界分割不清晰、边缘信息模糊等问题,总体分割性能良好。  相似文献   

11.
基于改进YOLOv3的交通标志检测   总被引:2,自引:0,他引:2       下载免费PDF全文
针对交通标志检测小目标数量多、定位困难及检测精度低等问题,本文提出一种基于改进YOLOv3的交通标志检测算法.首先,在网络结构中引入空间金字塔池化模块对3个尺度的预测特征图进行分块池化操作,提取出相同维度的输出,解决多尺度预测中可能出现的信息丢失和尺度不统一问题;然后,加入FI模块对3个尺度特征图进行信息融合,将浅层大特征图中包含的小目标信息添加到深层小特征图中,从而提高小目标检测精度.针对交通标志数据集特点,使用基于GIoU改进的TIoU作为边界框损失函数替换MSE函数,使得边界框回归更加准确;最后,通过k-means++算法对TT100K交通标志数据集进行聚类分析,重新生成尺寸更小的候选框.实验结果表明,本文算法与原始YOLOv3算法相比mAP提升11.1%,且检测每张图片耗时仅增加6.6 ms,仍符合实时检测要求.与其他先进算法相比,本文算法具有更好的检测精度和检测速度.  相似文献   

12.
针对SSD目标检测算法运用于自动驾驶领域时,在检测道路上小目标容易发生漏检错检的情况,本文提出一种改进的SSD目标检测算法。本算法首先在SSD模型的主干网络中嵌入感受野增强模块,扩大特征层的感受野,以获取更多小目标的特征信息;然后在主干网络后加入4次U型特征提取结构,构建4个不同层级的特征金字塔,最后合并成一个多层级特征金字塔用于检测。结果表明,该改进SSD模型在KITTI数据集上的检测精度较原始SSD模型提升了6%,检测速度达到了每秒27.9帧。在兼顾检测效率的同时,有效提高了对道路上小目标的检测精度,更适用于自动驾驶领域。  相似文献   

13.
针对遥感图像中的小目标存在信息少、易受背景干扰、特征表达较弱等缺陷, 导致目前通用目标检测算法在对这类小目标进行检测时效果不理想的问题, 为提高对遥感图像中小目标的检测能力, 提出一种基于RFBNet的改进算法. 该算法以RFBNet为框架, 首先利用自校正卷积取代特征提取网络中的常规卷积, 以扩展感受野丰富输出, 进而强化对弱特征的提取能力; 然后设计多尺度特征融合模块, 丰富浅层特征图的抽象信息; 最后设计稠密预测模块, 提前在较浅层整合上下文信息, 使最后阶段的每层输出都含有丰富且联系紧密的多尺度特征信息. 将该算法在数据集UCAS_AOD和NWPU VHR-10上进行实验, 平均检测精度分别达83.4%和94.8%. 实验结果表明, 该算法有效提高了遥感图像中目标检测的精度, 且针对遥感图像中的小尺度目标检测问题改善明显.  相似文献   

14.
为了有效改善现有人脸表情识别模型中存在的信息丢失严重、组件间相对空间联系不密切的问题,提出了一种改进的多尺度卷积神经网络模型,通过构建深层多尺度卷积神经网络,使模型能够挖掘出更多潜在的特征信息;通过特征融合促进信息的流通和重利用,减少池化操作所引起的重要信息丢失,使得模型具有更好的学习能力;通过控制每层多尺度卷积神经网...  相似文献   

15.
针对输电通道下施工车辆与输电线之间距离难以计算、工程车辆检测精度较低等问题,提出一种改进Mask RCNN的工程车辆分割算法.首先将特征提取网络中的卷积替换为动态卷积,使网络训练时可以根据输入图像及时调整卷积核的大小,有效提高模型性能;然后在网络中添加NAM注意力机制,提高网络对工程车辆的关注度;最后修改特征融合网络为ssFPN,防止特征融合时信息丢失,加强语义融合,提高模型检测精度.对比试验结果表明,与改进前基于ResNet50的Mask RCNN算法相比,改进后算法提高了对工程车辆的检测精度,mAP提高了4.1%,后续处理得到的车辆轮廓精确,证明了改进后算法的有效性.  相似文献   

16.
在电力线无人机自动巡检中,电力线边缘检测对提高输电线路检测精度有重要作用。目前,常用的RCF(Richer Convolutional Features for edge detection)算法在复杂背景下检测电力线时存在边缘模糊、在较低阶段产生的特征图包含太多噪声并在融合特征图时丢失多尺度信息等问题。对此,本文对RCF算法进行改进:1)使用具有平移不变性的下采样技术增强模型的鲁棒性;2)在RCF主干网络中引入CBAM(Convolutional Block Attention Module)机制,提高模型对电力线特征的表达能力;3)在RCF的侧输出网络中加入级联网络,借助基于通道注意力机制的多尺度特征融合模块对特征图进行融合,从而获得更优异的细节保持效果。实验结果表明:改进模型的最优数据集规模(Optimal Dataset Scale)、最佳图像比例(Optimal Image Scale)和平均精度(Average Precision)分别提高了0.7%、1.3%和1.7%,改进模型的检测结果噪声数量少、电力线更加清晰准确。  相似文献   

17.
针对YOLOv4算法在行人检测中精度低,实时性差的问题,提出一种基于YOLOv4的改进算法。首先将MobileNetv2作为主干网络,在减少参数量的同时保证其特征提取能力,同时在MobileNetv2中加入Bottom-up连接,减少浅层信息的丢失;然后在特征融合网络嵌入CBAM注意力机制,增强特征的表现力;最后在分类与回归网络中加入Inception结构,进一步提高检测速度和增加网络复杂度。实验表明:在VOC数据集上,改进算法比原算法检测效果更佳,实时性更好,其精度提高了2.87%,处理速度提升了29.52FPS;同时在真实场景下构建的数据集上,改进后的算法比YOLOv4精度提高了2.13%,具有较好的鲁棒性。  相似文献   

18.
基于深度学习的场景文本检测普遍缺少特征级的精细化,导致原本设计良好的模型不能被充分利用,提出将特征融合和特征金字塔注意力模块应用到场景文本检测.将基本特征提取网络(PixelLink算法)得到的4个特征映射层以采样后加权叠加的方式进行特征融合,并将结果送给特征金字塔注意力模块.特征融合使各层级的特征信息相结合,从而增加...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号