首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 171 毫秒
1.
研究基于传统FCN算法下的不同比例的多尺度特征融合对于复杂场景下道路提取准确度的提高.针对复杂的航拍道路场景,设计了针对于农田环境下的FROBIT农田道路数据集,并使用全卷积神经网络(FCN)对FROBIT农田道路数据集和Massachusetts城市道路数据集进行道路提取工作.本文基于传统的FCN的网络,对其反卷积方式进行改进,采用粒子群算法(PSO)设计了不同比例的多尺度特征融合.通过将本文提出的Multi-Scale FCN网络与传统的FCN神经网络在FROBIT数据集和Massachusetts道路数据集上进行对比实验,结果表明Multi-Scale FCN网络相比于传统的FCN神经网络在提取精度上得到了提高.   相似文献   

2.
针对神经网络的显著性区域预测存在数据采集代价大、处理繁琐等问题,提出2种卷积神经网络,即从头开始训练的浅层卷积神经网络,以及前三层源自另一个网络的深层卷积神经网络。其中,浅层网络结构简单,可避免过拟合问题;深层网络可以充分利用最底层的模型参数,收敛更快,效果更好。所提卷积神经网络应用于回归问题,均没有直接训练特征图的线性模型,而是在迁移层上训练了一堆新的卷积层。从端到端的角度解决显著性预测,将学习过程演化为损失函数的最小化问题。测试和训练在SALICON,SUN和MIT300数据集上进行,实验结果验证了所提方法的有效性。其中,深层网络和浅层网络在SALICON和SUN数据上的结果相似,深层网络在MIT300上的结果更优,与其他方法相比,所提方法具有不错的表现,而且具有跨数据集的鲁棒性。  相似文献   

3.
全卷积神经网络(FCN)在许多密集标记任务中表现出色。最近,基于FCN的显著性物体检测模型得到了快速发展。在本文中,提出了一种基于FCN的像素级显著物体检测网络。该模型首先通过自动学习多层次多尺度的显著性特征进行显著性粗略预测,包括颜色、纹理、形状和物体性等特征。然后采用密集连接的特征提取模块来进一步提取更丰富的特征信息。此外,本文引入跳层结构以提供更好的特征表示,利用深层产生的物体性语义特征引导浅层输出的显著性图更好定位显著性对象,最后,网络使用加权融合模块以组合各种特征。为了进一步提高显著图的空间连贯性并生成清晰轮廓,本文采用条件随机场(CRF)模型作为后处理步骤以优化网络预测得到的加权显著性图。整个网络以粗糙到精细的方式进行显著性检测,在5个公开的常用基准数据集上进行性能评估,并与10个具有代表性的算法进行比较,证明了本文所提模型的稳健性和有效性。  相似文献   

4.
针对小目标物体检测精度差的问题,同时不以牺牲速度为代价,本文提出了一种基于全局注意力的多级特征融合目标检测算法。算法首先由卷积神经网络生成多尺度的特征图,然后采用多级特征融合的方法,将浅层和深层特征图的语义信息相结合,提高特征图的表达能力,接着引入全局注意力模块,对特征图上下文信息进行建模,并捕获通道之间的依赖关系来选择性地增强重要的通道特征。此外,在多任务损失函数的基础上增加一项额外的惩罚项来平衡正负样本。最后经过分类回归、迭代训练和过滤重复边框得到最终检测模型。对所提算法在PASCAL VOC数据集上进行了训练和测试,结果表明该算法能有效地提升小目标物体检测效果,并较好地平衡了检测精度与速度之间的关系。  相似文献   

5.
为规范工人生产行为、减少安全事故发生,提出一种监控工人使用手机行为检测算法.该算法以YOLO v5模型为基础,对其网络结构和损失函数进行改进.首先,优化主干网络,将ConvNeXt Block和SPP结构引入浅层网络增加浅层特征的提取;然后,在主干网络与特征聚合网络之间构建CBAM注意力机制层,过滤冗余信息;最后,选取EIoU损失函数代替GIoU损失函数,提高模型收敛速度与检测结果的定位精度.通过自建工人使用手机行为数据集,分别对YOLO v5原模型、改进模型以及主流模型进行对比.试验结果表明,在人体和手机目标检测中,改进模型有更好的检测精度和检测速度.  相似文献   

6.
针对SSD多尺度目标检测过程中存在的目标漏检和错检问题,提出了一种融入多维空洞卷积和多尺度特征融合的目标检测算法。在卷积神经网络输出的多尺度特征中,浅层具有更多的细节信息,深层具有更多的语义信息,根据这一特点,对浅层网络采用了3种多维空洞卷积的浅层特征增强模块,获得具有语义信息的特征图,将增强后的特征图进行下采样,融合不同层的特征;同时在深层网络引入通道注意力模块,对通道进行权重分配,抑制无用信息,提高目标的检测性能。研究结果表明:该算法在PASCAL VOC数据集上检测精度为79.7%,比SSD算法提高了2.4%;在KITTI数据集上检测精度为68.5%,比SSD算法提高了5.1%,检测速度达到了实时性的要求,有效地改善了目标的漏检和错检。  相似文献   

7.
针对目标跟踪过程存在的动态不确定性的问题,传统跟踪方法容易产生目标漂移甚至跟踪失败,而基于深度学习的跟踪算法随着网络结构的加深容易导致深层特征过于稀疏抽象,不利于克服上述问题.为此,本文提出SiamMask三分支网络融合注意力机制的孪生网络目标跟踪新方法,旨在加强网络对特征选取的学习能力,加强目标有效特征的抽取,并减少冗余信息对网络负担的影响.特征提取主干网络选用改进的Resnet-50,通过融合深层和浅层特征,实现跟踪目标特征的有效表达.利用4个数据集(COCO、ImageNet-DET 2015、ImageNet-VID 2015、YouTube-VOS)对提出的特征融合孪生网络框架进行训练,并使用VOT数据集进行在线测试.实验表明:与文中其他跟踪方法相比,该算法在面对动态目标尺度变化、环境光照、运动模糊等场景表现更优异.  相似文献   

8.
针对经典U型卷积网络在细胞核分割过程中对距离相近目标的边界较难区分、对模糊目标产生误识别等问题,提出一种改进的U型卷积网络(DU-Net)模型。为增强目标边界特征,提出一种梯度融合方法,计算样本梯度信息并将梯度图多尺度融合至U-Net编码器。解码器浅层特征通过卷积上采样密集连接至深层特征,增加特征的复用性。针对梯度消失问题,DU-Net模型在每个卷积层后采用批归一化和ReLU激活结构。针对经典U-Net模型对模糊目标的误识别问题,提出一种改进的交叉熵损失函数,该损失函数降低了模糊背景点对模型的干扰,同时提高了模型对小目标的识别能力。在2018年数据科学碗公布的670张图片、约29 500个细胞核的公开数据集上验证了DU-Net模型,结果表明,模型的预测结果与真实标签在Dice系数和Jaccard相似系数两项评价指标上分别达到95.9%和91.0%,性能优于U-Net和SegNet编码器,显著优于经典卷积神经网络模型FCN-8s。  相似文献   

9.
针对ResNet50和FPN结构无法将浅层的细节信息和深层的语义信息充分融合利用等问题,提出了一种改进ResNet50和FPN结构的算法,在ResNet50网络结构不同层次中引入了改进的通道和空间注意力模块,充分利用不同特征层的细节信息和语义信息。此外,在FPN结构中,为了能让浅层特征层更好的利用深层特征层的语义信息,在FPN自上而下的路径中,不同特征层之间增加了旁路来加强特征的重用。实验结果表明,在MS COCO数据集训练以后在PASCAL VOC 2012测试的均值平均精度(mAP)达到了83.2%,提升了2.7%,在MS COCO数据集上的mAP提升了1.5%,具有不错的检测性能。  相似文献   

10.
针对传统神经网络在人脸图像的训练过程中没有将高低卷积层信息进行融合,为充分利用图像各层特征信息,提出一种基于三层特征融合的全连接卷积神经网络模型,算法将原有网络最后三层特征结合,并将提取的特征信息与最后一层全连接层结合,从而增加了浅层特征的表达,加强了深层特征的提取效果,促使改进后的卷积神经网络提取的信息更加完备;同时将损失函数和中心函数加权联合,以提高人脸图像的识别率和区分性.在CASIA-webface人脸数据库进行的实验结果表明,改进后的网络模型识别率达到98. 7%,优于DCNN等算法,并将训练好的网络模型应用到YALE、PERET、LFW-A等人脸库上,相比其他方法识别率都有所提升.  相似文献   

11.
为辅助医生检测大量肺部CT( Computed Tomography) 图像中难以发现的肺结节的问题,提出使用深度U-Net网络对肺部结节进行分割。由于U-Net 网络出自于全卷积网络( FCN: Full Convolution Network) ,特点是端到端,像素到像素,网络对每个像素点进行分类,能将深层特征抽象的特征信息和浅层特征具象的位置信息相结合得到CT 图像的分割掩膜。实验结果表明,该方法对肺结节的检测效果良好。  相似文献   

12.
基于深度学习的去噪技术,通过考虑视觉伪影和整体平滑噪声,提高了图像的质量.然而,它们很少涉及边缘细节的恢复.为此,本文提出了一种基于双域信息的深度残差网络去噪模型,利用小波域信息与空间域信息的融合来扩展网络学习信息,通过在激活单元内引入多尺度学习和空洞卷积,以此提取图像特征,并减少了网络参数.为了进一步改善去噪结果,结合小波域损失和空间域损失构造联合损失函数,使得网络获取更多的边缘与细节.实验结果表明,本文提出的方法不仅可以有效去除图像噪声,而且可以更好地恢复图像纹理细节,在主观和客观评价中均获得了更好的结果.  相似文献   

13.
基于改进YOLOv3的交通标志检测   总被引:2,自引:0,他引:2  
针对交通标志检测小目标数量多、定位困难及检测精度低等问题,本文提出一种基于改进YOLOv3的交通标志检测算法.首先,在网络结构中引入空间金字塔池化模块对3个尺度的预测特征图进行分块池化操作,提取出相同维度的输出,解决多尺度预测中可能出现的信息丢失和尺度不统一问题;然后,加入FI模块对3个尺度特征图进行信息融合,将浅层大特征图中包含的小目标信息添加到深层小特征图中,从而提高小目标检测精度.针对交通标志数据集特点,使用基于GIoU改进的TIoU作为边界框损失函数替换MSE函数,使得边界框回归更加准确;最后,通过k-means++算法对TT100K交通标志数据集进行聚类分析,重新生成尺寸更小的候选框.实验结果表明,本文算法与原始YOLOv3算法相比mAP提升11.1%,且检测每张图片耗时仅增加6.6 ms,仍符合实时检测要求.与其他先进算法相比,本文算法具有更好的检测精度和检测速度.  相似文献   

14.
针对安全帽佩戴检测时易受复杂背景干扰,解决YOLOv4网络检测速度慢、内存消耗大、计算复杂度高、对硬件性能要求较高等问题,引入改进YOLOv4算法优化安全帽佩戴检测方法。引入MobileNet网络轻量化YOLOv4、跨越模块特征融合,实现高层语义特征和低层语义特征有效融合。针对图像中小目标分辨率低,信息特征少,多尺度并存,导致在连续卷积过程中易丢失特征信息等问题,采用改进特征金字塔FPN和注意力机制等颈部优化策略聚焦目标信息,弱化安全帽检测时背景信息的干扰。仿真结果表明,基于改进的YOLOv4颈部优化网络安全帽佩戴检测算法在CPU平台下的检测速度为34.28 FPS,是基础YOLOv4网络的16倍,检测精度提升了4.21%,检测速度与检测精度达到平衡。  相似文献   

15.
针对行人重识别中因遮挡、姿态变化使模型特征无法充分表达行人信息的问题,提出了基于注意力机制与多尺度特征融合的行人重识别方法.首先使用改进的骨干网络R-ResNet50提取图像特征;其次,抽取网络不同尺度的特征层嵌入注意力机制DANet,使模型更关注于重点信息;最后,对提取出的关键特征进行多尺度特征融合,实现特征间的优势...  相似文献   

16.
句子相似度计算是自然语言处理的一项基础任务,其准确性直接影响机器翻译、问题回答等下游任务的性能。传统机器学习方法主要依靠词形、词序及结构等浅层特征计算句子相似度,而深度学习方法能够融入深层语义特征,从而取得了更好效果。深度学习方法如卷积神经网络在提取文本特征时存在提取句子语义特征较浅、长距离依赖信息不足的缺点。因此设计了DCNN (dependency convolutional neural network)模型,该模型利用词语之间的依存关系来解决该不足。DCNN模型首先通过依存句法分析得到句子中词语之间的依存关系,而后根据与当前词存在一跳或者两跳关系的词语形成二元和三元的词语组合,再将这两部分信息作为原句信息的补充,输入到卷积神经网络中,以此来获取词语之间长距离依赖信息。实验结果表明,加入依存句法信息得到的长距离依赖能有效提升模型性能。在MSRP (microsoft research paraphrase corpus)数据集上,模型准确度和F1值分别为80.33%和85.91,在SICK (sentences involving compositional knowledge)数据集上模型的皮尔森相关系数能达到87.5,在MSRvid (microsoft video paraphrase corpus)数据集上模型的皮尔森相关系数能达到92.2。  相似文献   

17.
无人机技术的不断成熟,使得搭载高效视觉系统的无人机应用也更加广泛。针对无人机航拍图像中小目标较多、分辨率低等原因导致的检测精度不高的问题,提出了一种改进RetinaNet的无人机航拍目标检测算法。算法针对特征图中小目标信息提取不足的问题,设计了多阶段特征融合方法,并将其与注意力机制串联设计了特征挖掘模块,可以在浅层特征图中融入深层的语义信息,丰富小目标特征;设计了基于中心点检测的无锚框(Anchor-free)方法,网络通过对中心点的回归来定位目标,而不是通过固定大小的锚框去匹配,这样做可以使网络对小目标的回归更加灵活,提高了算法的整体性能;且通过深度可分离卷积方法对网络进行轻量化设计,以压缩模型大小并提高检测速度。实验结果表明,改进算法较原RetinaNet算法平均精度提升了8.5%,检测速度提升了6帧/s,且与其他先进算法相比也具有性能优势,达到了检测精度与检测速度的均衡。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号