首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 87 毫秒
1.
图像语义分割和实例分割是计算机视觉领域基础挑战性工作,图像全景分割统一解决两者的任务,其核心为图像中每一个像素分配相应的类别标签以及为类别中每一个实例分配ID。经典UPSNet已经取得了较好的全景分割效果,但是使用了一种单向信息流动的特征金字塔网络,将存在实例分支的目标实例定位不够准确的问题,并且语义分支的语义分割能力还需进一步提升。本文通过考虑两个任务的差异性以及共性,重新设计特征金字塔网络结构以提取出更适合全景分割的特征图,从而提高了实例分支的AP评价指标。在语义分支中引入了克罗内克卷积,与可变形卷积进行融合使得特征图的感受野更大并且捕获了局部信息,使语义分支的mIoU评价指标得到了提高。此模型在Cityscapes数据集上进行实验,验证了所设计的每个模块及整个模型的有效性。  相似文献   

2.
从图像中提取多种特征向量堆叠为一个高维特征向量用于图像语义分割,会导致部分特征向量的分类能力减弱或丢失。针对此问题,提出了一种结合深度卷积神经网络AlexNet和条件随机场的图像语义分割方法。利用预训练好的AlexNet模型提取图像特征,再通过条件随机场对多特征及上下文信息的有效利用来实现图像的语义分割。与利用传统经典特征的方法进行对比,实验结果表明:在利用AlexNet模型提取特征进行图像语义分割时,Conv5层为最有效的特征提取层,在Stanford background和Weizmann horse数据集下的识别准确率分别为81.0%和91.7%,均高于其他2种对比方法,说明AlexNet可以提取更有效的特征,得到更高的语义分割精度。  相似文献   

3.
基于DCNN的图像语义分割综述   总被引:3,自引:0,他引:3  
图像的语义分割是计算机视觉中重要的基本问题之一,其目标是对图像的每个像素点进行分类,将图像分割为若干个视觉上有意义的或感兴趣的区域,以利于后续的图像分析和视觉理解.近年来,深度卷积神经网络(Deep Convolutional Neural Network,DCNN)的出现,极大地推动了语义分割的发展.本文从语义分割的基本定义出发,对语义分割中存在的困难和挑战进行了分析和描述.总结了目前用于评测语义分割算法的典型数据库,并以PASCAL VOC数据库为主线对近年来基于DCNN的语义分割算法进行了梳理和总结.最后对语义分割未来的研究重点进行了探讨和预测.  相似文献   

4.
针对图像语义分割中,存在细节信息丢失、分割类别边缘模糊而粗糙的问题,在编码解码结构的基础上,结合残差模块和注意力机制,设计一种残差注意力模块.通过注意力机制加强特征图通道之间的联系,以提升语义分割的细腻度.为提高模型对多尺度物体的识别能力,结合金字塔模型,设计一种金字塔上采样模块.利用编码过程中产生的不同尺度的特征图,...  相似文献   

5.
针对室内机器人行驶场景中存在大量不规则形状障碍物及细小类障碍物的问题,提出一种基于改进双边分割网络(BiSeNet)的图像语义分割方法.即以BiSeNet为基础网络构建图像分割模型,一方面在其空间路径中融合可变形卷积,使其更加适应对可通行区域和水渍这类不规则形状目标的定位分割;另一方面在其语义路径中结合特征金字塔结构,提高对细小类障碍物的分割精度;最后在室内多类障碍物图像数据集上,将改进的BiSeNet算法与U-Net,PSPNet等算法进行对比实验,结果显示改进的BiSeNet算法对水渍类障碍物的分割像素准确率达到89.95%,比原BiSeNet算法分割精度提高约3.50%,与UNet,PSPNet等算法相比,改进的BiSeNet算法同样具有更高的分割精度.  相似文献   

6.
针对夜间道路场景解析困难的问题,提出了一种联合可见光与红外热像图实现夜间场景语义分割的方法。首先将双谱图像分别输入至两路并行的全卷积神经网络中,在网络的尾端融合特征并预测得到初步的语义分割结果。在此基础上,对双谱图像进行自适应直方图均衡及双边滤波,并利用基于双谱图像信息的稠密条件随机场对语义分割结果进行优化。实验结果表明,相比于单独使用可见光图、红外热像图、融合图,本文方法可以对夜间道路场景进行更准确的解析。  相似文献   

7.
针对实验室场景理解时存在背景复杂、光照多变等问题,利用RGB信息与深度信息在场景理解中具有互补性的特点,提出了一种感知注意力和轻量空间金字塔融合的网络模型(Perception Attention and Lightweight Spatial Fusion Network,PLFNet)。在该模型的感知注意力模块中,利用RGB图像与深度图像在网络中的权重不同,以加权的方式实现深度信息对RGB信息的多级辅助;在轻量空间金字塔池化模块中,通过增加级联的空洞空间卷积,不但有效地聚集了多尺度特征,而且比传统空间金字塔池化模块的参数量减少了约92%,使RGB信息和深度信息的融合更充分。在两个室内场景公开数据集上的实验结果表明,该模型的表现均优于经典算法。消融实验结果表明,本文模型添加感知注意力模块和轻量空间金字塔池化模块后,平均交并比分别提高了4.3%和3.5%。最后,利用场景较复杂的生物实验室数据集进行测试,结果表明本文模型可以有效地实现对生物实验室的场景理解。  相似文献   

8.
图像语义分割是对图像中的每个像素点进行分类,将图像中的前景和背景区分并且识别出每个前景的类别。随着深度学习技术的发展,传统图像语义分割方法在分割精度和分割速度上已经彻底被超越。针对深度学习图像语义分割方法研究现状进行综述,对近年来国内外基于深度学习图像语义分割方法主要思想、优缺点进行了分析和总结。提出了该领域目前存在的问题,对将来的发展进行总结和展望。  相似文献   

9.
图像语义分割模型在提取特征的过程中由于不断的下采样使得空间位置丢失,分割效果较差,针对该问题,提出了融合空间和通道注意力多级别特征来构造学习网络的方法.首先针对具有高级别特征的语义信息路径引入了通道注意力模块,在预训练模型Resnet101提取的特征图上,显式地建模通道之间的相互依存关系,确定每层特征图上需要重点关注的...  相似文献   

10.
指出了基于深度学习的图像语义分割中,如何充分利用图像上下文信息以达到更好的分割效果,是当前图像语义分割研究的关键问题.为解决这一问题,提出了一种基于多尺度特征提取的图像语义分割方法,通过构建深层卷积神经网络,并利用不同尺度图像作为网络的输入来提取不同尺度图像的特征,最后经过特征融合得到了分割图.在公开数据集Stanford background dataset 8类数据集上进行训练和验证,实验结果达到了84.33%的准确率.实验表明:通过提取和融合多尺度特征,可以达到更好的图像语义分割效果.  相似文献   

11.
针对行人检测易受物体遮挡以及光照变化干扰的问题,提出一种融合颜色与深度信息的多通道特征行人检测方法.首先,颜色采用Chn Ftrs方法中的通道,深度在其基础上引入法向量方向通道,并用快速图像特征金字塔来加速颜色和深度的通道特征的计算.其次,通道特征作为级联Ada Boost的候选特征点集输入,分别训练得到颜色和深度分类器,按一定比例权重融合颜色和深度信息进行检测.实验表明,该方法提高了检测精度,对光照变化、物体遮挡具有较好的鲁棒性.  相似文献   

12.
关键帧选择是提高视觉SLAM(simultaneous localization and mapping)算法精度及实时性的重要因素.关键帧常以图像的帧间相对运动距离为选择依据.该方法虽简单有效,但实时性、鲁棒性较差且容易产生大量冗余关键帧.针对上述问题,提出一种改进的关键帧选择算法.该算法整合了帧间相对运动距离、帧间特征点跟踪以及最小视觉变化来选择关键帧并删除冗余关键帧.基于该算法,结合具有较好方向和光照不变性的ORB(oriented FAST and rotated BRIEF)特征,实现了RGB-D SLAM算法.在RGB-D数据集上的实验表明,改进的关键帧选择算法能够更精准、及时地选择关键帧,并在减少RGB-D SLAM中冗余关键帧的同时提高算法的实时性、建图和定位精度.  相似文献   

13.
针对图像情感语义识别中特征提取的问题,提出了一种加权值的图像特征融合算法,并应用于图像情感语义识别。该方法根据不同特征对情感语义的影响不同,在提取出颜色、纹理和形状特征后通过加权融合为新的特征输入量,并用SVM来实现情感语义的识别。实验结果表明,这种算法比单独使用某种图像特征有更高的准确率。  相似文献   

14.
手语作为表达信息的一种方式,是聋哑人与外界交流的最主要途径。随着人工智能技术的发展,新型、自然、便捷的人机交互方式已经成为当今各行业交互方式的新趋势。传统手语识别方法普遍存在背景干扰严重、特征提取不完整及识别准确率低的缺点。针对以上问题进行研究,提出基于彩色-深度(RGB-D)图像的手语识别算法。在静态孤立词手语识别的基础上测试,实验对比结果表明,基于RGB-D的方法能得到比传统手语识别算法更好地性能;利用深度信息处理图像,有效地去除了场景中光照、背景的干扰,同时结合肤色信息去除非手形部分;采用概率神经网络(PNN)手语分类器对孤立词的识别准确率超过90%,取得了较高的识别率。  相似文献   

15.
基于深度学习网络的电气设备图像分类   总被引:1,自引:0,他引:1  
为了对变电站中智能巡检系统采集到的海量图片进行快速分析和识别,提出一种深度学习和支持向量机(support vector machine, SVM)相结合的图像分类模型。首先,运用旋转、翻折等方法对采集到的原始数据进行扩充。然后,合并扩展图像集,并在相同类型的条件下将其随机划分为训练集和测试集。基于实际图像改进卷积神经网络(convolutional neural network, CNN),并提取训练集的图像特征。最后,通过使用训练集图片的深度特征来训练SVM分类器,并且在测试集图片上实现分类测试。利用巡检机器人采集到的8 000张图片对模型精度进行实验验证,结果表明,该模型具有较强的分类性能。  相似文献   

16.
With the rapid development of intelligent traffic information monitoring technology, accurate identification of vehicles, pedestrians and other objects on the road has become particularly important. Therefore, in order to improve the recognition and classification accuracy of image objects in complex traffic scenes, this paper proposes a segmentation method of semantic redefine segmentation using image boundary region. First, we use the Seg Net semantic segmentation model to obtain the rough cla...  相似文献   

17.
为了更好地去除图像中的噪声,提出了一种改进的深度卷积神经网络(Dncnn)图像去噪算法。针对现有的Dncnn网络参数量大,对Dncnn网络的第2~16层进行了改进,使网络参数量降低1/3后,仍能保持和Dncnn一样的训练效果。在此基础上,对网络底层的低级语义信息和高层的高级语义信息进行了特征融合,使得网络训练更平稳,并能达到更好的训练效果。实验结果表明无论与图像去噪领域公认最好的去噪算法BM3D相比,还是与深度学习领域先进的图像去噪算法Dncnn相比,改进的Dncnn都有更好的表现。  相似文献   

18.
针对有雾天气会使图像质量降低,影响对图像信息的提取,导致图像的应用价值减少的问题,提出一种基于深度学习的图像去雾算法。首先,对原有雾图像进行单尺度和多尺度的卷积来特征提取,其次再用多尺度卷积核实现图像细节的重建得到粗略的透射率传播图,同时利用原有雾图像中像素点的位置和亮度值得到大气光值,利用导向滤波得到精细透射率传播图和之前得到的大气光值进而反演出无雾图像,最终对无雾图像进行直方图颜色校正。实验结果表明,相比传统去雾算法,该算法对图像细节的处理更加自然并具有很好的视觉效果。  相似文献   

19.
为满足无人驾驶车辆对越野环境的适应能力,提高无人驾驶车辆对环境的理解能力,必须对环境感知层面提出更高的要求.而环境感知中最为关键的一点就是车道线提取或者路面提取.与城市环境下的结构化道路相比,越野环境下的路面提取更加复杂.综合对多种越野场景展开研究,提出了一种能够自适应场景变化的路面分割方法.文中在越野环境下采集了大量的数据,并且制作了相应的数据集;应用深度学习技术对这些场景进行识别;应用语义分割算法对不同场景下的路面进行分割;最后统一了整个算法模块,给出测试结果.   相似文献   

20.
大多遥感影像云检测方法中,训练数据需要对影像的每个像素进行标记,标记成本非常昂贵,为了减轻深度学习遥感影像云检测中人工劳动标记数据的成本,图像块标签代替像素标签进行深度学习训练。首先,将多种下垫面的遥感影像裁剪成图像块并标记,带有标签的图像块作为数据集;其次,块状的数据集训练改进VGG深度学习网络,训练好的网络对大型遥感影像进行云检测;最后,选取多种中分辨率卫星图像分别用改进VGG与VGG网络进行了云检测对比实验。结果表明:改进VGG遥感影像云检测方法能很好地检测出碎云和厚云,整个云区的精度都在90%以上。使用带标签的图像块,不仅减少了人工劳动,而且有效地进行遥感影像云检测,可为弱监督深度学习的遥感影像相关研究提供参考。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号