共查询到20条相似文献,搜索用时 46 毫秒
1.
图像语义分割和实例分割是计算机视觉领域基础挑战性工作,图像全景分割统一解决两者的任务,其核心为图像中每一个像素分配相应的类别标签以及为类别中每一个实例分配ID。经典UPSNet已经取得了较好的全景分割效果,但是使用了一种单向信息流动的特征金字塔网络,将存在实例分支的目标实例定位不够准确的问题,并且语义分支的语义分割能力还需进一步提升。本文通过考虑两个任务的差异性以及共性,重新设计特征金字塔网络结构以提取出更适合全景分割的特征图,从而提高了实例分支的AP评价指标。在语义分支中引入了克罗内克卷积,与可变形卷积进行融合使得特征图的感受野更大并且捕获了局部信息,使语义分支的mIoU评价指标得到了提高。此模型在Cityscapes数据集上进行实验,验证了所设计的每个模块及整个模型的有效性。 相似文献
2.
针对多尺度下的目标分割问题,提出了一种多尺度特征融合的图像语义分割方法.该方法改进了空洞空间金字塔池化(ASPP)模块,采用6种不同采样率空洞卷积并行架构增强了对输入图像信息的提取,该模块可以获取多尺度的卷积特征,从而进一步增强图像分割能力.通过在PASCAL VOC 2012数据集上进行训练和验证,达到了82.0%的... 相似文献
3.
从图像中提取多种特征向量堆叠为一个高维特征向量用于图像语义分割,会导致部分特征向量的分类能力减弱或丢失。针对此问题,提出了一种结合深度卷积神经网络AlexNet和条件随机场的图像语义分割方法。利用预训练好的AlexNet模型提取图像特征,再通过条件随机场对多特征及上下文信息的有效利用来实现图像的语义分割。与利用传统经典特征的方法进行对比,实验结果表明:在利用AlexNet模型提取特征进行图像语义分割时,Conv5层为最有效的特征提取层,在Stanford background和Weizmann horse数据集下的识别准确率分别为81.0%和91.7%,均高于其他2种对比方法,说明AlexNet可以提取更有效的特征,得到更高的语义分割精度。 相似文献
4.
基于DCNN的图像语义分割综述 总被引:3,自引:0,他引:3
图像的语义分割是计算机视觉中重要的基本问题之一,其目标是对图像的每个像素点进行分类,将图像分割为若干个视觉上有意义的或感兴趣的区域,以利于后续的图像分析和视觉理解.近年来,深度卷积神经网络(Deep Convolutional Neural Network,DCNN)的出现,极大地推动了语义分割的发展.本文从语义分割的基本定义出发,对语义分割中存在的困难和挑战进行了分析和描述.总结了目前用于评测语义分割算法的典型数据库,并以PASCAL VOC数据库为主线对近年来基于DCNN的语义分割算法进行了梳理和总结.最后对语义分割未来的研究重点进行了探讨和预测. 相似文献
5.
针对图像语义分割中,存在细节信息丢失、分割类别边缘模糊而粗糙的问题,在编码解码结构的基础上,结合残差模块和注意力机制,设计一种残差注意力模块.通过注意力机制加强特征图通道之间的联系,以提升语义分割的细腻度.为提高模型对多尺度物体的识别能力,结合金字塔模型,设计一种金字塔上采样模块.利用编码过程中产生的不同尺度的特征图,... 相似文献
6.
针对室内机器人行驶场景中存在大量不规则形状障碍物及细小类障碍物的问题,提出一种基于改进双边分割网络(BiSeNet)的图像语义分割方法.即以BiSeNet为基础网络构建图像分割模型,一方面在其空间路径中融合可变形卷积,使其更加适应对可通行区域和水渍这类不规则形状目标的定位分割;另一方面在其语义路径中结合特征金字塔结构,提高对细小类障碍物的分割精度;最后在室内多类障碍物图像数据集上,将改进的BiSeNet算法与U-Net,PSPNet等算法进行对比实验,结果显示改进的BiSeNet算法对水渍类障碍物的分割像素准确率达到89.95%,比原BiSeNet算法分割精度提高约3.50%,与UNet,PSPNet等算法相比,改进的BiSeNet算法同样具有更高的分割精度. 相似文献
7.
针对夜间道路场景解析困难的问题,提出了一种联合可见光与红外热像图实现夜间场景语义分割的方法。首先将双谱图像分别输入至两路并行的全卷积神经网络中,在网络的尾端融合特征并预测得到初步的语义分割结果。在此基础上,对双谱图像进行自适应直方图均衡及双边滤波,并利用基于双谱图像信息的稠密条件随机场对语义分割结果进行优化。实验结果表明,相比于单独使用可见光图、红外热像图、融合图,本文方法可以对夜间道路场景进行更准确的解析。 相似文献
8.
针对实验室场景理解时存在背景复杂、光照多变等问题,利用RGB信息与深度信息在场景理解中具有互补性的特点,提出了一种感知注意力和轻量空间金字塔融合的网络模型(Perception Attention and Lightweight Spatial Fusion Network,PLFNet)。在该模型的感知注意力模块中,利用RGB图像与深度图像在网络中的权重不同,以加权的方式实现深度信息对RGB信息的多级辅助;在轻量空间金字塔池化模块中,通过增加级联的空洞空间卷积,不但有效地聚集了多尺度特征,而且比传统空间金字塔池化模块的参数量减少了约92%,使RGB信息和深度信息的融合更充分。在两个室内场景公开数据集上的实验结果表明,该模型的表现均优于经典算法。消融实验结果表明,本文模型添加感知注意力模块和轻量空间金字塔池化模块后,平均交并比分别提高了4.3%和3.5%。最后,利用场景较复杂的生物实验室数据集进行测试,结果表明本文模型可以有效地实现对生物实验室的场景理解。 相似文献
9.
10.
图像语义分割模型在提取特征的过程中由于不断的下采样使得空间位置丢失,分割效果较差,针对该问题,提出了融合空间和通道注意力多级别特征来构造学习网络的方法.首先针对具有高级别特征的语义信息路径引入了通道注意力模块,在预训练模型Resnet101提取的特征图上,显式地建模通道之间的相互依存关系,确定每层特征图上需要重点关注的... 相似文献
11.
12.
针对现有Vision Transformer (ViT) 模型在局部特征捕捉和多尺度特征融合方面的局限性,本文提出一种新型的融合多尺度特征的轻量化图像分类混合模型(Multi-Scale Vision Transformer,MSViT)。首先,在编码器中设计捕获通道特征的多尺度前馈神经网络(Multi-Scale Feed Forward Network,MSFFN)模块,该模块能有效提取空间和多尺度通道特征。其次,设计一个新的级联特征融合解码器(Cascade Feature Fusion Decoder,CFFD),通过整合特征金字塔网络(Feature Pyramid Network,FPN)和多阶段特征融合解码器,显著提升模型对不同尺度特征的交互和融合能力。最后,模型引入多阶损失函数,以全面优化不同尺度特征在图像分类任务中的表现。为了验证MSViT的有效性,在4个实验数据集[ImageNet-1k的1个子集(Small_ImageNet)、Cifar 100、糖尿病视网膜病变数据集(APTOS 2019)、蘑菇数据集(Mushroom 66)]上进行大量的实验。其中在Small_ImageNet数据集上的实验结果显示,MSViT实现了87.58%的Top-1准确率,较EdgeViT-XXS提升了2.27%。实验结果证明了MSViT在图像分类任务中的有效性。 相似文献
13.
针对汉语自动分词后词条的特征信息缺失的问题,本文提出把整个分词过程分解为三个子过程,以词串为分词单位对文本进行分词:首先,采用逆向最大匹配法对文本进行切分;第二,对切分结果进行停用词消除;第三,计算第一次分词得到的词条互信息和相邻共现频次,根据计算结果判定相应的词条组合成词串。实验结果表明,词条组合后的词串的特征信息更丰富,改善了文本特征选择的效果,提高了文本分类性能。 相似文献
14.
基于语义相似度的文本表示降维方法 总被引:1,自引:1,他引:1
数据降维是文本表示中不可或缺的一个环节,有效的数据降维方法不仅能够减少计算量,同时有助于文本处理精度的提高.不同于传统的利用统计信息进行降维的方法,本文提出了一种基于词汇的语义相似度的文本表示的降维方法,该方法结合自然语言处理的知识,在降维环节考虑了特征词的语义信息和词性信息.实验结果表明:该方法能够有效地降低文本表示的维数,并在降维后的空间获得较高的文本处理精度,基于语义相似度的降维方法是一种适合文本处理的降维方法. 相似文献
15.
一价事件是以一价动词为核心构成的事件。为了提高查询的智能性和准确性,尝试用一价事件设计描述了从《实习词表》中挑选一价动词,根据《一价动词表》设计Google查询项,根据Google查询项从Web网页上获取大规模的语料。用特征提取方法从Web语料中抽取事件上下文中的相关词,根据相关词评价Google查询项的优劣,并进行调整。得到与一价动词相关的因果逻辑,丰富查询项,从而提高查询精度。 相似文献
16.
With layer-measured contours, an algorithm that can extract the contour segments from a rotational surface is presented. The extraction can be divided into two stages, i. e. the rough segmentation and the refinement. In the rough segmenting stage, an optimal contour matching method is put forward to find similar contour segment from another closed contour with respect to the seed contour. In the refining stage, an iterative way that can extract a circular arc precisely is presented based on parameters identification and contour-ends expanding/shrinking operation. The algorithm can extract the open contour segments from a rotational surface precisely, as demonstrated in the examples. Based on the work of this paper, further research, such as parameter identification of 3 - D surface and CAD model creation, can be conducted. 相似文献
17.
针对图像情感语义识别中特征提取的问题,提出了一种加权值的图像特征融合算法,并应用于图像情感语义识别。该方法根据不同特征对情感语义的影响不同,在提取出颜色、纹理和形状特征后通过加权融合为新的特征输入量,并用SVM来实现情感语义的识别。实验结果表明,这种算法比单独使用某种图像特征有更高的准确率。 相似文献
18.
基于历程的特征造型系统在产品模型的可编辑性和易编辑性技术方面存在的问题涉及到了特征造型中的核心技术,尤其在变量、约束的表示及提高约束变量求解的精确性和效率方面。本文在语义特征造型的基础上提出了对约束方程组进行分解,并转化为有约束的非线性优化问题,然后利用遗传算法约束求解,克服了运用几何变量法求解所存在的收敛性差、求解速度慢,以及单独使用遗传算法进行大量搜索与匹配求解速度缓慢的缺点。 相似文献
19.
近年来,"-friendly"复合词的数量越来越大,词内结构越来越复杂,"-friendly"词义延伸也越来越广。在大量语料的基础上,对"-friendly"复合词的构词结构、语义特征以及翻译策略进行讨论,概括出目前此类复合词的四类结构和四个语义特征,并总结出四种翻译策略。最后,对其发展前景做出预测。 相似文献
20.
为解决工业中摄像头在俯视、仰视等角度拍摄仪表时导致表盘变形影响读数的问题,提出一种基于Faster R-CNN识别变形仪表图像的二次矫正方法。利用ResNeXt50作为Faster R-CNN的主干网络,结合特征金字塔FPN(Feature Pyramid Network)生成特征层,并融合SENet(Squeeze and Excitation Networks)模块将仪表特征更为突出,便于定位仪表区域并裁减,再由Harris角点检测找到表盘的四个顶点;利用二次矫正方法对变形仪表还原成正视角度仪表;最后计算示数。实验结果表明:该方法使得mAP值由基本模型的75.51%提升至94.45%,且仪表在变形情况下,仍能得到比较好的读数结果,误差率为0.83%。 相似文献