首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对目前零样本图像分类均采用图像底层视觉特征训练属性分类器而导致分类精度较低的问题,提出一种基于稀疏编码空间金字塔模型的零样本学习方法,给出系统结构流程图.首先从原始视觉图像中提取SIFT特征,并进行SIFT特征点提取;然后构建空间金字塔最大池化模型,对已提取的SIFT中间特征进行稀疏编码;最后建立间接属性预测模型.给出基于稀疏编码的空间金字塔最大池化模型的零样本学习算法步骤,完成对目标图像的属性预测,从而达到零样本图像分类的目的.在Shoes数据集与OSR数据集上进行了对比试验.结果表明:试验证实了文中算法的有效性;相对于传统算法,试验耗时减少,图像属性预测精度增加,图像分类识别率提高.  相似文献   

2.
为解决服装风格的细粒度识别问题,提出一种改进的Bilinear-CNN(convolutional neural network)模型。在VGG16特征提取网络的输出特征图中引入空间注意力机制,提升对图像中服装区域的关注程度。设计一种单特征通路的双线性池化方法,在减小参数量和计算量的同时,采用全局平均池化和全局最大池化两种操作充分挖掘细粒度特征。试验结果表明,改进的Bilinear-CNN模型在FashionStyle14数据集上达到76.4%的识别准确率。相比原始Bilinear-CNN模型,改进模型的识别准确率提升2个百分点,减少40%的参数量和52%的计算量,并对含扰动服装图像具有风格识别的稳健性。  相似文献   

3.
采用加强特征提取网络为MobileNetV2的融合多特征金字塔场景解析网络(PSPnet)来实现复杂场景下的图像语义分割.相对于深度残差网络ResNet50和MobileNetV1,引入了线性瓶颈结构和反向残差结构,利用金字塔池化模块(PPM)来处理不同层级的图像特征信息,并将其进行特征拼接,有效避免了不同分割尺寸下,子区域之间关键特征信息的缺失.在此基础上,引入注意力机制模块,结合通道注意力机制(CAM)和空间注意力机制(SAM),进一步提高分割精度.实验结果表明:该方法可以提高图像识别的准确率,并节省训练时间.  相似文献   

4.
基于文本的行人重识别模型通常依赖于全局特征对齐和局部特征对齐,但模态间和模态内的相关信息常被忽略。提出了一种基于关系挖掘的跨模态行人重识别方法,该方法包括双流主干网络、负相似度挖掘模块、关系编码器。首先,通过双流主干网络实现了全局和局部特征对齐;其次,通过负相似度挖掘模块提升了图像-文本对特征辨别的细粒度;最后,通过关系编码器模块分别学习图像和文本中隐含的关系信息,实现关系级别的特征对齐。在CUHK-PEDES数据集和ICFG-PEDES数据集上的实验结果证明,文中方法能够达到较高的识别精度。  相似文献   

5.
针对目前负荷分解模型的深层负荷特征提取不充分,分解精度低以及训练成本高等问题,提出了一种多尺度特征融合模型。模型由负荷分解子网络及负荷识别子网络两部分构成,两个子网络均利用一维卷积和批量归一化等组成的卷积块进行负荷特征初提取,然后采用金字塔池化模块从多个维度精确提取深层负荷特征信息,并与特征初提取部分进行融合。金字塔池化模块使网络参数大大减少且降低了训练成本。同时与以往模型中的注意力机制不同的是,网络引入多头自注意力机制,每个注意力关注负荷特征的不同部分,从多个角度实现对重要负荷特征的筛选,进一步提高分解性能。最后,在UK-DALE和REDD数据集上进行实验,结果表明所提模型与四个基准模型相比,无论是负荷分解性能还是电器运行状态识别能力都有明显提升。  相似文献   

6.
动作识别是机器视觉领域的基础应用之一,目前动作识别算法多数基于单帧图像特征或简单综合时间维度特征和空间维度特征,一定程度上约束了特征表达能力.为了解决该问题,本文提出了一种时空特征融合方法,将时空金字塔中引入加权策略,有机地将2个维度的特征融合在一起,打破空间维度特征上的局限性.实验结果表明基于本文提出的时空加权特征融合的识别方法可有效提高动作识别精度.  相似文献   

7.
针对实验室场景理解时存在背景复杂、光照多变等问题,利用RGB信息与深度信息在场景理解中具有互补性的特点,提出了一种感知注意力和轻量空间金字塔融合的网络模型(Perception Attention and Lightweight Spatial Fusion Network,PLFNet)。在该模型的感知注意力模块中,利用RGB图像与深度图像在网络中的权重不同,以加权的方式实现深度信息对RGB信息的多级辅助;在轻量空间金字塔池化模块中,通过增加级联的空洞空间卷积,不但有效地聚集了多尺度特征,而且比传统空间金字塔池化模块的参数量减少了约92%,使RGB信息和深度信息的融合更充分。在两个室内场景公开数据集上的实验结果表明,该模型的表现均优于经典算法。消融实验结果表明,本文模型添加感知注意力模块和轻量空间金字塔池化模块后,平均交并比分别提高了4.3%和3.5%。最后,利用场景较复杂的生物实验室数据集进行测试,结果表明本文模型可以有效地实现对生物实验室的场景理解。  相似文献   

8.
细粒度图像分类任务比一般图像分类任务更具有挑战性,其通常需要对类间差异小、类内差异大的样本进行分类.现有细粒度分类方法主要依赖视觉特征进行分类,而人类可以根据文本描述等属性描述来辅助识别图像类别.该文提出了一种通过预测属性引导的通道注意力模块,该模块可以插入到任意的卷积神经网络中,从而让模型学习到更高级的特征表示.最后,该算法在CUB-200-2011数据集上测试,在使用Resnet-50、VGG-19、Bilinear-CNN作为主干网络训练时的精度分别达到87.1%、82.1%、85.5%,精度得到显著提升.  相似文献   

9.
针对目前抑郁症识别方法中没有有效地从序列信息中刻画长时特征表示的问题,本文提出了一种基于三维卷积神经网络(3D-CNN)、时空注意力-卷积长短时记忆网络(STA-ConvLSTM)和空间金字塔池化(SPP)的端到端的抑郁症识别方法,计算在数据库AVEC2013和AVEC2014测试集上的抑郁症识别结果,并将本文结果与已发表文献结果进行对比分析.结果表明:在数据库AVEC2013和AVEC2014测试集上,平均绝对误差均为8.60,均方根误差分别为10.32和10.27,文献结果比较表明本文的抑郁症识别结果优于当前大多数基于面部视频的抑郁症识别方法 .  相似文献   

10.
针对行人重识别中因遮挡、姿态变化使模型特征无法充分表达行人信息的问题,提出了基于注意力机制与多尺度特征融合的行人重识别方法。该方法首先使用改进的骨干网络(R-ResNet50)提取图像特征;其次,抽取网络不同尺度的特征层嵌入注意力机制(DANet),使模型更关注于重点信息;最后,对提取出的关键特征进行多尺度特征融合,实现特征间的优势互补,并使用联合交叉熵损失、难样本采样三元组损失和中心损失的多损失函数策略对网络模型进行训练。实验结果表明,本文所提方法在Market1501、DukeMTMC-ReID数据集上的首位命中率(Rank-1)和平均精度均值(mAP)分别达到了92.7%、80.4%和86.4%、71.0%,模型提取的特征更具有判别性,识别率更高。  相似文献   

11.
无监督域自适应行人重识别在智能监控中发挥着重要作用,并引起了研究者的广泛关注.尽管目前的研究已经取得了较大进步,但不同数据集之间的域偏移问题给行人重识别带来极大挑战.研究发现,在连续时间里,同一摄像机视角下的行人图像具有相同的风格,如果将这种风格信息从行人图像中分离出去,将有效缓解由图像风格差异引起的域偏移问题.为此,提出一种低秩先验引导的域不变信息分离的字典学习方案.根据风格信息的低秩先验性,将行人图像特征中的风格信息和行人身份信息分离开来,根据同一身份行人属性的域不变性建立视觉特征与属性之间的联系,缓解域偏移所带来的影响,通过自训练策略来调整学习参数.实验表明,方法的性能在很多数据集上超过了传统的无监督域自适应行人重识别方法以及部分基于深度学习的无监督域自适应行人重识别方法.  相似文献   

12.
针对现今煤岩图像识别方法的缺乏与不足,为了挖掘新的煤岩图像识别方法以及更好地处理高维煤岩图像数据,提出了基于最大池化稀疏编码的煤岩识别方法.本方法在提取煤岩图像特征时加入了池化操作,在分类识别时采用了集成分类器,即多个弱分类器组成一个强分类器.实验结果表明:最大池化稀疏编码的特征提取方式能简单有效表达煤岩图像的纹理特征,大大增强煤岩图像的可区分性,获得较高的识别率,并且具有良好的识别稳定性.研究结果可为煤岩界面的自动识别提供新的思路和方法.  相似文献   

13.
针对已有注视点预测模型存在特征细节缺失、尺度单一和背景信息干扰严重导致的注视点预测精度偏低等问题,提出了一种基于超复数小波和图像空域的卷积网络融合注视点预测算法.首先,针对细节特征丢失问题,使用超复数小波变换在频域中提取图像的细节特征,与卷积网络提取的空域特征进行融合.然后,通过空洞空间金字塔池化模块,融合不同感受得到的特征图,有效解决了特征尺度单一的问题.最后,引入了残差卷积注意力模块,结合空间和通道的注意力机制,能够有效抑制背景信息的干扰,提高注视点预测精度.在SALICON数据集上,CC、sAUC和SIM评价指标下,该算法的性能达到0.884 7、0.769 3和0.778 0;在CAT2000数据集上,该算法在相应指标下的性能为0.735 5、0.870 1和0.664 5.主客观对比实验结果表明,该算法具有较好的注视点预测能力.  相似文献   

14.
以舰船为研究对象,研究高分辨遥感图像的多尺度多目标检测中的关键技术,主要解决多尺度多目标识别和细粒度分类准确率低等问题.在目标定位方面,利用特征金字塔深度网络定位多目标区域,创建一个在所有尺度上均具有语义信息的特征金字塔,有效解决多尺度多目标数据定位准确率低这一关键问题;在目标识别方面,利用共享CNN网络重建输入图像、优化多任务损失函数提取细粒度分类目标结构特征,提高细分目标识别准确率.与GoogLeNet、Faster R-CNN和Yolo三种目标检测算法对比实验表明,利用特征金字塔和重建输入图像可有效检测多目标多尺度的细粒度船舶对象,漏检率为1.5%,细粒度分类识别平均准确率为92.67%.  相似文献   

15.
将深度学习应用于行人重识别领域,嵌入多尺度注意力融合模块至神经网络中进行多尺度特征提取和表示,可有效提升注意力机制对深度学习网络的识别性能。提出了一种基于SE block的多尺度通道注意力融合模块,并结合ResNet50卷积神经网络提取特征;然后通过双向LSTM网络进一步提取特征序列上下文信息,在提高模型对图像重要特征的提取能力的同时,降低对图像冗余特征的关注度;最后使用级联难采样三元组损失函数和交叉熵损失函数共同训练网络模型,使样本能够在高维特征空间中实现聚类,进一步提升模型识别准确性。所提出算法在Market1501数据集和CUHK03数据集分别进行实验,并在同等条件下和其他注意力模块算法进行比较。为进一步验证各模块作用,对算法进行消融实验,以验证各模块的有效性,实验结果表明,所提出方法可有效应用于行人重识别  相似文献   

16.
针对基于卷积神经网络的行人重识别算法全局信息建模不足的问题,分析了卷积操作的局限性,提出一种基于Transformer改进的全局-局部两分支行人重识别算法.首先利用相对位置编码改进多头自注意力机制,并将其嵌入到Resnet50骨干网络中.之后在全局分支中对图像进行空间几何划分并利用Transformer的全局感受野增强抽象特征的提取能力;在局部分支中对Layer_3输出进行降维监督,利用多尺度池化获得更丰富的局部特征.实验结果表明,该算法在公开数据集Market-1501和DukeMTMC-reID上的mAP/Rank-1分别达到了93.45%/95.61%和88.79%/90.35%,相对于单纯基于卷积神经网络的算法,本文算法达到更高的精度.  相似文献   

17.
针对目前细粒度图像分类算法存在的局部区域特征捕捉不全面的问题,在B-CNN算法基础上提出了一种基于注意力机制的细粒度图像分类算法。首先利用数据增强的6种方式对训练数据集进行扩充,然后在B-CNN算法的特征提取中引入注意力机制,使用卷积注意力模块CBAM精准获取图像局部区域特征,最后融合特征进行分类。改进后的算法分别在CUB-200-2011和Stanford Cars两个数据集上进行实验,与当前先进算法比较,所提算法提高了细粒度图像的分类效果。  相似文献   

18.
姚捃  郭志林  赵杰 《科学技术与工程》2022,22(22):9721-9727
在实际监控的边缘设备中利用TSN或者3DCNN网络很难实现实时的、相对准确的监控任务。提出一种结合了人体检测和人体属性分析的考场行为识别算法。相对于以提取时空特征作视频分类算法为主流思想的行为识别,利用视频帧以人体检测和人体属性分析结合的行为识别方法更加快速准确。方法借助了多标签学习、注意力机制和特征金字塔等策略来改进任务,同时利用迁移学习对本地采集的数据集进行再训练,实验结果表明达到了主流数据集的良好性能,并在考场环境具有高效性与实用性。  相似文献   

19.
行人重识别易受到物体不同程度遮挡的影响.针对物体遮挡以及网络特征提取能力不强的问题,提出一种基于属性擦除与多分支网络的行人重识别的方法.该方法利用行人的包属性标签随机擦除进行数据增广.网络结构由ResNet-50基础网络与全局、局部卷积两个分支结构组成.全局卷积分支提供全局特征,局部卷积分支提供丰富的细粒度信息,通过两个分支的特征级联提升网络的特征提取能力.在Market-1501、DuckMTMC-reID数据集上,证明论文方法具有较好的效果.  相似文献   

20.
细粒度图像分类是对某一类别下的图像子类进行精确划分.细粒度图像分类以其特征相似、姿态各异、背景干扰等特点,一直是计算机视觉和模式识别领域的研究热点和难点,具有重要的研究价值.细粒度图像分类的关键在于如何实现对图像判别性区域的精确提取,已有的基于神经网络算法在精细特征提取方面仍有不足.为解决这一问题,本文提出了一种多尺度反复注意力机制下的细粒度图像分类算法.考虑到高、低层级的特征分别具有丰富的语义、纹理信息,分别将注意力机制嵌入到不同尺度当中,以获取更加丰富的特征信息.此外,对输入特征图先后采取通道和空间注意,该过程可以看作是对特征矩阵的反复注意力(re-attention);最后以残差的方式,将注意力结果与原始输入特征相结合,将不同尺度特征图的注意结果拼接起来送入全连接层,以更加精确地提取显著性特征.在国际上公开的细粒度数据集(CUB-200-2011、FGVC Aircraft和Stanford Cars)上进行实验仿真,分类准确率分别达到86.16%、92.26%和93.40%;与只使用ResNet50结构相比,分别提高了1.66%、1.46%和1.10%;明显高于现有经典算法,也高于人类表现,验证了本文算法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号