首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 171 毫秒
1.
行人重识别旨在不同时间、不同摄像头拍摄范围中检索特定目标行人,在实际应用场景中,可能会存在行人被严重遮挡的图像,不仅不利于行人检测,还会消耗大量的时间.行人姿态检测可以通过定位行人关键点位置判断行人是否存在遮挡,因此,本研究提出在重识别检测之前,对行人姿态进行分析,提出一种基于AlphaPose的重识别行人姿态评价方法.首先,利用AlphaPose进行姿态检测,得到行人各个关键点的置信度;然后,利用各个关键点的置信度得到各个行人的姿态评分;最后,根据姿态评分结果筛选出多个测试集进行验证分析.利用torchreid框架在数据集DukeMTMC-reID及Market1501进行实验,实验结果表明,与初始测试集相比,筛选后的测试集检测效率明显提高,且mAP和rank-n值也有所提高.  相似文献   

2.
针对行人重识别中因遮挡、姿态变化使模型特征无法充分表达行人信息的问题,提出了基于注意力机制与多尺度特征融合的行人重识别方法.首先使用改进的骨干网络R-ResNet50提取图像特征;其次,抽取网络不同尺度的特征层嵌入注意力机制DANet,使模型更关注于重点信息;最后,对提取出的关键特征进行多尺度特征融合,实现特征间的优势...  相似文献   

3.
针对行人重识别(re-ID)中背景簇、遮挡、视点变化和姿态变化等因素的负面影响,提出了一种新的算法,称为多粒度融合生成对齐网络(MLFGAN).首先,提出身份(Identity,ID)不变的姿态标准化生成对抗网络(IIPN)来生成8种标准姿态的行人图像;然后,通过全局对齐网络实现图像对齐,利用局部对齐网络进行精细化行人...  相似文献   

4.
行人重识别易受到物体不同程度遮挡的影响.针对物体遮挡以及网络特征提取能力不强的问题,提出一种基于属性擦除与多分支网络的行人重识别的方法.该方法利用行人的包属性标签随机擦除进行数据增广.网络结构由ResNet-50基础网络与全局、局部卷积两个分支结构组成.全局卷积分支提供全局特征,局部卷积分支提供丰富的细粒度信息,通过两个分支的特征级联提升网络的特征提取能力.在Market-1501、DuckMTMC-reID数据集上,证明论文方法具有较好的效果.  相似文献   

5.
行人重识别是指实现不重叠的不同摄像头下同一行人图像的匹配技术,在加强社会管理、预防犯罪行为发生以及实现事件重构等方面具有重要应用价值.由于行人重识别主要依靠人体外表视觉表示特征和人工设计特征,且受光照、图像分辨率、行人姿态及拍摄视角度等因素的影响较大,因此,行人重识别面临巨大挑战.本文对现有行人表示特征学习技术及度量技术进行了综述分析,指出存在的问题及可能的解决思路.本文的论述有利于该领域研究人员对现状的把握及提出新的研究思路.  相似文献   

6.
针对行人重识别中行人姿态变化和遮挡问题,提出了一种结合注意机制和局部擦除的行人重识别方法.首先,构建由ResNet50为全局分支和注意擦除为局部分支组成的双分支网络.全局分支用来提取全局特征表示,在训练过程中可以监督注意擦除分支的训练.注意擦除局部分支由注意模块和擦除模块组成,该分支将输入特征映射的同一区域随机地分批擦...  相似文献   

7.
将深度学习应用于行人重识别领域,嵌入多尺度注意力融合模块至神经网络中进行多尺度特征提取和表示,可有效提升注意力机制对深度学习网络的识别性能。提出了一种基于SE block的多尺度通道注意力融合模块,并结合ResNet50卷积神经网络提取特征;然后通过双向LSTM网络进一步提取特征序列上下文信息,在提高模型对图像重要特征的提取能力的同时,降低对图像冗余特征的关注度;最后使用级联难采样三元组损失函数和交叉熵损失函数共同训练网络模型,使样本能够在高维特征空间中实现聚类,进一步提升模型识别准确性。所提出算法在Market1501数据集和CUHK03数据集分别进行实验,并在同等条件下和其他注意力模块算法进行比较。为进一步验证各模块作用,对算法进行消融实验,以验证各模块的有效性,实验结果表明,所提出方法可有效应用于行人重识别  相似文献   

8.
人体姿态估计是计算机视觉领域的研究热点之一,目标是从给定的图像或视频中识别人体的关节.由于篮球比赛视频中人体动作复杂多变,易产生运动模糊、遮挡等问题,导致现有的人体姿态算法对篮球动作姿态估计的准确率较低.针对这一问题,提出了一种基于多尺度时空关联特征的篮球动作姿态估计算法,构建基于Transformer的人体时序特征捕捉模块对序列层级的时空特征信息进行建模,以缓解运动模糊、遮挡等现象带来的负面影响.此外,针对人体外形复杂多变的问题,提出了基于可形变卷积的人体空间特征残差融合模块来获取更为充分的空间特征.与现有算法相比,该算法在自行构建的篮球场景人体运动数据集、姿态估计公开基准数据集PoseTrack2017和PoseTrack2018均取得较好的效果.  相似文献   

9.
为解决人体姿态估计任务中存在的不同视角下人体实例尺度变化、遮挡问题导致的人体关键点定位不准确问题,提出融入二阶注意力机制的多尺度人体姿态估计网络模型(GOS-HRNet)。首先,在特征提取阶段为了获得高质量的特征图,通过在多分辨率网络结构中使用Octave卷积,保留更多的图像空间特征信息以提高关键点定位准确率;然后,为有效的利用图像上下文信息,融入二阶注意力模块Gsop使网络能更好的学习各分辨率表征的空间信息;最后,为了应对尺度变换对关键点定位的影响采用尺度增强训练方法,提高模型对尺度变化的鲁棒性。本文提出模型在MS COCO 2017数据集上进行实验,结果表明:提出的GOS-HRNet模型平均检测精度比HRNet模型提升了2.2%,能够更加准确的利用上下文信息、丰富空间特征信息以提高对关键点定位的准确性。  相似文献   

10.
为解决多人姿态估计中小尺度关节点定位准确率低的问题,采用自顶向下的方法,结合人体目标检测模型YOLOv4-tiny,提出一种基于堆叠沙漏网络改进的多人姿态估计网络.该网络包含人体目标检测器和人体姿态估计算法,通过在沙漏网络原始残差模块中融入坐标注意力机制进行特征增强,抑制无用特征的同时增强有用特征,从而提高对人体中小尺度关节点的识别准确率.实验结果表明,该模型在COCO数据集上获得了64.9%的平均准确率,在MPII数据集上正确关键点的比例达88.8%,验证了网络的有效性.  相似文献   

11.
为了应对计算机视觉中多目标追踪任务的挑战。针对网络中使用的锚点造成重识别训练模糊的问题,通过可生成参考点的可变形Transformer,提出了一个端到端的多目标追踪系统(tracker Transformer,TKTR)。由骨干网络模块提取特征图,将其送入可生成参考点的可变形Transformer架构,以检测目标并生成代表检测框中心的参考点;利用参考点对候选目标进行空间位置约束并计算检测框的交并比来关联目标。实验结果表明,TKTR利用Transformer的查询特征向量对目标进行位置约束,提高了追踪精度,并且降低了ID切换的指标。  相似文献   

12.
卷积神经网络中的卷积操作只能捕获局部信息,而Transformer能保留更多的空间信息且能建立图像的长距离连接.在视觉领域的应用中,Transformer缺乏灵活的图像尺寸及特征尺度适应能力,通过利用层级式网络增强不同尺度建模的灵活性,且引入多尺度特征融合模块丰富特征信息.本文提出了一种基于改进的Swin Transformer人脸模型——Swin Face模型.Swin Face以Swin Transformer为骨干网络,引入多层次特征融合模块,增强了模型对人脸的特征表达能力,并使用联合损失函数优化策略设计人脸识别分类器,实现人脸识别.实验结果表明,与多种人脸识别方法相比,Swin Face模型通过使用分级特征融合网络,在LFW、CALFW、AgeDB-30、CFP数据集上均取得最优的效果,验证了此模型具有良好的泛化性和鲁棒性.  相似文献   

13.
作为一种跨摄像头的检索任务,行人重识别会受到不同相机视角造成的图像样式变化的影响。近年来,许多算法通过神经网络直接从原始输入图片中学习相应特征,虽然这些特征能够很好地描述全局行人,但忽略了许多局部细节信息,在复杂的场景下容易出现误识别。针对此问题,研究了一种基于多任务学习的新的特征表示方法,采用成对输入的孪生网络结构,将局部最大出现特征(local maximal occurrence,LOMO)和深层特征一起送入网络并映射到单一的特征空间中进行训练,形成一种新的网络模型TDFN(traditional and deep features fusion network)。利用神经网络自我学习特性,联合多个任务的损失函数更新网络,使得深层特征学习到更多与手工局部特征互补的细节信息。实验表明,新特征的平均精度mAP和Rank-1精度都优于直接从孪生网络提取的全局描述子。  相似文献   

14.
基于文本的行人重识别模型通常依赖于全局特征对齐和局部特征对齐,但模态间和模态内的相关信息常被忽略。提出了一种基于关系挖掘的跨模态行人重识别方法,该方法包括双流主干网络、负相似度挖掘模块、关系编码器。首先,通过双流主干网络实现了全局和局部特征对齐;其次,通过负相似度挖掘模块提升了图像-文本对特征辨别的细粒度;最后,通过关系编码器模块分别学习图像和文本中隐含的关系信息,实现关系级别的特征对齐。在CUHK-PEDES数据集和ICFG-PEDES数据集上的实验结果证明,文中方法能够达到较高的识别精度。  相似文献   

15.
引入遮挡网络模型的概念,提出了一种适用于遮挡的网格跟踪算法,遮挡区域检测和网格节点运动估计是跟踪算法的关键。改进的遮挡检测方法可以更加准确检测遮挡区域,能有效地提高遮挡及其相邻区域运动估计的准确度;采用了基于特征窗口匹配的网格节点运动估计方法,有效地避免了块匹配法产生的块效应。实验证明,本文算法可以有效进行运动跟踪,具有较了的视觉效果。  相似文献   

16.
行人再识别是计算机视觉领域的一项重要任务,但大多数现有模型很大程度上依赖于颜色外观。针对目前很少研究解决目标人物衣服不一致的行人再识别问题,提出一种新的表征学习模型。该模型通过对抗性学习和特征分离来产生不受服装颜色或图案影响的体型特征表示。同时,由于缺乏包含同一个人服装变化的行人再识别数据集,创建了一个合成数据集来模拟服装变化。4个数据集(两个基准行人再识别数据集,一个跨模态行人再识别数据集,合成数据集)的定量和定性结果证实了该方法对几种最先进的方法的鲁棒性和优越性。  相似文献   

17.
马永忠  夏保丽 《广西科学》2023,30(1):139-148
针对现有僵尸网络检测方法检测精度不高和检测时间开销较大的问题,提出一种基于改进Transformer和强化学习的僵尸网络域名生成算法(Domain Generation Algorithm,DGA)的域名检测方法。首先,利用深度可分离卷积替换ResNet和ResNeXt网络中的卷积块,通过减少网络模型参数来降低模型的时间开销;其次,利用改进后的ResNet和ResNeXt网络将域名字符串映射到深度特征空间,构造多尺度特征,强化特征的表达能力;再次,利用长短期记忆神经网络(Long Short-Term Memory,LSTM)对Transformer网络进行改进,在保持字符间相对位置的同时,进一步建立上下文的长距离依赖编码,并在此基础上引入注意力机制,强化模型对关键特征的捕获能力;最后,引入强化学习对模型进行微调,提高DGA域名的检测精度。在多个DGA域名数据集上进行测试验证,结果表明该模型在保持检测时间开销较小的基础上,具有更高的检测精度。  相似文献   

18.
目的 健康状态是评估锂离子电池状态的关键参数,对锂离子电池的安全使用有着十分重要的意义,为了获得准确可靠的健康状态估计结果,建立基于卷积神经网络和Transformer的锂离子电池健康状态估计方法,利用不同模型的数据挖掘特性,将健康指标的深层信息和随循环周期增加的时序信息并行提取。方法 从锂离子电池放电过程中的部分电压和温度曲线中提取3个与健康状态相关性较强的健康指标作为模型输入,利用卷积神经网络强大的特征提取能力挖掘健康指标的局部特征,利用Transformer的顺序处理能力挖掘健康指标的时序特征,将健康指标的局部特征和时序特征进行特征融合,通过卷积和全局平均池化层输出健康状态估计值。结果 本研究使用MIT数据集进行实验验证,并与卷积神经网络和长短时记忆神经网络进行对比分析,所提出的方法的均方根误差和平均绝对误差是最低的,为0.11和0.08,最小相对误差为0.61%。结论 所提出的CNN-Transformer健康状态估计采用不同模型挖掘健康指标不同的特征信息,能够充分利用锂离子电池放电数据,且具有良好的估计效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号