期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

林志鸿郑力新曾远跃《华侨大学学报(自然科学版)》2023,(6):751-758

为实现自动扶梯场景下姿态估计的快速响应和准确估计，提出一种基于空间依赖的多任务解耦姿态网络(MTDPN)。首先，对姿态估计网络进行定位和分类任务分支的解耦，使每个任务分支能够自适应地调整特征关注方向；其次，提出一种空间依赖卷积，通道联合层和空间联合层作为中间层，以逐点卷积和逐深度卷积取代传统卷积，从而降低MTDPN的参数量和浮点计算量，使每张图片的检测时间仅为73.3 ms。在扶梯危险行为关键点数据集和COCO关键点数据集上对MTDPN进行评估。结果表明：与原始网络YOLOPOSE相比，MTDPN在扶梯危险行为关键点数据集和COCO关键点数据集上的准确性指标均有所提高。相似文献

2.

基于注意力机制改进的多人姿态估计网络研究

底家治王奔《杭州师范大学学报(自然科学版)》2024,(3):248-254+264

为解决多人姿态估计中小尺度关节点定位准确率低的问题,采用自顶向下的方法,结合人体目标检测模型YOLOv4-tiny,提出一种基于堆叠沙漏网络改进的多人姿态估计网络.该网络包含人体目标检测器和人体姿态估计算法,通过在沙漏网络原始残差模块中融入坐标注意力机制进行特征增强,抑制无用特征的同时增强有用特征,从而提高对人体中小尺度关节点的识别准确率.实验结果表明,该模型在COCO数据集上获得了64.9%的平均准确率,在MPII数据集上正确关键点的比例达88.8%,验证了网络的有效性. 相似文献

3.

结合二阶注意力机制的多尺度人体姿态估计

张云绚董绵绵王鹏李晓艳吕志刚邸若海毋宁《科学技术与工程》2022,22(32):14321-14327

为解决人体姿态估计任务中存在的不同视角下人体实例尺度变化、遮挡问题导致的人体关键点定位不准确问题,提出融入二阶注意力机制的多尺度人体姿态估计网络模型GOS-HRNet。首先,在特征提取阶段为了获得高质量的特征图,通过在多分辨率网络结构中使用Octave卷积,保留更多的图像空间特征信息以提高关键点定位准确率;然后,为有效的利用图像上下文信息,融入二阶注意力模块使网络能更好地学习各分辨率表征的空间信息;最后,为了应对尺度变换对关键点定位的影响采用尺度增强训练方法,提高模型对尺度变化的鲁棒性。所提模型在MS COCO 2017数据集上进行实验,结果表明：所提出的GOS-HRNet模型平均检测精度比HRNet模型提升了2.2%,能够更加准确地利用上下文信息、丰富空间特征信息以提高对关键点定位的准确性。相似文献

4.

基于姿态估计和Transformer模型的遮挡行人重识别

陈禹刘慧梁东升张雷《科学技术与工程》2024,24(12):5051-5058

行人重识别是利用人工智能解决边防检查、人员追踪等公共安全应用问题的技术,具有从跨设备采集的图像中识别某一特定行人的能力。但是在人员追踪等问题中,往往会出现行人刻意遮挡、复杂场景环境遮挡等因素,大大提高了行人重识别的难度。针对行人重识别遮挡问题,基于ResNet50网络,结合姿态估计（Pose estimation）和转换器（Transformer）模型,提出了一种改进的行人重识别网络PT-Net,以提高遮挡条件下的行人重识别能力。该方法首先利用现有的姿态估计方法对输入图像进行关键点检测,并将关键点信息与行人特征图像结合起来生成一个基于姿态的行人特征表示;然后利用Transformer模型对基于姿态的行人特征表示编码,用来实现特征对齐和特征融合。论文基于国际公开的数据集Occluded-Duke开展实验验证,结果表明,PT-Net方法相对于基线模型,其均值精度mAP和相似度排序Rank-1指标分别提高了1.3和1.5个百分点,验证了该方法的有效性和优越性。相似文献

5.

基于注意力机制和多尺度特征融合的绝缘子缺陷检测方法

马学森马吉蒋功辉许雪梅周天保《南京大学学报(自然科学版)》2022,(6):1020-1029

随着深度学习的快速发展,利用目标检测算法对航拍绝缘子图像进行缺陷检测成为绝缘子巡检的主要方式.针对传统目标检测算法对小目标的检测精度较低、特征图的表征能力较弱和提取的关键信息较少的问题,提出以YOLOv5l为基础网络的改进的基于注意力机制和多尺度特征融合的绝缘子缺陷检测方法 AMF-YOLOv5l(Attention Mechanism and Multi-Scale Feature Fusion Based on YOLOv5l).首先,通过增加一个小目标检测头,提高模型对小目标的检测性能;然后,构造DSPP(Dilated Spatial Pyramid Pooling)模块,充分融合多尺度特征,增强特征图的表征能力;最后,引入CA(Coordinate Attention)注意力机制,使网络更加专注于关键信息.在航拍绝缘子数据集APID(Aerial Photographic Insulator Dataset)以及两个公共数据集PASCAL VOC和MS COCO上分别验证该方法的可行性.实验结果表明,在APID数据集中该方法的AP(Average Precision)比YOL... 相似文献

6.

基于高分辨率网络的人体姿态估计

朱翠涛李博《中南民族大学学报(自然科学版)》2023,(2):229-237

针对高分辨率网络中存在不同分支特征交叉融合导致参数量大、运算复杂度高等问题,提出了一种基于高分辨率检测网络（HRNet）的人体姿态估计优化网络模型.引入空洞空间卷积池化金字塔替代多分辨率分支网络交叉融合过程,同时引入注意力机制,提高网络输出特征图质量,从而保证改进后网络检测的准确度.在环境配置和网络输入图像分辨率一致的情况下,所提出的模型在COCO数据集上实验结果较HRNet相比参数量下降38.6%,运算复杂度下降35.2%.实验结果表明：改进后网络在检测精度略微下降的情况下,能有效降低参数量、运算复杂度. 相似文献

7.

基于HRNet的轻量化人体姿态估计网络

下载免费PDF全文

梁桥康 ? 吴樾《湖南大学学报(自然科学版)》2023,(2):112-121

由于算力和内存的限制，目前的人体姿态估计网络难以广泛应用于移动设备、嵌入式平台.针对这个问题，本文以HRNet为基础框架，提出了一种轻量化的人体姿态估计网络X-HRNet，使用ResNeXt模块替换普通的Basic模块以减少网络的参数和计算复杂度.实验结果表明，所提出模型在COCO验证集上取得了78.2%的精度，比HRNet高1.9%，参数量下降了22.2M，计算量下降了27.3GFLOPs.与以往的轻量化人体姿态估计方法不同，所提出的X-HRNet是一种兼顾精度和轻量化的方法，在保持精度的同时有效减少了计算量和参数量，为嵌入式平台提出了一种新的轻量化人体姿态估计网络. 相似文献

8.

多模块融合的浮游生物检测器

齐雷胡姣婵于双和阎妍赵颖《江苏大学学报(自然科学版)》2021,42(6):727-732

针对传统海洋浮游生物利用人工提取特征的传统检测方法,存在检测精度低、检测过程冗余等问题,基于深度学习技术,提出了多模块融合的浮游生物检测器(multi module fusion single shot detector,MMFSSD).首先,提出了特征信息增强模块,在不增加网络复杂性的前提下增加了网络的感受野,将下采样图像注入该模块中,以增强特征图的低级特征信息.在此基础上,进一步提出了选择性特征融合模块,在网络中学习融合时的权重,选择性地融合不同尺度的特征.有效性验证试验结果表明,在数据集PASCAL VOC和MS COCO中的平均精度均值分别为80.70％和32.20％,在浮游生物数据集PMID2019中的平均精度均值达到90.41％. 相似文献

9.

基于多视图融合的3D人体姿态估计

胡士卓周斌胡波《中南民族大学学报(自然科学版)》2023,(1):103-110

针对自然场景中遮挡、检测姿势不准确以及建立的交叉视图不匹配等问题,在VoxelPose模型的基础上提出了一种基于heatmap的多视图融合网络来估计3D人体姿态.首先,改进高分辨率网络,添加反卷积模块生成更高分辨率的heatmap.取两个髋关节之间的关键点为人体中心点,引入对极约束模型匹配融合不同视角下人体中心点的heatmap信息;然后,将所有视角的heatmap投影到共同的3D空间,再经过3D CNN网络以中心点构建特征体积来估计所有关键点的位置;最后,回归准确的3D人体姿态.在公开的数据集Shelf和Campus中,评估指标PCP3D（正确估计关节位置的百分比）分别达到97.1%和96.7%.在CMU-Panoptic数据集中,MPJPE（关节位置误差的平均值）为16.80 mm,实验结果优于VoxelPose. 相似文献

10.

基于GBDT和HOG特征的人脸关键点定位

张重生彭国雯于珂珂《河南大学学报(自然科学版)》2018,(2)

人脸关键点检测是计算机视觉领域的一个重要分支,其检测精度将在很大程度上影响人脸识别和表情分析的结果.提出一种新的解决人脸关键点检测问题的方法,即H-GBDT.H-GBDT是一种基于GBDT决策树和HOG特征的人脸关键点检测算法,该算法是将人脸图像的HOG特征作为GBDT的输入,关键点的真实坐标作为GBDT的输出来训练预测模型,在该过程中每个关键点将分纵坐标和横坐标两次在GBDT中做回归运算,并经过不断的调整GBDT和HOG特征的参数来训练出最佳预测模型.在BioID、LFW、LFPW三种数据集上验证H-GBDT算法的性能.BioID是正脸数据集,实验结果表明H-GDBT在该数据集上的检测效果最佳,其检测误差基本上可控制在2%以内;而LFW和LFPW是自然场景下的数据集,H-GBDT在这两种数据集上的检测误差一般在2%~4%之间. 相似文献