首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 343 毫秒
1.
针对花样滑冰运动人体运动轨迹复杂、动作类型多样、普通人肉眼难以区分且常规的行为识别方法识别准确率低的问题,提出了一种基于时空图卷积网络与多通道注意力机制融合方法 (SAT-GCN)的花样滑冰动作识别算法。该算法首先将视频提取成连续的单独帧,使用OpenPose算法提取人体骨骼关键点数据,降低背景噪声干扰;然后使用时空图卷积算法对骨骼关键点数据进行动作分类。算法对时空图卷积算法进行改进,加入了多通道时空注意力机制融合模块,使得模型更加关注重要的关键点、时间帧片段、特征;使用时序卷积网络(TCN)提取人体骨架关键点在时间序列上的特征;使用SoftMax对提取后的特征进行动作分类。在花样滑冰数据集FSD-10和公开的人类行为数据集Kinetics-Skeleton上进行训练和测试,与改进前的时空图卷积网络(ST-GCN)进行对比,本文所提算法的预测准确率在2个数据集上均有所提升,验证了多通道注意力机制融合方法在花样滑冰选手动作检测任务中的有效性。  相似文献   

2.
目前许多肺炎图像分类网络大多采用单分支网络对输入图像进行特征提取,这在一定程度上忽略了图像不同维度的特征信息。为了优化这种问题,提出一种融入注意力机制的双分支肺炎图像分类网络,利用VGG16网络和加入可分离卷积以及融入卷积注意力模块(convolution block attention module, CBAM)的CNN卷积神经网络进行双分支特征提取,能够关注到肺炎图像不同层次的特征信息,将2种网络分支的特征进行不同维度的融合,最后输入全连接层进行分类判决。结果表明,该网络在正常肺部、病毒性肺炎、新型冠状病毒肺炎(COVID-19)X-ray图像组成的测试集上取得了95%的平均准确率。经过消融试验证明,该网络加入的可分离卷积模块、注意力模块和特征融合对减少网络参数、提高网络分类的准确率起到明显作用。与其他网络的性能对比也表明该网络在肺炎图像分类上表现出较高的准确率和较强的鲁棒性。  相似文献   

3.
针对人工检测桥梁表面缺陷存在精度低、速度慢和漏检率高等问题,该文提出了基于深度卷积生成式对抗网络(deep convolutional generative adversarial networks,DCGAN)和改进YOLOv5s的桥梁表面缺陷检测识别模型.首先,通过DCGAN网络对自主采集的桥梁表面缺陷图像进行数据增强,建立每类缺陷样本数量较为均衡的数据集; 其次,在YOLOv5s模型基础上嵌入CBAM注意力机制模块,使模型将注意力集中于缺陷区域,从而提升图像分类的准确率; 最后,为验证所提方法的适用性,将包含4类桥梁表面缺陷的数据集进行训练与测试.实验结果表明:该文提出的模型在桥梁表面缺陷检测上的准确率为92%,相比其他深度学习模型具有更高的检测精度和鲁棒性.  相似文献   

4.
随着卷积神经网络(Convolutional Neural Networks,CNN)的不断改进,基于CNN的图片匹配成为图像处理的关键,然而,许多基于CNN的图像相似度检测算法对图像特征的表达能力较差,且曼哈顿距离或欧式距离的计算方式导致在计算损失函数时模型不一定能很好地收敛.针对此问题,提出一种基于孪生网络和注意力机制的方法(CSNET)来提升图像匹配的性能,主要步骤如下:使用将激活函数改进为Mish函数的VGG16网络作为主干网络提取图像的特征,在模型的卷积层加入注意力机制模块(Convolutional Block Attention Module,CBAM),这提高了模型的特征提取能力和鲁棒性,保证训练可以收敛.对模型输入图片对的特征向量的欧氏距离,再利用网络全连接层输出的相似度分数来度量被检图片是否相似.将提出的CSNET与其他图片匹配方法在Omniglot和SigComp2011等数据集上进行比较,实验结果表明,CSNET能有效提高图像相似度匹配的准确性.  相似文献   

5.
针对现有细粒度图像分类算法普遍存在的模型结构复杂、参数多、分类准确率较低等问题,提出一种注意力特征融合的SqueezeNet细粒度图像分类模型.通过对现有细粒度图像分类算法和轻量级卷积神经网络的分析,首先使用3个典型的预训练轻量级卷积神经网络,对其微调后在公开的细粒度图像数据集上进行验证,经比较后选择了模型性能最佳的SqueezeNet作为图像的特征提取器;然后将两个具有注意力机制的卷积模块嵌入至SqueezeNet网络的每个Fire模块;接着提取出改进后的SqueezeNet的中间层特征进行双线性融合形成新的注意力特征图,与网络的全局特征再融合后分类;最后通过实验对比和可视化分析,网络嵌入Convolution Block Attention Module(CBAM)模块的分类准确率在鸟类、汽车、飞机数据集上依次提高了8.96%、4.89%和5.85%,嵌入Squeeze-and-Excitation(SE)模块的分类准确率依次提高了9.81%、4.52%和2.30%,且新模型在参数量、运行效率等方面比现有算法更具优势.  相似文献   

6.
动物种类的识别一直是图像识别领域的重点,为了更好地对图像中动物进行识别、帮助社会对家庭宠物的管理,本论述提出一种基于ACNet模块和CBAM注意力机制模块而改进的ACResNet18模型用来识别猫狗种类,通过非对称卷积快增强网络模型的核骨架,实现更有效的特征提取,引入CBAM注意力机制加强网络识别精度,能够更精确地对图像中猫狗进行识别和分类。本次实验使用Kaggle竞赛中的猫狗数据集进行图像识别,并通过对比实验,验证了相比于原模型,改进后的模型准确率有明显提升,最终提高了模型在图像分类上的精确度和鲁棒性,证实了该模型的可靠性。  相似文献   

7.
马宇  单玉刚  袁杰 《科学技术与工程》2021,21(25):10789-10795
对番茄病害进行识别,近年来一直是植物病害预防的研究热点。由于受到复杂背景干扰,番茄叶部病害识别准确率不高,针对这一问题,提出一种基于三通道注意力机制网络的番茄叶部病害识别方法。该网络基于ResNeXt50残差网络,将注意力模块嵌入至残差网络的ResNeXt模块中可以并行提取目标的通道特征和空间特征,获取有效的语义信息。训练阶段通过设计双损失函数和数据增强进一步提升分类准确度,并通过迁移学习网络预训练参数的方式提高网络训练效率。实验结果表明,使用双损失函数和数据增强后,基于三通道注意力网络的番茄病害识别算法在测试集上的平均识别准确率达98.4%,相比于传统机器学习方法和其他神经网络方法的准确率更高,检测速度满足实时性,Kappa系数为0.96,满足叶部病害识别的高精度要求。该方法能够有效地对10种番茄叶部病害进行识别,为植物病害识别提供了一种新的思路。  相似文献   

8.
针对细粒度图像分类中数据分布具有小型、非均匀和不易察觉类间差异的特征,提出一种基于注意力机制的细粒度图像分类模型.首先通过引入双路通道注意力与残差网络融合对图像进行初步特征提取,然后应用多头自注意力机制,达到提取深度特征数据之间细粒度关系的目的,再结合交叉熵损失和中心损失设计损失函数度量模型的训练.实验结果表明,该模型在两个标准数据集102 Category Flower和CUB200-2011上的测试准确率分别达94.42%和89.43%,与其他主流分类模型相比分类效果更好.  相似文献   

9.
针对目前细粒度图像分类算法存在的局部区域特征捕捉不全面的问题,在B-CNN算法基础上提出了一种基于注意力机制的细粒度图像分类算法。首先利用数据增强的6种方式对训练数据集进行扩充,然后在B-CNN算法的特征提取中引入注意力机制,使用卷积注意力模块CBAM精准获取图像局部区域特征,最后融合特征进行分类。改进后的算法分别在CUB-200-2011和Stanford Cars两个数据集上进行实验,与当前先进算法比较,所提算法提高了细粒度图像的分类效果。  相似文献   

10.
为了更好地对道地药材产地进行识别,文中提出一种激光诱导击穿光谱(Laser-induced breakdown spectroscopy, LIBS)技术与卷积神经网络(Convolutional neural networks, CNN)相结合,并在网络结构中加入卷积块注意力模块(Convolutional block attention module, CBAM)的药材产地识别混合模型(CNN-CBAM).该模型采用端到端的网络结构,利用CNN挖掘数据中的深层特征,通过加入注意力机制来提升网络的特征提取能力.实验采集5个不同产地黄芪的LIBS光谱数据,通过构建的混合模型对测试集的识别精度进行评估,发现相较于未改进的CNN模型以及传统机器学习中的支持向量机和随机森林算法模型,改进后的CNN在测试集上的准确率可达到100%.研究结果证明了LIBS技术结合CNN-CBAM网络模型对中药材产地进行准确识别的有效性.  相似文献   

11.
以YOLOv5s网络模型为基础,引入注意力机制CBAM模块,基于Ghost卷积模块重构网络模型的卷积操作,提出一种面向扶梯不安全行为的改进型深度学习检测算法.然后,在自主收集的扶梯不安全行为数据集上对其进行训练评估.结果表明,所提算法在检测精度有所提高的同时,大幅减少了检测所需的参数量和计算量.  相似文献   

12.
在电力系统巡检过程中,人工巡检方式难度较高,且存在安全隐患,搭载智能算法的无人机平台代替人工进行绝缘子检测的方法前景较好。针对绝缘子缺陷目标检测过程中存在的速度较慢、准确度较低等不足,提出了融合注意力机制的改进型YOLOv5绝缘子缺陷故障检测方法,该方法在YOLOv5s网络中融入SE注意力模块和CBAM注意力模块,并且将SE注意力模块与网络结构当中的C3模块结合,强化了网络的特征提取能力。通过相关的图像处理方法完成了自建绝缘子数据集的构建,采用了k-means++聚类算法构建自建数据集的先验框,并引入了Mosaic-9数据增强策略,有效解决了训练数据不足难以保证训练效果的问题。实验验证表明,改进后的检测方法,在不影响检测时间的前提下,绝缘子检测的准确度提升9.7%,对电力系统巡检方法具有一定参考意义。  相似文献   

13.
针对YOLOv4算法在行人检测中精度低,实时性差的问题,提出一种基于YOLOv4的改进算法.首先将MobileNetv2作为主干网络,在减少参数量的同时保证其特征提取能力,同时在MobileNetv2中加入Bottom-up连接,减少浅层信息的丢失;然后在特征融合网络嵌入卷积模块的注意力机制模块(convolution...  相似文献   

14.
准确检测交通标志已成为自动驾驶不可或缺的任务之一。基于现实场景中小而密集的交通标志,传统方式检测交通标志存在精度较低这一缺陷。针对此问题,提出一种融合RepVGG模块的改进YOLOv5的交通标志识别算法。首先将原算法的部分CBS模块替换为RepVGG模块,加强特征提取能力。并在Neck层融合CBAM注意力机制,强化检测模型的抗干扰能力。最后,在网络训练过程中,使用EIOU损失函数来弥补GIOU损失函数的不足,提高算法的检测精度与迭代速度。实验结果表明,改进后的YOLOv5算法,迭代速度更快,在CCTSDB交通标志数据集上的P、R、mAP值分别达到91.55%、85.04%、91.71%,相比YOLOv5算法能够更好的应用到实践当中。  相似文献   

15.
基于改进YOLOv3的交通标志检测   总被引:2,自引:0,他引:2  
针对交通标志检测小目标数量多、定位困难及检测精度低等问题,本文提出一种基于改进YOLOv3的交通标志检测算法.首先,在网络结构中引入空间金字塔池化模块对3个尺度的预测特征图进行分块池化操作,提取出相同维度的输出,解决多尺度预测中可能出现的信息丢失和尺度不统一问题;然后,加入FI模块对3个尺度特征图进行信息融合,将浅层大特征图中包含的小目标信息添加到深层小特征图中,从而提高小目标检测精度.针对交通标志数据集特点,使用基于GIoU改进的TIoU作为边界框损失函数替换MSE函数,使得边界框回归更加准确;最后,通过k-means++算法对TT100K交通标志数据集进行聚类分析,重新生成尺寸更小的候选框.实验结果表明,本文算法与原始YOLOv3算法相比mAP提升11.1%,且检测每张图片耗时仅增加6.6 ms,仍符合实时检测要求.与其他先进算法相比,本文算法具有更好的检测精度和检测速度.  相似文献   

16.
蒲玲玲  杨柳 《科学技术与工程》2023,23(28):12159-12167
多车辆目标跟踪时间主要花费在车辆检测模块和对每个车辆表观特征提取模块,一般情况下,车辆检测和车辆表观特征提取是在不同的神经网络中进行的,且一张图中的车辆目标越多,对车辆表观特征提取耗费时间的也越多,推理时间也相应变长。针对这一问题,基于经典的Tracking-By-Detection模式,提出一种改进的YOLO模型:在YOLO网络中添加ReID特征识别模块,使YOLO在输出目标位置信息的同时输出目标特征信息,以提高算法的跟踪速度。针对车辆间彼此覆盖的情况,提出一种基于动态IOU阈值的非极大抑制算法,以提高算法的跟踪精度。最后将YOLO输出的信息进行数据匹配,从而实现多目标跟踪。在UA-DETRAC数据集上验证改进模型的有效性,实验结果表明,将YOLOv5网络进行改进后运用在目标跟踪算法中,相对于经典的YOLO+DeepSORT跟踪模型,在车辆密集的情景下平均推理时间减少了17%;在改进后的网络上添加动态IOU阈值非极大抑制,跟踪精度提高了3.9个百分点。改进后的模型有较好的实时性与跟踪准确率。  相似文献   

17.
针对自动驾驶情景下行人目标检测过程中对于重叠和遮挡目标存在的漏检问题,提出一种改进多尺度网络YOLOv5的行人目标检测算法。首先构建同时考虑通道间关系和特征空间位置信息的多重协调注意力模块,增加网络特征表达能力;然后将原损失函数改进为具有双重惩罚项的切比雪夫距离交并比损失函数,提高检测框的精确度与网络收敛速度;最后在网络结构方面设计瓶颈状DSP1_X和DSP2_X模块减少梯度混淆。实验结果表明,改进后的多尺度网络收敛能力提高,在面对行车中复杂行人目标检测时具有较高的判别精度和实时检测速度。  相似文献   

18.
无人机技术的不断成熟,使得搭载高效视觉系统的无人机应用也更加广泛。针对无人机航拍图像中小目标较多、分辨率低等原因导致的检测精度不高的问题,提出了一种改进RetinaNet的无人机航拍目标检测算法。算法针对特征图中小目标信息提取不足的问题,设计了多阶段特征融合方法,并将其与注意力机制串联设计了特征挖掘模块,可以在浅层特征图中融入深层的语义信息,丰富小目标特征;设计了基于中心点检测的无锚框(Anchor-free)方法,网络通过对中心点的回归来定位目标,而不是通过固定大小的锚框去匹配,这样做可以使网络对小目标的回归更加灵活,提高了算法的整体性能;且通过深度可分离卷积方法对网络进行轻量化设计,以压缩模型大小并提高检测速度。实验结果表明,改进算法较原RetinaNet算法平均精度提升了8.5%,检测速度提升了6帧/s,且与其他先进算法相比也具有性能优势,达到了检测精度与检测速度的均衡。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号