首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 56 毫秒
1.
现如今,基于YOLOv5的网络模型被广泛应用在行人检测的任务中,在精度和速度上有着良好的效果。但在终端设备上部署使用,往往受到算力的限制。因而,基于RepVGG模型改进的主干网络,并且为了提高在密集人群和复杂环境下的适应性,加入了坐标注意力机制,扩大感受野的同时增强感兴趣区域的权重。经过实验测试,这种轻量化的网络参数量和计算量比较小,而且检测精度和鲁棒性也比较高,能够在一定程度下满足工程应用的要求。  相似文献   

2.
针对目前交通标志检测深度学习网络模型体积大、参数多,难以满足在计算资源有限的移动设备和嵌入式设备中部署的问题,提出一种基于YOLOv5的轻量化交通标志检测模型。该模型利用GhostNet思想重新建构YOLOv5网络,同时在特征提取层引入坐标注意力机制(coordinate attention, CA),并将原边框损失函数CIOU替换为SIOU,最后使用NVIDIA的加速推理框架TensorRT对改进模型加快推理速度。在CCTSDB2021交通标志数据集中验证了改进模型的可行性,实验结果表明,改进模型较于原模型,模型大小减小了53.5%,参数量压缩了50%,而精度仅损失0.1%,且模型推理速度提升了2%;经过TensorRT加速推理后,推理速度甚至提升了57.4%,达到了4 ms。改进模型实现了模型的轻量化,精度损失小,推理速度快,相比原模型更适合部署到嵌入式移动设备中。  相似文献   

3.
针对现有的无人机检测算法无法同时兼顾检测速度及检测精度的问题,本文提出了一种基于YOLOv5s(You Only Look Once)的轻量化无人机检测算法TDRD-YOLO(Tiny Drone Real-time Detection-YOLO).该算法首先以YOLOv5s的多尺度融合层和输出检测层分别作为颈部网络和头部网络,引入MobileNetv3轻量化网络对原骨干网络进行重构,并将骨干网络后的通道在原YOLOv5s的基础上进行压缩,减小网络模型大小;其次,将骨干网络中Bneck模块的注意力机制由SE修改为(Convolutional Block Attention Module,CBAM)并在颈部网络引入CBAM,使网络模型更加关注目标特征;最后修改颈部网络的激活函数为h-swish,进一步提高模型精度.实验结果表明:本文提出的TDRD-YOLO算法平均检测精度达到96.8%,与 YOLOv5s相比,参数量减小到原来的1/11,检测速度提升1.5倍,模型大小压缩到原来的1/8.5.实验验证了本文算法可在大幅降低模型大小、提升检测速度的同时保持良好的检测性能.  相似文献   

4.
郭朦  陈紫强  邓鑫  梁晨 《科学技术与工程》2022,22(27):12038-12044
随着交通行业的发展,交通标志检测识别成为了辅助驾驶系统中最热门的研究方向之一。在实际行车道路中,交通标志具有目标小且类别繁多的特点,针对现有检测与识别算法难以同时兼顾准确度和速率的问题,提出一种YOLOv5l(you only look once version 5l)与视觉转换器(vision transformer, ViT)结合的检测与识别方法。首先采用YOLOv5l对目标进行检测,得出交通标志的位置信息,再将其输入ViT进行分类识别,其中特征连接部分引入DenseNet网络模块,来实现原始特征和卷积后特征映射的密集连接,加强特征的传递性,提高识别率。结果表明:在GTSDB和GTSRB数据集上实验效果更佳,交通标志检测速率达到20 ms,准确率达到98.78%,相比全连接层识别准确率提高了约4%。  相似文献   

5.
针对汽车前置摄像头所拍路况实景中的远距离交通标志占整个画面的比例较小、自动检测较难的问题,本文提出一种改进YOLOv3的卷积神经网络结构.在原YOLOv3算法结构上去掉了13×13这个冗余的大感受野检测层,结合残差结构思想,将深层特征进行上采样,然后与浅层特征图进行张量拼接,得到104×104的尺度检测层,进一步提高对...  相似文献   

6.
针对复杂场景下交通标志检测存在精度低、检测速度慢等问题,提出一种基于YOLOv3改进的S-YOLO(stronger-YOLO)交通标志算法。首先,合并批归一化层到卷积层,以提升模型前向推理速度;其次,采用二分K-means聚类算法,确定适合交通标志的先验框;然后引入空间金字塔池化模块,提取特征图深度特征;最后引入完整-交并比(complete-IoU,CIoU)回归损失函数,提升模型检测精度。实验结果表明,在重制的中国交通标志数据集(Chinese traffic sign dataset,CTSDB)下,所提算法与YOLOv3相比,平均准确率和检测速度分别提升了4.26%和15.19%,同时相较YOLOv4以及其他算法对交通标志识别有更优的精度和速度,具有良好的鲁棒性,满足复杂场景高效实时检测。  相似文献   

7.
8.
针对密集行人检测中行人之间高度遮挡重叠所带来的精度低和漏检高的问题,提出一种单阶段密集行人检测方法Dense-YOLOv5。实验基于YOLOv5-L,首先使用改进的RepVGG模块来替代原有3×3卷积加强密集场景下特征信息的提取;然后在原有3个检测头的基础上添加1个检测头降低对小尺度行人的漏检;最后在网络特征融合阶段引入注意力机制,添加1个高效通道注意力(efficient channel attention,ECA)模块提高对有用信息定位的精度。实验结果表明:DenseYOLOv5相比原YOLOv5在CrowdHuman数据集上,在保证实时性的前提下,平均精度(AP)提高了3.6%,对数漏检率平均值(MR-2)降低了4.0%,证明了Dense-YOLOv方法在密集行人检测中的有效性。  相似文献   

9.
车辆的增多造成了交通事故的多发,智能技术有利于解决这一问题,交通标志牌识别系统应运而生。TSR通过对道路上的交通标志牌准确检测和识别,有效提示驾驶员规范和安全行驶,减少交通事故的发生。本文归纳总结近几年学者们的研究成果,利用交通标志牌的特征和有效的方法对其进行高效检测和识别,提高检测和识别的实时性和准确性。  相似文献   

10.
为了解决车辆目标检测中准确率低的问题,提出了一种基于改进YOLOv5算法的车辆目标检测.改进后的YOLOv5算法主要是在原来的基础上通过K-means聚类的方法对数据集中的目标边框进行重新聚类、并将CIoU损失函数和DIoU_nms应用于YOLOv5算法来提高目标识别效果.改进后的YOLOv5算法,目标检测mAP达到了85.8%,比改进前的YOLOv5算法提升了1.3%.  相似文献   

11.
针对密集场景下行人检测的目标重叠和尺寸偏小等问题,提出了基于改进YOLOv5的拥挤行人检测算法。在主干网络中嵌入坐标注意力机制,提高模型对目标的精准定位能力;在原算法三尺度检测的基础上增加浅层检测尺度,增强小尺寸目标的检测效果;将部分普通卷积替换为深度可分离卷积,在不影响模型精度的前提下减少模型的计算量和参数量;优化边界框回归损失函数,提升模型精度和加快收敛速度。实验结果表明,与原始的YOLOv5算法相比,改进后YOLOv5算法的平均精度均值提升了7.4个百分点,检测速度达到了56.1帧/s,可以满足密集场景下拥挤行人的实时检测需求。  相似文献   

12.
绝缘子缺陷检测是电网巡检过程中重要的一环,为提高绝缘子缺陷检测的精度,该文提出一种基于改进YOLOv5算法的绝缘子缺陷检测算法——YOLOv5t,能够在保证网络运行速度的条件下,提升网络的检测精度.该算法在YOLOv5s的基础上,将三重注意力机制(triplet attention)添加到骨干网络中,给予每个特征通道不同的权重,以提高网络的检测精度;并采用CIoU Loss作为网络回归损失的损失函数,提升网络的收敛速度;同时将Soft-NMS作为网络的预测结果处理方法,降低网络的漏检率.YOLOv5t与几种常用的缺陷检测网络的对比实验结果表明,YOLOv5t的准确率达到97.2%,召回率达到98%,平均精度均值达到99.1%,较YOLOv5s算法分别提升了0.9%、5.1%和2.1%,并且检测速度没有受到影响.  相似文献   

13.
针对卷积神经网络(CNN)在交通标志识别过程中出现的梯度弥散而引起的识别率低的问题,给出了基于改进CNN结构的交通标志识别方法.实验结果表明:该方法能够有效提高识别精度,防止梯度弥散.  相似文献   

14.
针对跌倒对老年人安全性问题造成的影响,以及现有目标检测模型在人物跌倒时易漏检、鲁棒性和泛化能力差等问题,对YOLOv5s算法进行优化,提出一种老人跌倒检测算法。使用改进的RepVGG模块代替YOLOv5s算法中的3×3卷积模块,优化损失函数,选择K-means++算法对所用数据集进行聚类优化。结果表明,所提算法的鲁棒性好、泛化能力强,平均准确率比YOLOv3,YOLOv4,YOLOv5s, CBAM-YOLOv5s模型分别提高了9%,8%,3%和1.2%。所提出的算法能够满足现实中不同场景对老人跌倒行为的检测需求,可以应用于移动设备或者监控设备中,在老年人安全保障领域发挥重要作用。  相似文献   

15.
提出了一种能够有效克服曝光不均复杂环境下的交通标志识别方法.采用改进的多尺度LogGabor小波进行交通标志的多分辨率特征提取,根据不同尺度下的特征信息进行相位一致性计算,提取能够有效克服曝光影响的目标相位信息,通过优化的多分类支持向量机(SVM)进行多目标分类,并在德国交通标志标准数据库(GTSRB)上进行测试.结果表明:本方法对6大类主要交通标志样本的平均识别率达到98%,优于传统方法;在Intel双核CPU 2.4 GHz计算机平台上,本方法对数据库中不同尺度的图片处理速度达到28帧·s-1,满足了实时性要求;克服了光照不均的问题,适用于复杂条件下的交通标志识别,能够满足鲁棒性需求.  相似文献   

16.
根据以往钢铁表面缺陷检测技术的检测效能较低、准确性低的情况,提出一种改进YOLOv5s的钢材表面缺陷检测算法。主要改进为:加入坐标注意力机制(Coordinate Attention,CA)的空洞空间卷积池化金字塔 (Atrous Spatial Pyramid Pooling,ASPP),扩大模型感受野和多尺度感知能力的同时能更好的获取特征位置信息;加入改进的选择性内核注意力机制(Selective Kernel Attention,SK),使模型能更好的利用特征图中的频率信息,提升模型的表达能力;将损失函数替换为SIoU,提升模型性能的同时加快模型的收敛。实验数据表明,改进的YOLOv5s网络模型在NEU-DET数据集上的mAP值为78.13%,相比原网络模型提高了2.85%。改进的模型具有良好的检测型性能的同时检测速度为103.9 FPS,能够满足实际应用场景中钢材表面缺陷实时检测的需求。  相似文献   

17.
针对目前胶囊内窥镜病灶检测模型存在检测疾病单一且效率低等问题,提出了一种基于YOLOv5的胶囊内窥镜病灶区域检测方法。该方法在原始YOLOv5基础上进行了如下改进:首先,在主干网络Backbone部分,添加一个CBAM(convolutional block attention module)模块,增强模型对重要特征的突出能力;其次,在头部网络Head部分,添加一个检测头,增强模型对小目标的检测能力;最后,将原始YOLOv5的泛化交并比(generalized intersection over union, GIoU)损失函数替换成完整交并比(complete intersection over union, CIoU)损失函数,使模型训练时更快地收敛。本文提出的方法在长江大学第一临床医学院提供的胶囊内窥镜影像数据上进行了实验,精确率达到了93.6%,召回率达到了94.3%,mAP@0.5达到了97.2%,而且检测速度达到了每帧0.027 2 s。实验结果表明提出的方法是有效的、灵活的、鲁棒的,能够满足临床医学诊断的实际需求。  相似文献   

18.
场景文字识别的一个具有挑战性的方面是处理具有扭曲或不规则布局的文字.尤其是侧视文字和曲线文字在自然场景中较为常见,且难以识别.本文提出了一个带有灵活矫正功能的注意力增强网络,将其用于任意形状场景文字识别.此网络由基于卷积神经网络的文字矫正网络和基于注意力增强的识别网络两部分组成.矫正网络自适应地将输入图像中的文字进行矫正,降低识别难度,使基于注意力增强的序列识别网络直接根据矫正后的图像预测字符序列.整个模型可以进行端到端的训练,训练只需要图像和相应的文字真实标签.在各种公开数据集上进行了广泛的实验,包括SVT、ICDAR 2003和CUTE80等数据集,验证了此网络具有优异的性能.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号