首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
针对传统行人检测方法在复杂场景下存在遮挡行人和小尺寸行人检测效果差的问题,提出一种结合语义分割和特征融合的行人检测方法。该方法的网络结构以区域全卷积神经网络为基础框架,根据行人检测任务进行改进。使用深度残差网络提取出多尺度的特征映射图;通过全卷积语义分割网络,得到对应的语义分割图;利用特征融合模块构造出融合特征图;将融合特征图送入区域建议网络和检测网络,完成行人检测。在Caltech和ETH行人检测数据集上进行试验验证,结果表明,与传统行人检测方法相比,该方法的行人检测准确率得到提高,同时检测速度满足实时性要求。  相似文献   

2.
针对行人检测算法未能充分利用行人的特征信息,导致对行人的检测效果不佳问题,本文对无锚框的行人检测网络模型CSP进行了相应改进,提出了一种基于卷积神经网络的行人检测算法.首先,将原主干网络由ResNet-50加深为ResNet-101,然后引入卷积块注意力模块(CBAM)来提高原网络对小尺度行人中心点的特征表达,加入基于...  相似文献   

3.
针对密集场景下行人检测的目标重叠和尺寸偏小等问题,提出了基于改进YOLOv5的拥挤行人检测算法。在主干网络中嵌入坐标注意力机制,提高模型对目标的精准定位能力;在原算法三尺度检测的基础上增加浅层检测尺度,增强小尺寸目标的检测效果;将部分普通卷积替换为深度可分离卷积,在不影响模型精度的前提下减少模型的计算量和参数量;优化边界框回归损失函数,提升模型精度和加快收敛速度。实验结果表明,与原始的YOLOv5算法相比,改进后YOLOv5算法的平均精度均值提升了7.4个百分点,检测速度达到了56.1帧/s,可以满足密集场景下拥挤行人的实时检测需求。  相似文献   

4.
自然场景下的行人属性识别是一个具有挑战性的研究课题,存在行人属性类别多样、行人视角和分辨率多样、样本不平衡等诸多难点,致使难以有效建模。为克服上述难点,本文提出基于多任务压缩激发(Squeeze-and-Excitation, SE)网络的行人属性识别方法,通过多任务卷积神经网络、联合压缩激发模块与残差模块、焦点损失函数三方面改进,研究了自然场景下行人属性识别效果提升的不同方式。结果表明,本文的方法相比基线模型在Market-1501数据集和DukeMTMC-reID数据集上的准确率和效率均有提升。可见,本文的方法具有普遍有效性。  相似文献   

5.
针对传统的车辆和行人检测算法在提取特征时鲁棒性较差的问题,提出一种基于深度学习的车辆和行人检测算法。该算法利用更快速的区域卷积神经网络(Faster RCNN)开源框架和Squeezenet网络,通过在线负样本学习(OHEM)算法和可变的非极大值抑制(Soft-NMS)算法来改进算法的检测精度。首先采用Squeezenet网络框架对图片提取特征,然后通过区域提取网络算法(RPN)获取图片中待检测的区域,最后在检测阶段加入OHEM算法对疑难样本进行重新学习和Soft-NMS抑制重叠矩形框,从而得到目标的得分和边界框。结果表明,基于卷积神经网络的车辆和行人检测算法能够获得较好的检测效果。  相似文献   

6.
针对传统卷积神经网络对远距离视频目标识别效果差的原因,本文提出一种改进的基于SSD卷积网络的视频目标检测模型.首先,对数据集进行剪裁,旋转等预处理,提高网络检测泛化能力,其次,采用coco数据集Mobilenet_SSD预训练模型,由于其具有轻量级网络模型特点,减少计算开销,减少内存占用量.然后,再结合voc2012数据集进行二次训练微调处理,加快训练收敛速度,使用自定义数据集能有效检测特定场景目标,能够有效识别远距离场景下视频目标物体.实验结果表明,改进的网络检测模型适用于远距离目标检测,减少计算量,降低硬件内存资源消耗,提高网络模型性能和检测精确度,具有较好的鲁棒性.  相似文献   

7.
图像或视频中的人员目标检测,一般采用单个深层神经网络检测器(SSD)算法.但在复杂场景下,SSD算法因场景复杂、物体重叠、遮挡等干扰,检测精度大大降低.在SSD算法中加入反卷积网络反馈用于增加环境感知信息;采用辅助损失函数以促进损失降低,并将复杂场景中的目标检测多分类问题转换为二分类问题.以无人机拍摄的复杂场景下的行人数据集为例进行人员目标检测实验,对比分析多种检测方法的准确率表明,改进后的SSD算法在检测速度和识别精度上均提高明显.  相似文献   

8.
针对行人在交通场景对车辆驾驶造成的影响和辅助驾驶需要对行人进行避险的问题,提出一种基于车载单目摄像机的行人危险度评估方法.基于中国城市的特色环境,将行车环境划分为三类:普通道路、人行横道和有辅警道路,对每类场景采用不同的评估方法.采用卷积神经网络,检测视频中道路上的行人、辅警、信号灯和人行道等信息;检测行人关键点并使用多目标跟踪方法,生成骨架姿态时间序列,通过LSTM(长短时记忆神经网络)分析姿态序列获得行人行为和趋势;最后综合视频信息、行人信息和场景信息,构建行人危险评估模型,实现行人危险度评估.实验结果表明,提出的模型可以有效地评估行人危险度,辅助驾驶员安全行车,场景分类使危险模型评估结果更符合行人实际危险度.  相似文献   

9.
基于改进Faster R-CNN的自然场景文字检测算法   总被引:1,自引:0,他引:1  
自然场景中的文字受光照、污迹、文字较小等方面的影响,其检测难度较大,且传统的检测方法效果不好。在研究目标检测方法Faster RCNN的基础上,提出一种针对自然场景文字的改进方法。改进的模型由卷积神经网络特征提取模块,嵌套LSTM(nested long short-term memory,NLSTM)模块和区域候选网络(region proposal network,RPN)模块3部分组成,改进点主要是卷积神经网络特征提取模块增加了不同卷积层的空间特征融合,能够提取多层次的特征;增加嵌套LSTM模块能够学习长序列文本的序列特征,便于检测不定长度的文本序列;RPN模块通过设置宽为8像素,高度不定的锚点(anchor),可以提取一系列可能存在的目标建议框,其对小目标文字效果较好?。在实验部分,通过对标准数据集(ICDAR 2013,Multilingual)的实验结果对比表明,所提出的改进算法在准确率和效率方面明显优于改进前的算法。通过实列测试,改进的模型对小目标文字检测效果也有所提升。  相似文献   

10.
深度卷积网络是解决分类问题的一种有效手段,但行人检测任务并不能通过分类来直接实现.为了在行人检测问题中进一步发挥深度卷积网络的优越分类性能,在实拍场景下,针对平直道路的情况,提出了一种基于摄像机安装位置和摄像机参数的感兴趣区域分割方法,合理利用先验知识和规则,对行人在图像当中可能出现的位置,以及不同位置上行人的尺度大小给出限制,从而系统仅对可能发生危险的区域进行搜索,避免了传统方法中多尺度遍历搜索整副图像的弊端.在此基础上,将危险区域所得的候选目标窗口作为待检测样本传送到构建好的深度卷积网络中进行分类,完成行人检测任务.实验结果表明,所研究的算法在一定距离内达到了预期的检测效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号