首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对神经网络训练时收敛慢和模型泛化能力差的问题,文章首先分析传统的和基于深度学习的目标检测算法各自的优势和不足,接着概括梯度下降法各种变体优化算法和现阶段主流数据增强方法对应的优缺点,最后对训练时的优化问题提出组合使用AdaMod和AdamW的训练优化方案,提高了训练网络收敛效率。针对深度神经网络性能表现比较依赖于数据集从而导致泛化能力差的问题,该文使用基于线性插值的数据增强方案,对类别不同的样本之间的领域关系进行建模,增强了神经网络的健壮性。在VOC07+12数据集上实验结果表明EfficientDet-d0检测算法模型参数量、浮点计算量、精度和泛化性能比较均衡,泛化能力得到增强,训练过程收敛更快,验证了该文提出的训练优化方案和使用的数据增强方法是有效的。  相似文献   

2.
由于缺少实例级标签,使得深度神经网络在工业表面检测领域的应用受到了限制.为解决这一问题,本文面向实际的热轧钢板表面缺陷检测任务,提出基于弱监督学习的缺陷检测网络,该网络引入类激活映射模型,使用容易获取的图像级标签进行模型训练,进行钢板表面的缺陷检测.为了进一步提升检测精度和克服类激活映射模型原有的缺点,本文采用性能更优的残差网络作为主干网络进行特征提取,并提出了多层级特征融合网络进行类激活图的生成,来获取更多的细节信息和更准确的目标激活区域.通过在公开缺陷数据集NEU-CLS上进行实验,结果表明本文提出的方法能够在标签不完备的情况下进行缺陷检测任务,并取得0.68%分类错误率和17.75%定位错误率,胜过其他同类的方法.  相似文献   

3.
为提高自动驾驶中的道路目标检测精度,设计了一种基于YOLOv5的道路目标检测模型。该模型在YOLOv5s的网络模型基础上,将原始的初始锚框聚类算法改为K-means++算法来减小随机带来的聚类误差;并在Backbone中SPP模块之前引入SENet注意力机制,以增强道路目标重要特征并抑制一般特征,达到提高检测网络对道路目标的检测能力。在VOC2012改进数据集上训练、测试,基于改进的YOLOv5s的模型比原始YOLOv5s模型平均准确精度提高了2.4%。实验结果表明,改进的YOLOv5s模型能较好地满足道路目标检测的精度要求。  相似文献   

4.
弱监督时序动作定位旨在于仅在视频级标签的监督下,定位未剪辑视频中的动作时间边界,并识别定位结果所对应的动作类别.由于缺少动作在时间上的标注信息,目前大多数弱监督时序动作定位方法通过聚合具有高激活值的显著动作特征来优化分类损失函数的方式训练动作定位网络,这会导致网络过度关注动作片段的关键部分,忽视了视频中部分难以分类的模糊动作片段,难以保证定位结果的完整性.基于上述问题,提出了一种具有多分支注意力机制的网络框架,分别对视频中的显著动作片段、显著背景片段和难以分类的模糊动作片段进行建模.同时,基于上述的多分支注意力权重,构建了3个相应的时域类激活序列优化动作分类损失函数,使网络能够分离视频中的显著动作特征与显著背景特征.为了使网络捕获更加完整的动作片段,基于对比学习设计了模糊动作对比损失函数,在显著特征的引导下细化视频中的模糊动作特征,使网络能够感知精确的动作时间边界,以避免完整动作的截断现象发生.所提方法在2个主流的弱监督时序动作定位数据集THUMOS-14和ActivityNet-1.2上的定位性能均超过了之前的方法.具体而言,所提方法的定位性能相比于之前的方法在上述两个数据集中分别提...  相似文献   

5.
提出了一种基于深度学习的红绿灯目标检测算法.在Yolo V3模型中引入残差模块学习方法,提出以ResNet残差网络模块作为特征提取网络,优化网络结构深度,对图像模型裁剪、训练参数等方面进行调整,利用PaddlePaddle深度学习平台AI Studio对红绿灯目标检测模型进行训练,得到了红绿灯的准确检测结果,红灯测试精...  相似文献   

6.
针对当前朱鹮检测算法模型参数较多、计算量大的问题,本文设计研究了一种基于YOLOv5s的高性能轻量化网络模型。首先,结合EfficientNet网络中的MBConvBlock对原主干网络进行重构,大幅降低网络参数;同时在浅层网络中采用Stem模块,提升浅层网络的特征提取能力;然后改进卷积注意力模块(CBAM),即将其中的通道注意力替换为高效通道注意力模块(ECA),避免了降维操作,有效提取了邻近通道间的信息,且大幅降低了通道注意力的参数数量,并将其嵌入特征融合网络路径聚合网络(PANet)中,达到了引入微小参数数量而有效提升网络性能的目的,并将其命名为高效卷积注意力模块(ECBAM)。最后,在自建朱鹮数据集和公共数据集PASCAL VOC、COCO上进行实验,实验结果表明,与YOLOv5s算法相比,本文算法模型参数数量降低了52.37%,计算次数降低了54.55%,在自建朱鹮数据集上PmAP@0.5:0.95仅降低了约2个百分点,达到0.666,在公共数据集PASCAL VOC上PmAP@0.5达到0.792,在公共数据集COCO上P  相似文献   

7.
针对现有的大部分细粒度图像分类算法都忽略了局部定位和局部特征学习是相互关联的问题,提出了一种基于集成迁移学习的细粒度图像分类算法。该算法的分类网络由区域检测分类和多尺度特征组合组成。区域检测分类网络通过类别激活映射(class activation mapping,CAM)方法获得局部区域,以相互强化学习的方式,从定位的局部区域中学习图像的细微特征,组合各局部区域特征作为最终的特征表示进行分类。该细粒度图像分类网络在训练过程中结合提出的集成迁移学习方法,基于迁移学习,通过随机加权平均方法集成局部训练模型,从而获得更好的最终分类模型。使用该算法在数据集CUB-200-2011和Stanford Cars上进行实验,结果表明,与原有大部分算法对比,该算法具有更优的细粒度分类结果。  相似文献   

8.
针对智能船舶中基于视觉传感器的水面小目标识别具有识别区域分辨率低、图像模糊、信噪比低等问题,提出了一种新的基于卷积神经网络的水面小目标检测算法——自注意力特征融合检测算法.首先,为了提高视觉信息处理的效率与准确性,在网络模型中引入了自注意力模块,更多关注小目标的细节信息.其次,在网络模型中采用了结构化的特征融合算法,通...  相似文献   

9.
梁雨欣  毕晓君 《应用科技》2023,(1):45-50+111
在场景文本检测任务中,由于图像背景复杂、文本实例尺度不一等问题,导致现有模型的文本检测精度不高。为此,本文设计了一种基于注意力机制与自适应尺度融合的场景文本检测模型。首先,通过引入高效通道注意力机制,提高了特征提取网络的表征能力,降低了文字的漏检率和误报率;其次,通过设计自适应尺度融合模块,动态融合不同尺度特征,增强了模型对不同尺度文本实例的检测和定位能力。实验结果表明,本文提出的模型在Total-Text和MSRATD500共2个数据集上的F综合指标分别达到85.1%和84.1%,在同类型算法中处于领先水平。  相似文献   

10.
针对堆叠胶囊自编码器存在检测性能慢、不能更好挖掘图像局部特征的问题,本文提出基于流形正则的堆叠胶囊自编码器优化算法。采用Scharr滤波器对堆叠胶囊自编码器模型中的图像进行重建,加强图像目标检测的精度,并在损失函数中引入流形正则项,从而加强对原始数据空间局部特征的提取,最终使用基于流形正则的堆叠胶囊自编码器学习参数,选择出更加具有区别性的特征。在MNIST和Fashion MNIST数据集上的实验结果显示,该优化算法相比于原网络结构,图像分类准确率分别提高了0.26和9.23个百分点,且模型训练速度也得到较大提高。  相似文献   

11.
针对广州智能公交调度的优化问题,提出一种基于无监督学习的实时公交动态调度算法,结合乘客利益和公交公司利益总体最优为目标,通过无监督学习方法学习到公交客流出行特征表达的提取,利用吸引子传播(affinity propagation,AP)聚类算法的优化数据集与支持向量机(support vector machine,SVM)的训练样本集相结合建立预测模型训练,运用公交线网发车间隔和加权系数的目标函数优化调度数学模型,将多源信息融合及多策略的实时公交动态调度算法引入到求解模型中,利用深度学习的异常突发事件分类检测方法实现调度优化模型的实时调整。实验结果表明,AP聚类算法程序运行耗时16 s、高峰发车间隔5 min,比遗传算法运行效率更高、时间间隔更精确,实例证明模型和算法具有实用性和可靠性。  相似文献   

12.
针对密集场景下行人检测的目标重叠和尺寸偏小等问题,提出了基于改进YOLOv5的拥挤行人检测算法。在主干网络中嵌入坐标注意力机制,提高模型对目标的精准定位能力;在原算法三尺度检测的基础上增加浅层检测尺度,增强小尺寸目标的检测效果;将部分普通卷积替换为深度可分离卷积,在不影响模型精度的前提下减少模型的计算量和参数量;优化边界框回归损失函数,提升模型精度和加快收敛速度。实验结果表明,与原始的YOLOv5算法相比,改进后YOLOv5算法的平均精度均值提升了7.4个百分点,检测速度达到了56.1帧/s,可以满足密集场景下拥挤行人的实时检测需求。  相似文献   

13.
针对小目标物体检测精度差的问题,同时不以牺牲速度为代价,本文提出了一种基于全局注意力的多级特征融合目标检测算法。算法首先由卷积神经网络生成多尺度的特征图,然后采用多级特征融合的方法,将浅层和深层特征图的语义信息相结合,提高特征图的表达能力,接着引入全局注意力模块,对特征图上下文信息进行建模,并捕获通道之间的依赖关系来选择性地增强重要的通道特征。此外,在多任务损失函数的基础上增加一项额外的惩罚项来平衡正负样本。最后经过分类回归、迭代训练和过滤重复边框得到最终检测模型。对所提算法在PASCAL VOC数据集上进行了训练和测试,结果表明该算法能有效地提升小目标物体检测效果,并较好地平衡了检测精度与速度之间的关系。  相似文献   

14.
针对包含目标、尺度和平移变化较强的空间信息难以获取大量训练样本的问题,提出一种基于深度卷积神经网络(deep convolutional neural network,DCCN)的弱监督学习方法,从3个层面对当前卷积神经网络进行扩展。为了提取分辨率更高的局部特征,同时考虑到全卷积网络(full convolution network,FCN)在全监督式学习下的高效性能,使用FCN作为后端模块;为了获取更多的通用特征,增加一个多映射弱监督学习的传输层,对与补充性类模态相关的多个局部特征进行显式学习;为了优化训练过程,改进了池化层,使用全局图像标签进行训练,将空间得分聚合为全局预测。使用图像分类、弱监督逐点目标定位和图像分割3种常用的机器视觉任务进行评估。多个公开数据库的实验结果表明,所提方法能够有效地学习强局部特征,具有良好的分类和定位效果。  相似文献   

15.
单次多边界框检测器(single shot multibox detector, SSD)算法因其性能优良已被应用于许多场景中,但该算法对小目标物体的检测精度偏低,主要原因是高层的语义信息没有被充分利用。为解决该问题,文章将其基础网络替换为残差网络(residual network, ResNet),同时融合深浅层的特征信息来增强浅层特征图的语义信息,此外还引入注意力模块,保留更多的目标特征信息,抑制无关信息,进一步提升对小目标物体的检测效果。在PASCAL VOC2007数据集上进行实验测试,平均精度均值为80.2%,优于其他SSD改进算法。由于增加了特征融合和注意力模块,所提算法检测速度有所下降,但相比于SSD改进算法,检测速度仍有明显的优势。  相似文献   

16.
针对低光照、雨雾等恶劣场景对智能驾驶视觉系统检测能力的影响,提出了一种雷达与相机特征融合的网络模型. 基于毫米波雷达信息和注意力模型构建了雷达注意力机制特征模块,该模块可以为特征融合网络提供一个先验信息和增加算法在目标候选区域权重. 测试结果表明,引入雷达注意力机制模块后,特征融合网络的目标检测性能要比仅依赖计算机视觉的检测性能有了明显的提升,并且在复杂场景下的目标检测鲁棒性更强.   相似文献   

17.
针对机场低空区域鸟类对飞行器起飞和降落带来的安全问题,提出一种轻量型高分辨率的鸟群场景识别网络,用于实现鸟群的计数和定位.该网络以高分辨率网络为基础框架,使用非对称卷积和Ghost模块对网络进行轻量化,并在网络的第四阶段引入联合金字塔上采样模块,提升模型对多尺度特征的融合能力.进一步提出联合使用负样本抑制损失函数,用于监督网络的训练过程,使网络更加关注于鸟类目标.将所提出的模型在鸟群数据集上进行实验,实验结果表明:本方法可以有效对鸟群进行计数和定位,并在模型性能和模型参数量上达到了平衡.为进一步验证所提出方法的有效性,在两个人群数据集(Shanghai Tech,UCF-QNRF)上进行训练与测试,证明其具有较高的准确性和鲁棒性.  相似文献   

18.
针对现有的无人机检测算法无法同时兼顾检测速度及检测精度的问题,本文提出了一种基于YOLOv5s(You Only Look Once)的轻量化无人机检测算法TDRD-YOLO(Tiny Drone Real-time Detection-YOLO).该算法首先以YOLOv5s的多尺度融合层和输出检测层分别作为颈部网络和头部网络,引入MobileNetv3轻量化网络对原骨干网络进行重构,并将骨干网络后的通道在原YOLOv5s的基础上进行压缩,减小网络模型大小;其次,将骨干网络中Bneck模块的注意力机制由SE修改为(Convolutional Block Attention Module,CBAM)并在颈部网络引入CBAM,使网络模型更加关注目标特征;最后修改颈部网络的激活函数为h-swish,进一步提高模型精度.实验结果表明:本文提出的TDRD-YOLO算法平均检测精度达到96.8%,与 YOLOv5s相比,参数量减小到原来的1/11,检测速度提升1.5倍,模型大小压缩到原来的1/8.5.实验验证了本文算法可在大幅降低模型大小、提升检测速度的同时保持良好的检测性能.  相似文献   

19.
近年来,基于深度学习的目标检测算法发展迅速.但是由于深度网络规模过大,导致其还不能在嵌入式平台上进行广泛应用.本文针对SSD(Single Shot Multi-box Detector)模型的规模进行优化,引入了轻量化卷积神经网络MobileNetv2,对比了SSD和其轻量化版本SSDLite的网络结构,在此基础上提出了基于轻量化SSD的车辆及行人检测模型LVP-DN(Lightweight Vehicle and Pedestrian Detection Network).首先,通过MobilNetv2替代VGG作为基础网络进行特征提取.然后,用轻量化的SSD版本SSDLite替代SSD,从而达到减少模型大小、加快检测速度的目的.进一步通过优化默认候选框的比例,提高了网络对行人的检测精度.最后,在KITTI和PASCAL VOC数据集上分别对比了不同基础网络、输入图像尺寸及是否使用预训练模型这3个因素对网络性能的影响.实验结果表明,相比其他流行的目标检测模型,本文所提出的车辆及行人检测模型在精度、速度和模型大小等评价标准上取得了较好的效果.  相似文献   

20.
为解决类圆杆物生产分装过程中传统计数方法计数准确率低和检测速度慢等问题,采用一种融合GIoU优化算法与注意力机制YOLOv3的类圆杆物检测计数方法(adaptive attentional mechanism YOLOv3,AAM-YOLOv3)。首先使用数据增强技术对标定数据进行扩增,减少模型过拟合现象;然后,以K-means算法聚类训练数据,自适应确定锚框尺寸,并采用GIoU算法优化回归损失函数;最后,引入混合注意力模块(CBAM)强化检测网络提取目标位置有效特征,忽略不重要特征信息,以克服传统YOLOv3算法中因特征提取不充分而导致目标漏检的问题。结果表明,所提出的AAM-YOLOv3模型检测mAP值为97.5%,计数准确率为98.9%,较改进前分别提高5.8%和4.4%,检测速度达到40 fps。所提算法以及检测计数方法可快速高效地实现类圆杆物的准确计数,能满足生产分装过程检测要求。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号