首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 203 毫秒
1.
【目的】为了获得足够的番茄叶片病害图像,提高番茄病害的识别准确率,提出了一种新的基于生成对抗网络的数据增强方法(Hidden parameter label and Attention attached Multi scale ACGAN,HAM_ACGAN).【方法】在生成对抗网络的基础上,为了补充类内信息,将隐参数标签连接到输入噪声上,以控制不同类别病害的叶片生成;同时设计一个带有残差注意力块的生成器捕获叶片中的病害信息,生成病害特征明显的番茄叶片;最后利用多尺度判别器丰富生成图片的细节纹理。【结论】实验表明,提出的数据增强方法能够生成病害特征明显的番茄叶片,能够满足神经网络训练所需的大量数据,进而提高病害识别网络的识别精度。  相似文献   

2.
为实现玉米病害图像快速、准确识别,提出了一种基于非对称注意力机制残差网络(asymmetric convolution attention resnet,ACA-Resnet)的图像检测模型.在残差网络的基础上,通过引入非对称卷积结构减少参数量,加快模型训练速度,同时引入注意力机制,改善模型的表达能力,提高检测准确率.为减小由于病害图片数量不足而造成的过拟合现象,采用迁移学习的方法提高模型的稳定性和泛化能力.结果 表明,ACA-Resnet经过ImageNet数据集预训练后对玉米病害图像的平均识别准确率可达到97.25%,较VGG-16、Inception-V3和ResNet50等网络分类效果更好,相较于Resnet50训练速度明显提升.可见本文方法训练速度快,识别精度高,可为玉米病害检测提供借鉴.  相似文献   

3.
目的 微表情(Micro Expression, ME)是人们流露内心情感时展现出的细微面部表情。针对微表情识别的样本较少且不同类别数量分布不均导致难以识别和识别准确率较低的问题,提出能够提高微表情识别准确率的模型框架。方法 提取微表情视频序列中含有更多关键表情信息的峰值帧;使用加入SE模块的改进残差网络SE-ResNeXt-50对微表情的峰值帧进行特征提取,其中SE模块可以更好地学习特征中的关键信息,ResNeXt通过分组卷积的方式用稀疏结构取代密集结构从而使结构更加简化,提升了识别效率。与此同时,使用Focal Loss损失函数可以更好地解决因微表情数据的不平衡带来的模型性能问题。结果 在微表情数据集CASMEⅡ上进行了仿真实验,可以发现改进的残差网络与峰值帧提高了微表情识别的准确率与F1值。结论 改进的残差网络与峰值帧可以降低数据集较少所带来的影响,使模型有着良好的拟合效果,同时改善了在不同类别上表现差异较大的问题,提升了微表情的识别准确率,对于微表情识别有着更好的识别性能。  相似文献   

4.
提出了基于残差网络和注意力机制的LRAM(LSTM with ResNet and attention model)模型,在模型中引入残差模块(ResNet),加快了网络的收敛速度,降低了网络训练难度;引入注意力机制(AM),实现了不同序列对当前文本识别的权重分配,提高文本识别的准确率.通过在Synth90K,Street View Text和ICDAR等数据集测试结果,与已存在的模型相比,LRAM性能超过现存其他网络模型.   相似文献   

5.
针对车标识别准确率的问题, 提出一种基于ResNet-18模型改进残差网络的车标识别算法. 首先, 利用残差网络并对其进行改进, 使用改进的线性修正单元Leaky ReLU激活函数代替原激活函数; 其次, 调整传统的残差网络结构, 将批量标准化和激活函数放在卷积层前, 并减少网络参数以加速网络训练. 实验结果表明, 改进后的残差网络模型识别准确率达99.8%.  相似文献   

6.
西红柿的成熟度对于采摘、运输和销售至关重要。针对西红柿需要在特定环境下识别问题,从种植现场拍摄图片来制作数据集,提出了一种基于双维度注意力机制的西红柿成熟度分类方法。首先通过tensorflow搭建卷积神经网络,网络中加入了改进的CBAM(convolutional block attention module)模块提取西红柿的成熟度和所在位置信息,即在通道注意力模块中并行一个共享多层感知器后的平均池化层;然后使用Adam优化器更新参数,此方法不仅缓解了网络中直接加入CBAM模块出现的不稳定问题,而且加快了损失函数的下降速度;最后通过调节学习率并使用混淆矩阵计算验证集的准确率获取最佳模型。实验结果表明,本文所提网络在训练了30个Epoch后损失函数稳定下降,搭建软件测试平台进行测试后得到准确率为99%,单张图片检测时间为1.5 s。检测时间和测试准确率均优于AlexNet网络,Grad-CAM可视化结果显示本文所提网络提取目标信息的效果优于AlexNet网络和改进之前的CBAM模块。本文所提方法适用于任意背景下的瓜果品级分类。  相似文献   

7.
将深度学习应用于行人重识别领域,嵌入多尺度注意力融合模块至神经网络中进行多尺度特征提取和表示,可有效提升注意力机制对深度学习网络的识别性能。提出了一种基于SE block的多尺度通道注意力融合模块,并结合ResNet50卷积神经网络提取特征;然后通过双向LSTM网络进一步提取特征序列上下文信息,在提高模型对图像重要特征的提取能力的同时,降低对图像冗余特征的关注度;最后使用级联难采样三元组损失函数和交叉熵损失函数共同训练网络模型,使样本能够在高维特征空间中实现聚类,进一步提升模型识别准确性。所提出算法在Market1501数据集和CUHK03数据集分别进行实验,并在同等条件下和其他注意力模块算法进行比较。为进一步验证各模块作用,对算法进行消融实验,以验证各模块的有效性,实验结果表明,所提出方法可有效应用于行人重识别  相似文献   

8.
针对在大规模农业种植中传统人工农作物病虫害预防和治理上常存在的问题,应用深度学习算法来进行农作物病害的检测.对47 637张图片进行病害识别检测,数据包含10个物种(主要农作物有番茄、土豆、玉米等),27种病害,总共61个分类标签.采用目前流行的深度网络结构如Vgg-16,ResNetV1-101和InceptionV4等6种模型对图像进行特征抽取.采用交叉熵和正则化项组成损失函数进行反向传播调整,对数据集进行4种不同情况的划分;并且使用了初始化和迁移训练两种训练方式,分别对6种网络架构在不同学习率下进行试验比较.结果表明:采用初始化训练对61类病害情况的最高识别准确率为84.6%;而在迁移训练中,使用合适的学习率训练,最高识别准确率达到86.1%;对3类疾病程度分类准确率为87.4%,对28种病害类型分类准确率为98.2%,对10类物种识别分类准确率为99.3%.  相似文献   

9.
马铃薯叶部病害严重制约着马铃薯的产量,为此提出了一种基于注意力和残差思想的深度卷积神经网络模型RANet。依据注意力机制,在RANet中构建并行池化的注意力模块,以增强网络的特征提取能力,并借助残差思想避免注意力模块造成的特征值衰减。以早疫病初期、早疫病晚期、晚疫病初期、晚疫病晚期和健康叶片的叶部图像为研究对象,RANet的平均识别率为93.86%,比ResNet50、VGG16、ShuffleNet和MobileNet高2.46%~16.13%。通过对注意力模块参数量的控制,使该模型图像识别速度可达73ms/张。  相似文献   

10.
云南作为泥石流受灾最严重的省份之一,每年均会遭受重大损失。为了应对这种突发性灾害,本文基于DCHNNet(dual-channel hybrid neural network)提出了一个基于双通道的改进残差结构的卷积神经网络——双通道残差网络(two-way residual network, TWRNet)。该网络能够广泛应用于泥石流沟谷图像的潜在危险性排查,实现泥石流灾害的预警。TWRNet首先采用切片的方式对数字高程(digital elevation model, DEM)数据和遥感数据分开处理,并使用改进的残差结构进行特征提取;然后将特征进行融合,并使用通道注意力机制SE(squeeze-and-excitation networks)模块进行通道增强;最后给出泥石流沟谷的分类结果。在训练过程中,本文使用了交叉熵和焦点损失构成的联合损失函数。实验结果表明,TWRNet在泥石流沟谷识别方面达到了最高89.28%的识别率和87.50%的召回率,模型性能良好。使用图像学习沟谷特征的方法来进行泥石流孕灾沟谷的识别是可行的。  相似文献   

11.
糖尿病视网膜病变(Diabetic Retinopathy,DR)是一种致盲率很高的眼科疾病。不同病变等级的视网膜图像之间差异小且病灶点分布无规律。针对现有深度模型对DR中的相似病灶点识别率低,严重影响模型分类精度的问题,本研究以深度学习为基础,构建新的模型架构进行训练,提出一种集成MobileNetV2和EfficientNetB0深度模型的注意力网络:ME-ANet。模型集成分为头部和主干两部分,将深度模型的浅层部分融合构成网络的头部,训练时采用迁移学习的策略对网络模型参数进行初始化,减少训练中的过拟合问题。主干部分利用上述两种模型的核心结构,设计3个阶段集成模块进行特征提取。同时设计全局注意力机制(Global Attention Mechanism,GAM)并分别嵌入到3个阶段的集成模块中。模型的改进加速了网络的收敛速度,该网络模型实现了对图像浅层信息的特征融合提取,减少了微病灶特征信息在训练过程中的卷积丢失问题,模型的分类精度进一步得到改善。通过模型集成构建特征提取主干网络,提高了模型对低级特征信息的学习,注意力机制抑制非病变特征信息,强化典型病灶特征学习,从而实现细粒度分类,进一步提升了模型的分类性能。  相似文献   

12.
张阳  张涛  陈锦  王禹  邹琪 《北京理工大学学报》2019,39(12):1258-1262
网络入侵检测已经广泛运用机器学习模型,但是研究者们多关注模型选择和参数优化,很少考虑数据不平衡的影响,往往会导致少数类入侵样本的检测效果较差.针对该问题,以SMOTE (synthetic minority oversampling technique)数据再平衡算法为研究重点,应用入侵检测数据集KDD99作为原始训练集,使用简单抽样和SMOTE算法生成再平衡训练集.采用多种机器学习模型分别在原始训练集和再平衡训练集进行5折交叉验证.实验结果表明,与原始训练集相比,使用再平衡训练集建模能够在不降低甚至提高多数类样本识别效果前提下,使少数类样本的识别准确率和召回率增强10%~20%.因此,SMOTE算法对不平衡样本下的网络入侵检测有显著的提升作用.   相似文献   

13.
为了实现在空中手写的人机交互方式,给用户带来一种新型的人机交互体验,设计了一种基于惯性传感器的空中手写轨迹识别系统。系统主要包括数据采集滤波模块、四元数法坐标系转换模块、积分获取测量轨迹模块和神经网络识别模块四部分。本文在原始数据采集和积分获取轨迹两个环节采用卡尔曼滤波算法。为了验证系统的准确性,以在空中书写数字8为例,经卡尔曼滤波后在空间范围内的轨迹完整、清晰,对数字0-9轨迹的捕捉也验证了这一点。设计了AlexNet神经网络迁移学习模块进行轨迹识别,实验结果表明,识别准确率为87.3%,轨迹识别度较高,达到了预期效果。  相似文献   

14.
针对人工检测桥梁表面缺陷存在精度低、速度慢和漏检率高等问题,该文提出了基于深度卷积生成式对抗网络(deep convolutional generative adversarial networks,DCGAN)和改进YOLOv5s的桥梁表面缺陷检测识别模型.首先,通过DCGAN网络对自主采集的桥梁表面缺陷图像进行数据增强,建立每类缺陷样本数量较为均衡的数据集; 其次,在YOLOv5s模型基础上嵌入CBAM注意力机制模块,使模型将注意力集中于缺陷区域,从而提升图像分类的准确率; 最后,为验证所提方法的适用性,将包含4类桥梁表面缺陷的数据集进行训练与测试.实验结果表明:该文提出的模型在桥梁表面缺陷检测上的准确率为92%,相比其他深度学习模型具有更高的检测精度和鲁棒性.  相似文献   

15.
为解决传统3D卷积中难以提取时空信息的缺点,提出一种适用于3D卷积网络的多重注意力机制模块.该模块是由通道结合时间子模块和空间子模块组成的多维度特征调整模块.在通道结合时间模块中,通过调整池化层和卷积层的顺序,保留更多的有效通道信息和时间信息;在空间模块中,压缩冗余时间信息以减少计算量.该模块的整体计算量较少,可嵌入到各3D卷积网络中.为验证多重注意力机制模块的性能,基于3D ResNet网络设计部署了该多重注意力机制模块,并在UCF-101和HMDB-51两个行为识别数据集上分别进行训练.结果表明,改进后的3D ResNet在UCF-101上可提升1.50%的精度,在HMDB-51可提升1.24%的精度,而参数量只增加0.24%.  相似文献   

16.
为提高人脸图像情绪识别效率与准确性,在探讨了深度神经网络、注意机制与损失函数基础上,提出基于上下文感知与注意机制的多学习情绪识别网络结构.该网络主要由场景特征提取、身体特征提取与融合决策3个子网络组成,并采用单双输出结构,实现多标签情绪分类与连续空间情绪回归任务.考虑到多标签情绪分类时标签的不平衡性,提出了一个改进的焦点损失(focal loss,FL)函数,可为小样本或难分类样本分配更多的权重,从而提高了网络训练效率.利用EMOTIC数据集进行仿真,结果表明平均绝对误差回归组合损失训练性能更优,分类平均准确率与回归平均误差率分别为28.5%和0.098,该方法对于小样本或难分类样本具有更好的分类效果.   相似文献   

17.
针对现有铁路人员入侵识别准确率不高、实时性较差的问题,在YOLOv4模型的基础上提出一种R-YOLO轨道人员目标检测模型。首先,用轻量级骨干网络ResNet50代替原有的CSPDarknet53网络,利用深度可分离卷积替代PANet中的标准卷积,减少网络层数以及模型体积,加快模型的识别速度。其次,在加强特征提取网络的3个特征层分别加入有效通道注意力模块,采用K-means++聚类算法重新对数据集进行聚类和分析,提高目标检测模型的精度;在模型训练方面,采用迁移学习和混合数据集联合训练,解决人员识别精度不理想以及误检漏检等问题。最后,利用R-YOLO轨道人员目标检测模型对真实铁路人员入侵数据集进行测试。结果表明,R-YOLO模型在真实铁路人员入侵数据集上的平均识别精度达到了92.12%,较传统YOLOv4算法高出1.89%,帧速率由38.74 f·s-1提升到47.73 f·s-1。R-YOLO模型部分解决了铁路入侵人员误检漏检问题,提高了铁路人员入侵识别的实时性和准确率,为铁路安全运行提供了保障。  相似文献   

18.
基于迁移学习和AlexNet的驾驶员行为状态识别方法   总被引:1,自引:0,他引:1  
为了解决传统基于神经网络算法的驾驶员行为状态识别系统精度过于依赖大量训练样本的问题,本文提出将迁移学习理论和AlexNet引入到驾驶员行为状态的识别研究中。首先对驾驶员行为特征及状态进行深入分析,对驾驶员7种驾驶状态进行了定义,构建了驾驶员状态信息采集系统;然后对基于卷积神经网络的驾驶员状态识别方法研究,建立了驾驶员状态数据集,构建了基于AlexNet卷积神经网络的状态监测系统,通过迁移学习完成了卷积神经网络识别模型。最后通过实验验证了本文提出的驾驶员状态识别算法对7种驾驶员状态识别的有效性。实验表明:该系统准确率达到97.8%,且在实验设备中运行速度达到70帧/分钟,满足较高的准确率要求与实时性要求。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号