首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对现有细粒度图像分类算法普遍存在的模型结构复杂、参数多、分类准确率较低等问题,提出一种注意力特征融合的SqueezeNet细粒度图像分类模型.通过对现有细粒度图像分类算法和轻量级卷积神经网络的分析,首先使用3个典型的预训练轻量级卷积神经网络,对其微调后在公开的细粒度图像数据集上进行验证,经比较后选择了模型性能最佳的SqueezeNet作为图像的特征提取器;然后将两个具有注意力机制的卷积模块嵌入至SqueezeNet网络的每个Fire模块;接着提取出改进后的SqueezeNet的中间层特征进行双线性融合形成新的注意力特征图,与网络的全局特征再融合后分类;最后通过实验对比和可视化分析,网络嵌入Convolution Block Attention Module(CBAM)模块的分类准确率在鸟类、汽车、飞机数据集上依次提高了8.96%、4.89%和5.85%,嵌入Squeeze-and-Excitation(SE)模块的分类准确率依次提高了9.81%、4.52%和2.30%,且新模型在参数量、运行效率等方面比现有算法更具优势.  相似文献   

2.
针对目前的行人属性识别方法存在鲁棒性差、特征表达能力不足和行人的细粒度特征识别精度不高的缺点,提出一种基于注意力机制与空间金字塔池化的行人属性识别方法,通过注意力机制强化不同维度的特征,提升行人整体特征表达;通过空间金字塔池化操作,实现任意大小图像的输入,更好地保留图像的特征信息。结果表明,与现有的其他方法相比,所提出的行人属性识别方法可以精确地识别行人多种属性,具有较高的行人细粒度特征识别精度。  相似文献   

3.
细粒度图像分类任务比一般图像分类任务更具有挑战性,其通常需要对类间差异小、类内差异大的样本进行分类.现有细粒度分类方法主要依赖视觉特征进行分类,而人类可以根据文本描述等属性描述来辅助识别图像类别.该文提出了一种通过预测属性引导的通道注意力模块,该模块可以插入到任意的卷积神经网络中,从而让模型学习到更高级的特征表示.最后,该算法在CUB-200-2011数据集上测试,在使用Resnet-50、VGG-19、Bilinear-CNN作为主干网络训练时的精度分别达到87.1%、82.1%、85.5%,精度得到显著提升.  相似文献   

4.
针对交通场景下行人检测模型网络复杂、参数量大以及难以在低性能设备上部署的问题,基于YOLOv5s网络模型提出了一种改进的轻量级行人检测算法。首先,使用Ghost模块重构YOLOv5s网络进行特征提取,降低模型的参数量和计算量,提高推理速度。其次,引入坐标注意力机制提高模型对目标特征的提取能力,提升其对小目标行人的检测效果。最后,采用SIoU损失函数加快模型的收敛速度,提高模型的识别准确率。实验结果表明,改进后的算法能保证较高的检测精度,与原始YOLOv5s算法相比参数量减少47.1%,计算量减少48.7%,提高了交通场景下行人检测的速度且易于部署。  相似文献   

5.
翟娅娅  朱磊  张博 《科学技术与工程》2022,22(21):9207-9214
在远程水表读数自动识别系统中,为减少网络模型参数量,改善受雾化、抖动等干扰的水表复杂场景图像读数识别精度及半字识别问题,提出了一种基于改进YOLOv4网络的水表读数识别方法?该方法利用深度可分离卷积与引入压缩与激发(squeeze-and-excitation, SE)注意力机制的MobileNetv2瓶颈结构,分别替代YOLOv4网络原有的标准卷积和主干网络,并利用加权平均非极大值抑制算法改进预测输出头,形成了一种网络模型参数量明显降低但检测精度不下降的改进YOLOv4网络,同时有效改善了对水表读数“半字”识别的漏检和错检问题;最后基于字符边框定位的水表读数提取方法,实现“半字”准确提取问题?实验结果表明,本文方法与多种网络学习方法相比,模型参数量压缩14.4%以上,读数识别的准确率和召回率对普通场景水表图像分别提升了0.04%和0.05%以上,对受雾化、抖动等干扰的复杂场景水表图像分别提升了0.11%和0.37%以上.  相似文献   

6.
细微的类间差异和显著的类内变化使得细粒度图像分类极具挑战性。为了对鸟类图像进行细粒度识别,提出一种基于跨层精简双线性池化的深度卷积神经网络模型。首先,根据Tensor Sketch算法计算出多组来自不同卷积层的精简双线性特征向量;其次,将归一化后的特征向量级联送至softmax分类器;最后,引入成对混淆对交叉熵损失函数进行正则化以优化网络。提出的模型无需额外的部件标注,可进行端到端的训练。结果表明,在公开的CUB-200—2011鸟类数据集上,该模型取得了较好的性能,识别正确率为86. 6%,较BCNN提高2. 5%。与多个先进细粒度分类算法的对比,验证了提出模型的有效性和优越性。  相似文献   

7.
以舰船为研究对象,研究高分辨遥感图像的多尺度多目标检测中的关键技术,主要解决多尺度多目标识别和细粒度分类准确率低等问题.在目标定位方面,利用特征金字塔深度网络定位多目标区域,创建一个在所有尺度上均具有语义信息的特征金字塔,有效解决多尺度多目标数据定位准确率低这一关键问题;在目标识别方面,利用共享CNN网络重建输入图像、优化多任务损失函数提取细粒度分类目标结构特征,提高细分目标识别准确率.与GoogLeNet、Faster R-CNN和Yolo三种目标检测算法对比实验表明,利用特征金字塔和重建输入图像可有效检测多目标多尺度的细粒度船舶对象,漏检率为1.5%,细粒度分类识别平均准确率为92.67%.  相似文献   

8.
针对目前人脸表情识别存在准确率不高、模型复杂和计算量大的问题,文章提出了一种基于八度卷积改进的人脸表情识别模型(OCNN):使用改进的八度卷积进行特征提取,提高对细节特征的提取效果,降低特征图的冗余,在不增加参数的同时减少运算量,以提高特征提取性能;利用DyReLU激活函数来增强模型的学习和表达能力;使用自适应平均池化下采样层代替全连接层,以减少参数;将模型在大规模数据集上进行预训练,并在FER2013、FERPlus、RAF-DB数据集上进行模型性能验证实验。实验结果表明:训练后的模型权重为10.4 MB,在人脸表情识别数据集FER2013、FERPlus和RAF-DB上的准确率分别达到73.53%、89.58%和88.50%;与目前诸模型相比,OCNN模型的准确性高且计算资源消耗低,充分证明了该模型的有效性。  相似文献   

9.
深度学习技术能以端对端方式实现农作物害虫识别,克服了传统机器学习方法特征选择具有主观性以及提取特征操作繁琐等不足,但识别的准确率和鲁棒性仍有待提高。为了研究出一种快速,高效的水稻害虫识别方法,本研究以稻纵卷叶螟、三化螟、稻蝗、稻飞虱4种常见的水稻害虫为研究对象,对传统的卷积神经网络Alexnet进行优化改进。首先从自然环境以及搜索引擎上获取4种不同的水稻害虫图像,并对图像进行数量扩增和细节增强预处理。然后对传统的卷积神经网络Alexnet进行优化改进,在Alexnet模型基础上,去除原有局部响应归一化层,在每一个卷积层后加入批归一化层,并采用全局平均池化和激活函数PReLU对模型结构进行优化。结果表明:改进后的模型在害虫数据集上的识别率不低于98%,相比于原网络提升了1.96%,高于LeNet5、VGG13、VGG16等传统网络;改进后的模型的损失值稳定在0.03附近,相比于原网络降低了0.1,均低于LeNet5、VGG13、VGG16等传统网络。从实验结果来看,改进后的方法在水稻害虫分类上有较高的识别率和较好的鲁棒性,可以为农作物害虫的智能识别提供了新的思路和方法。  相似文献   

10.
抽油机故障诊断对于保障油气田的稳定运行至关重要。针对已有基于深度学习的故障诊断模型参数量大导致应用范围受限的问题,提出一种基于空洞卷积和惩罚机制的卷积神经网络模型。该模型在浅层神经网络部署不同空洞卷积率的空洞残差模块,高效获取示功图轮廓特征的同时降低了模型参数量。其次,将惩罚机制融入Softmax损失函数,增强模型诊断气体影响等难分样本的故障准确率。采用抽油机实况数据集进行实验验证,结果表明该模型参数量为0.94 M,浮点型计算量为165.24 M。与MobileNetV3相比,改进后的算法模型在准确率同为96.6%的前提下参数量减少了3.30 M,浮点型计算量减少了52.22 M,更易部署在资源受限的故障诊断平台。  相似文献   

11.
耕地的数量和质量是保持农业可持续发展的关键,是政府部门的决策依据。目前这些信息的获取主要依靠人力,不仅浪费大量人力、财力,而且效率较低,不准确,因此利用卫星遥感影像识别分割耕地图像具有重要价值。本文提出了一种耕地图像分割神经网络SP-Vnet,其包含了条纹池化模块和空洞卷积的V型分割模型,并与迁移学习、图像形态学方法等结合,实现了卫星遥感图像中耕地的精确分割和提取。与目前六个主流的语义分割网络模型相比,本文提出的SP-Vnet在最近MathorCup遥感图像耕地分割的竞赛数据集上,取得了更高的整体准确率OA、F1值和平均交并比(mIoU)。实验表明,SP-Vnet能够加强网络的全局特征表征能力,显著提高了耕地识别的准确率,同时结合图像形态学方法的后处理操作,提升了耕地分割边缘的平滑性和准确性。  相似文献   

12.
手指静脉识别作为新型的生物特征识别技术,未来可广泛应用于身份识别领域。针对当前手指静脉图像质量差导致特征识别准确率较低的问题,提出一种基于改进谷形检测增强和Canny边缘修正的手指静脉识别方法。该方法首先改进用于局部静脉特征增强的方向谷形检测算子,增强静脉特征区域,然后利用Canny边缘检测算法对图像分割后的特征区域进行二次修正,在保证手指静脉特征区域完整性的同时降低伪静脉对识别率的干扰。在手指静脉数据库上进行实验,结果表明该方法对增强算法的泛用性较好,对4种不同的全局图像增强算法的识别准确率分别提升了8.66%,3.7%,1.78%,1.2%,能明显提高特征识别的准确率。  相似文献   

13.
针对基于目标检测方法的桥梁表观病害检测存在检测精度低、误检率和漏检率高的问题,提出一种改进YOLOv3的高准确率桥梁表观病害检测识别方法。为实现局部特征和全局特征有效融合,在YOLOv3的检测层中添加固定分块大小的池化模块,并在YOLOv3的特征提取网络中引入了DenseNet密集型连接网络结构以增强桥梁病害特征在网络中的传播和利用效率,提高检测效率,采用数据增强技术来扩充样本图像以解决现有桥梁病害数据集样本数量不足的问题。实验结果表明,改进后的YOLOv3在桥梁表观病害检测上的平均准确率比原YOLOv3提高了3.0%,且模型训练时间减少了33.2%,同时降低了对桥梁表观病害检测的误检率和漏检率。  相似文献   

14.
绝缘子在输电线路中大量使用且分布极广,是电力巡检过程中重点监控的元器件。绝缘子状态正常是输电线路平稳运行的前提。但由于绝缘子图像太过相似,导致绝缘子故障识别率低。为提高绝缘子的故障识别率,提出一种将弱监督细粒度分类思想与绝缘子故障识别结合的网络MFIFIN(Multi Feature Insulator Fault Identification Net)。网络使用基于全图的标签信息训练模型,利用多网络分别提取目标的物体级和部位级特征,然后将两种特征通过特征图合并和双线性池化进行融合。实验结果表明,在绝缘子故障识别中使用弱监督细粒度图像分类方法是有效的,在测试数据中,MFIFIN网络的分类精确率达到了88.32%,F1值达到了0.88。  相似文献   

15.
针对当前语义分割模型为提升像素分割精度,不断增加算法复杂度,导致模型出现参数量大,耗时长,难以部署至工业现场等问题,提出一种基于轻量级MobileNetV2-DeeplabV3+模型的棒材分割算法。算法为平衡像素分割精度、模型参数量和算法检测速度,在原网络基础上做出一系列改进:将原有的Xception主干网络替换为轻量级MobileNetV2网络以降低模型参数量与计算复杂度;在空洞空间金字塔池化(ASPP)模块基础上密集连接各空洞卷积以获得更大的感受野,更加密集的像素采样,并扩大输出特征覆盖的语义信息;使用深度可分离卷积(DSConv)替代ASPP模块中的标准卷积进一步降低模型的计算复杂度;此外,引入有效通道注意力(ECA)模块聚焦目标边缘特征,增强特征图通道信息提取的效果。实验表明:改进后的模型在棒材数据集下平均交并比(MIOU)为89.37%,平均像素精度(MPA)为94.57%,帧率(FPS)为33.09帧/s,模型参数量为33.6 M。与U-net、M-PSPNet、M-DeeplabV3+等模型相比,改进后算法的MIOU值与MPA值略低于最佳值,但仍处于较高水准,模型参数量小...  相似文献   

16.
钢包底吹氩过程中钢液表面裸露区域(即氩花)的面积可以间接反映吹入钢包中的氩气量。为了准确识别出钢水表面图像中的氩花区域,本文提出一种基于改进DeepLabv3网络的图像语义分割方法。该方法以DeepLabv3网络为基础,采用MobileNetV2作为主干特征提取网络,以降低网络的参数量和计算量;同时将原来的交叉熵损失函数替换成Focal Loss损失函数,以解决正/负样本不平衡和难/易分类样本不平衡的问题;最后在网络结构中添加通道注意力机制来提高语义分割精度。以生产现场采集的图像数据为对象进行实验,结果表明,与原始DeepLabv3相比,本文网络模型的参数量和计算量降低了约92.3%,平均交并比提升了0.82个百分点,达到92.4%,帧率提高了23.40%。  相似文献   

17.
针对行人重识别中信息丢失导致判别性信息缺失的问题,提出了一种多层次细粒度特征三分支网络行人重识别方法。首先,在ResNet50网络上构建中层全局特征分支、多层次全局特征分支和局部特征分支,全局分支提供更加全面的特征表示,局部特征分支提供细粒度的特征表示;其次,在三分支网络上改进了损失函数,使用权重向量和特征向量归一化以消除向量模的影响,通过构建难样本三元组损失以解决类间相似、类内差异分类问题;最后,在Market-1501和DukeMTMC-reid两个数据集上进行实验,rank-1达到了94.0%和87.4%,mAP达到了85.7%和75.5%.和现有的八种方法进行对比实验,结果表明本文方法在行人重识别中具有更好的准确率和精度。  相似文献   

18.
针对高分辨率网络中存在不同分支特征交叉融合导致参数量大、运算复杂度高等问题,提出了一种基于高分辨率检测网络(HRNet)的人体姿态估计优化网络模型.引入空洞空间卷积池化金字塔替代多分辨率分支网络交叉融合过程,同时引入注意力机制,提高网络输出特征图质量,从而保证改进后网络检测的准确度.在环境配置和网络输入图像分辨率一致的情况下,所提出的模型在COCO数据集上实验结果较HRNet相比参数量下降38.6%,运算复杂度下降35.2%.实验结果表明:改进后网络在检测精度略微下降的情况下,能有效降低参数量、运算复杂度.  相似文献   

19.
针对自然场景中交通标志识别问题涉及的识别准确率和实时性改善需求,提出了一种改进的基于多尺度卷积神经网络(CNN)的交通标志识别算法.首先,通过图像增强方法比选实验,采用限制对比度自适应直方图均衡化方法作为图像预处理方法,以改善图像质量.然后,提出一种多尺度CNN模型,用于提取交通标志图像的全局特征和局部特征.进而,将组合后的多尺度特征送入全连接SoftMax分类器,实现交通标志识别.采用德国交通标志基准数据库(GTSRB)测试了所提算法的有效性,测试结果表明,算法在GTSRB基准数据集上获得98.82%的识别准确率以及每幅图像0.1ms的识别速度,本文算法具有一定的先进性.  相似文献   

20.
为提高管道缺陷图像检测的准确率,提出一种基于改进RefineDet的管道数字射线成像(digital radiography,DR)缺陷图像检测模型。该模型针对管道DR缺陷图像数据少、目标少等特点,从以下三个方面进行改进。首先,在骨干网络设计方面,使用Swin transformer代替VGG16作为主干网络,在提高特征提取能力的同时减少主干网络参数量。其次,针对管道DR缺陷图像目标数量较少而易受背景干扰问题,通过在主干网络与特征融合阶段之间加入全局注意力模块来强化模型对重要特征的关注,从而提高检测性能。最后,在后处理阶段,针对传统的非最大值抑制算法直接去除非最好预测框问题,使用软非最大值抑制算法以更合理的方式去除非最优预测框。结果表明:该方法能够有效实现管道DR缺陷图像的检测,并且相比于其他4种常用的目标检测模型,提出的模型可以有效提升管道DR缺陷图像检测的准确率,研究成果可为DR缺陷图像检测提供技术支撑。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号