首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 515 毫秒
1.
基于深度学习的图像识别技术在具体应用前必须先经过大量带标签样本的训练,然而在实际场景中目标域样本可能非常稀缺,小样本图像识别技术应运而生.为了提升小样本场景下的图像识别准确率,本文提出一个通用的两阶段训练模型以融合现行主流方法并增强其表现.首先,针对训练时不同害虫种类背景相似度过高的问题提出融合双注意力机制的特征加强模块;其次,针对小样本情况下预测可能产生的过拟合问题提出基于高斯分布的特征生成模块以提高泛化能力;最后,将三种典型小样本识别方法统一成两阶段训练模型以融入提出的方法.将该思路及改进首次应用于传统害虫分类数据集IP102,识别准确率可以在基准方法上取得2.11%到6.87%的提升.为了进一步验证本文方法的有效性,在小样本领域公开数据集Mini Imagenet也进行了相应的实验,提升效果同样显著.  相似文献   

2.
针对雾天图像降质带来的车牌识别难题,提出一种采用图像自适应增强的轻量级车牌检测和识别算法。以目标检测网络YOLOv5s和车牌识别网络LPRNet为基础,设计一个改进的图像自适应增强模块级联于YOLOv5s之前,并引入混合注意力(SA)机制改进LPRNet。图像自适应增强模块由带参数的图像去雾和纹理增强模块以及自适应参数预测模块组成。自适应参数预测模块是轻量级卷积神经网络,与YOLOv5s联合训练,为不同程度的带雾图像自动提供合适的去雾和纹理增强参数以获得更准确的车牌检测结果。利用车牌位置的真实标签和实际检测结果,采用混合注意力机制和迁移学习策略得到最终的SA-LPRNet模型,缓解识别模型对检测结果的敏感性以获得更高的车牌识别准确率。在合成的雾天车牌数据集上的实验结果表明:本文算法对雾天车牌检测的mAP@0.5-0.95指标达到70.6%,车牌识别准确率达到93.5%,优于对比算法,且识别速度满足实时性要求。  相似文献   

3.
使用生成对抗网络(GAN)扩充宫颈癌病理图像的数据集以提高计算机辅助诊断的准确率.首先,使用GAN进行细胞质部分图像生成;其次,使用两次k-means聚类对生成图像进行筛选;最后,使用Inception-V3模型对数据集进行分类训练.结果表明,在测试集相同的情况下,该方法可以将总体分类准确率提升约2.5%,尤其对低分化宫颈癌病理图像有显著效果.通过GAN解决了组织病理学图像无方向性、内容复杂、前景目标规则性差等问题,证明了该方法的有效性及发展潜力.  相似文献   

4.
针对现有对抗样本检测方法存在检测准确率低和训练收敛速度慢等问题,提出一种基于图像去噪技术和图像生成技术实现的对抗样本检测方法.该检测方法将对抗样本检测问题转换为图像分类问题,无须事先得知被攻击模型的结构和参数,仅使用图像的语义信息和分类标签信息即可判定图像是否为对抗样本.首先,采用基于swin-transformer和vision-transformer实现的移动窗口式掩码自编码器去除图像中的对抗性噪声,还原图像的语义信息.然后,使用基于带有梯度惩罚的条件生成式对抗网络实现的图像生成部分根据图像分类标签信息生成图像.最后,将前两阶段输出的图像输入卷积神经网络进行分类,通过对比完成去噪的图像和生成图像的分类结果一致性判定检测图像是否为对抗样本.在MNIST、GTSRB和CIAFAR-10数据集上的实验结果表明,相比于传统检测方法,本文提出的对抗样本检测方法的平均检测准确率提高6%~36%,F1分数提高6%~37%,训练收敛耗时缩减27%~83%,存在一定优势.  相似文献   

5.
验证码字符识别技术作为数字图像处理的一个重要应用分支,其目的在于准确、快速地分析验证码所携带的字符内容.已有研究通过构建卷积神经网络进行验证码字符识别,并且取得了一定的效果;但是大部分研究使用特征的浅层信息作为模型的输入,受局部感受野的限制而丢失特征,未能充分分析验证码的深层特征信息,并且未能对特征进行充分融合,造成识别准确度还有一定提升空间.提出了一种基于注意力机制的卷积神经网络模型,首先采用Otsu算法对验证码进行预处理后,输入到VGG16模型提取验证码的特征;然后引入注意力机制,自动学习关键信息,得到不同特征的权重;最后基于卷积神经网络进行特征融合,通过训练后得到验证码识别模型.提出的模型在调用Captcha库生成的验证码数据集上进行验证,结果显示提出的方法在不增加时间成本的情况下,验证码识别准确率平均可达到93.27%,对比ResNet、CNN和CNN7基线方法,分别提升了8%、10%和22%.因此,提升了验证码识别的准确率,促进了自动识别车牌等场景落地,推进了验证码识别技术的发展.  相似文献   

6.
为了有效修复大面积破损的面部图像,通过生成对抗网络,使用解码器-编码器结构的卷积神经网络作为生成模型,增强生成模型的结构信息预测能力,同时引入对抗训练策略优化生成模型。该模型首先训练一个判别模型识别真实图像,再将判别待修复图像输入生成模型后所得到的结果是否真实,从此为生成模型提供优化梯度。结合卷积神经网络的结构信息预测能力和DCGAN对抗策略的优化能力,提高图像补全效果。通过在CeleBA人脸数据集上进行的实验结果表明:该方法在补全大面积破损的图像任务上性能明显优于其他方法。  相似文献   

7.
张荣梅  张琦  陈彬 《科学技术与工程》2020,20(12):4775-4779
传统的车牌识别算法包括模板匹配、特征统计等方法,但是这些算法依赖于人工提取图像特征,识别准确率低。卷积神经网络LeNet-5算法能够自动提取车牌图像的特征,提高车牌识别准确率。但是目前基于LeNet-5网络结构的车牌识别算法存在识别不完整,运算时间长等缺点。提出基于改进的LeNet-5网络的车牌识别算法,该算法将输入车牌字符图像归一化为32×16大小,并通过删除传统LeNet-5网络中的C5层、修改输出层中神经元个数等,将车牌字符按照汉字和数字/字母的形式识别输出。通过采集大量车牌数据进行训练验证,结果表明:与前人改进的LeNet-5网络结构相比,本文算法在识别率和时间效率上均得到了提高。  相似文献   

8.
人脸口罩穿戴识别技术可以有效监督及管控人们佩戴口罩.本文基于迁移学习理论,共享经典卷积神经网络部分参数,修改其最后几层连接层,使用8 967张图像样本集进行训练,得到了新模型;同时结合了人脸检测技术,针对检测后人脸子图像,采用图像分类方法实现了快速识别.通过迁移学习对深度网络模型开展迁移训练,解决了因为样本量少导致的准确率低等问题,新模型能够有效解决人脸口罩穿戴识别问题,使源领域知识得到了迁移.通过MATLAB编写迁移学习程序和应用仿真主程序,调用了摄像头硬件实现了真实场景应用仿真.实践证明,该研究具有较强的应用价值.  相似文献   

9.
针对计算机生成图像(Computer Generated images, CG)与真实照片(Photograpgh, PG)识别率不高的问题,该文提出了一种改进的卷积神经网络方法来实现CG与PG的识别.该方法首先对识别问题进行卷积神经网络二分类建模,并选择VGG-19网络结构作为基础,建立不同的模型.该方法创新性地引入迁移学习,节省训练时间和大量计算资源,最后使用softmax分类器进行分类.实验结果表明,该文方法对PG图像的识别准确率达到92%.与其他方法比较,该文方法识别准确率最高,说明该文方法具有可行性与有效性.  相似文献   

10.
光学乐谱识别是音乐信息检索中一项重要技术,音符识别是乐谱识别及其关键的部分.针对目前乐谱图像音符识别精度低、步骤冗杂等问题,设计了基于深度学习的端到端音符识别模型.该模型利用深度卷积神经网络,以整张乐谱图像为输入,直接输出音符的时值和音高.在数据预处理上,通过解析Music XML文件获得模型训练所需的乐谱图像和对应的标签数据,标签数据是由音符音高、音符时值和音符坐标组成的向量,因此模型通过训练来学习标签向量将音符识别任务转化为检测、分类任务.之后添加噪声、随机裁剪等数据增强方法来增加数据的多样性,使得训练出的模型更加鲁棒;在模型设计上,基于darknet53基础网络和特征融合技术,设计端到端的目标检测模型来识别音符.用深度神经网络darknet53提取乐谱图像特征图,让该特征图上的音符有足够大的感受野,之后将神经网络上层特征图和该特征图进行拼接,完成特征融合使得音符有更明显的特征纹理,从而让模型能够检测到音符这类小物体.该模型采用多任务学习,同时学习音高、时值的分类任务和音符坐标的回归任务,提高了模型的泛化能力.最后在Muse Score生成的测试集上对该模型进行测试,音符识别精度高,可以达到0.96的时值准确率和0.98的音高准确率.  相似文献   

11.
为了解决智能零售视觉结算任务中的增量学习问题,提出一个新颖的基于数据增广的三元组模型,由合成网络、渲染网络和检测网络组成。合成网络与渲染网络协同学习,将单品示例图像以数据增广方式生成分布接近真实数据的渲染视觉结算图像。在增量学习阶段,原有产品和新产品的示例图像协同学习,生成包含新产品的结算图像。所有渲染视觉结算图像被用于训练检测网络,训练好的模型能同时识别原有产品和新产品。试验结果表明,该模型具有相较于现有增量学习方法更优异的对抗灾难性遗忘能力,增量后的结算准确率为64.90%,遗忘率为3.63%,优于现有最佳方法的4.38%。  相似文献   

12.
随着工业智能巡检的不断发展,基于数字图像处理方法的设备元件状态识别系统被广泛应用.为提升配电室中配电柜设备元件状态识别的准确率,提出了一种基于残差网络(residual networks, ResNet)的设备元件状态识别方法.首先搭建数据采集系统,构建数据集;然后对配电柜图像,裁剪预设的设备元件目标区域,生成设备元件图像;对于设备元件图像,构建基于ResNet的元件状态识别模型并训练;使用训练完毕的模型识别元件的状态.以变电站配电室中配电柜设备元件数据集作为研究对象,对于特征复杂的元件采用单预测头的网络,对于特征简单的元件采用多预测头的网络;然后使用紧凑和剪枝的模型压缩方法在精度损失较小的情况下减少参数量和计算量;最后介绍巡检系统的架构设计,将JetSon Nano边缘终端作为算法模块的运行硬件,以减少通信成本.  相似文献   

13.
对宫颈的检查图像进行识别可以有效预防宫颈癌的发生,然而,正确分辨出患癌趋势的图像对人类来说是极难掌握的技术。使用深度学习方法对宫颈检查图像进行识别分类,以辅助人类专家做出诊断;首先对图像进行手动裁剪来增大信噪比,把原始图像进行格式转换来提高数据读取效率,并在图像输入模型之前进行随机变换以增大训练集;然后建立CNN模型,进行训练并调整参数;最后在测试集上分类准确率达到了89.1%,结果表明,使用深度学习辅助专家进行宫颈癌的早期诊断是可行的。  相似文献   

14.
针对复杂实际场景中模糊、污损、扭曲、倾斜等车牌图像关键信息缺失以及新能源车牌背景与字符对比度低难以识别的问题,提出了一种编解码结构的车牌图像超分辨率网络。首先,构建一种基于编解码结构的车牌重构生成器网络,利用编码器对车牌图像的纹理、字符等特征进行提取,解码器对车牌特征进行重构;然后,设计一种基于语义监督的判别器网络,在网络损失中引入了对抗损失与CTC(connectionist temporal classification)损失,增强生成器网络对车牌图像语义特征的表征能力;最后,基于VGG16网络提取车牌顶角点特征,利用坐标变换方法对车牌图像进行矫正,进一步提高重构清晰度与识别准确率。采用所提网络在自建XAUAT-Parking数据集和公开CCPD数据集上进行超分辨率重构与识别实验,结果表明:所提网络在CCPD数据集上的平均峰值信噪比可达25.5 dB,结构相似性(SSIM)可达0.989;在XAUAT-Parking数据集上峰值信噪比可达26.6 dB,结构相似性可达0.997。研究结果表明,该网络有较好的车牌图像超分辨率重建效果,而且对车牌关键信息缺失问题具有较强的鲁棒性。  相似文献   

15.
为了提高自然环境下苹果病虫害的识别准确率和识别效率,提出了具有动态学习特征的VGG-F苹果病虫害识别模型。首先,依据常见的苹果病害和虫害类型构建图像数据集,同时采用Retinex算法对数据集中的含雾图像进行增强处理;然后选择网络层数较少的VGG-F网络模型作为迁移学习对象,并依据数据样本特性对重训练过程进行学习率动态调整,以及基于试验对比选取最佳动量值;最后,利用数据集对三种不同模型进行重训练和识别效果对比测试。数值测试结果表明,相比于原始VGG-F模型和深层模型VGG-19,文中模型将苹果病虫害识别准确率分别提升了5%和0.63%,且该模型的重训练时间最短,从而验证了文中苹果病虫害识别模型的有效性。  相似文献   

16.
为了在数据集过小时更好的训练卷积神经网络,本文提出一种方法通过训练GAN(生成对抗网络)生成新的样本进行图像数据增强。扩充后的数据集应用于训练图像分类模型,得到了不错的效果。针对Herlev宫颈细胞数据集的二分类问题,本文首先使用原始训练集训练GAN,生成了大量高质量的高分辨率细胞图像,将每类训练集扩充到24 000例。然后使用扩充后的训练集进行分类网络训练,在Resnet迁移学习的验证集准确率高达97%,高于仿射变换扩充的数据集的训练结果93%,可见本文方法可以有效地实现图像的数据增强。本文方法也可用于其他领域的图像数据增强。  相似文献   

17.
 近年来,深度学习在计算机视觉领域取得了巨大的突破,其背后是利用大量标签数据对深度网络进行监督训练,而标注大规模数据集非常昂贵且十分耗时。针对大规模数据集标注问题,苹果公司的Shrivastava团队希望借助现有的计算机仿真技术以及对抗训练的方法,实现仿真图像的无监督学习,从而避免昂贵的图像标注过程。该团队在对抗网络的基础上提出3个创新点:(1)自正则项;(2)局部对抗损失;(3)使用历史生成图片更新判别器,使得生成真实化图片的同时保留输入图像特征。实验结果展示该方法可以生成高度真实化的图片。研究者通过训练凝视估计模型、手部姿态估计模型定量分析生成图片的效果,分析结果表明,使用生成图片训练的模型,在MPⅡGaze数据集上测试效果有很大的提升,达到了当时最好的效果。不过,研究者并未在包含多个物体的复杂场景下进行实验,文中提出的方法在复杂场景下的应用还存在局限性。  相似文献   

18.
为提高低清晰度车牌识别技术中字符分割和识别的准确率,提出了在HSV(色调,饱和度,亮度)颜色空间下使用最大类间方差(OTSU)算法来对车牌图像进行二值化,然后结合特殊间隔位置和投影法来精确分割字符,并在字符识别阶段引入了卷积神经网络.通过对真实场景中提取的低清晰度车牌进行实验可见:提出的分割算法能够准确分割字符,准确率可达96.5%,同时引入的卷积神经网络对车牌字符识别率为97.8%,能够有效解决低清晰度车牌字符的分割和识别问题.  相似文献   

19.
为解决非约束场景下的车牌识别精度问题,提出一种能够适应非约束场景并识别不同类型单车牌以及多车牌的自动车牌识别模型。该模型应用数据迁移技术,通过YOLOv5检测车辆并通过后处理筛选有效车辆目标,经检测并矫正后,通过ResNet18以及双向长短期记忆网络BLSTM网络结合连接时序分类损失CTC识别车牌字符。在模型训练过程中使用数据增强技术进一步提高了模型性能。该模型在CCPD以及AOLP的多个子数据集上进行了测试,展现出了优于其它方法识别精度和识别速度。  相似文献   

20.
为解决小样本沥青路面破损图片在分类识别中存在的识别精度差的问题,选择常见的5种路面破损类型,提出了一种基于VGG的浅层深度卷积神经网络模型的路面破损图像分类方法. 首先,将采集到的图像集进行预处理并自制成数据集. 其次,设置三种不同的批处理量尺寸和两种不同的网络层数作训练,选择最适合该网络模型的尺寸,得到浅层VGG模型. 将处理后的路面图片直接作为模型的输入,作模型的训练、验证及测试. 最后,将模型试验结果与支持向量机及目前主流的深度卷积神经网络模型的试验结果进行对比. 结果表明:浅层VGG模型在训练集、验证集及测试集的分类准确率接近,对路面破损图像的分类识别准确率都达到98%以上,表现出模型良好的识别能力;与支持向量机及目前主流的网络模型试验结果相比,浅层VGG网络模型训练耗时少且泛化能力更强,模型提取到的特征更丰富,可获得更加全局的信息. 可见,浅层VGG模型在对小规模图像的分类识别中具有显著优势,同时相比其他方法更具鲁棒性,结果更精确.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号