首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对磁瓦缺陷种类多样性及无法准确描述其缺陷的问题,提出一种基于卷积神经网络的缺陷检测方法。构建缺陷类型的数据集,并对数据集中的图像进行预处理;设置卷积神经网络模型参数,训练缺陷分类器;通过训练结果完成对缺陷图像的识别并标注缺陷类型。实验结果表明,该方法检测的准确性和实时性均优于传统检测方法,具有非常好的鲁棒性,为工业生产的实际应用提供了可靠的依据。  相似文献   

2.
针对传统卷积神经网络层级较为浅,对物体识别精确度较低的原因,利用改进的深层卷积网络VGG16模型检测视频运动目标.首先,预处理过程中对数据集进行剪裁和旋转操作,补充数据集数量,以解决前期图像资源不足等问题;其次,在PASCAL VOC数据集上先预训练模型,接着加载自定义视频数据集对预训练模型进行第二次训练.实验结果表明,该网络模型能很好用于视频目标识别,提高了检测精确度,有效减少网络参数计算量,降低硬件内存资源消耗,具有较强的鲁棒性.  相似文献   

3.
光学乐谱识别是音乐信息检索中一项重要技术,音符识别是乐谱识别及其关键的部分.针对目前乐谱图像音符识别精度低、步骤冗杂等问题,设计了基于深度学习的端到端音符识别模型.该模型利用深度卷积神经网络,以整张乐谱图像为输入,直接输出音符的时值和音高.在数据预处理上,通过解析Music XML文件获得模型训练所需的乐谱图像和对应的标签数据,标签数据是由音符音高、音符时值和音符坐标组成的向量,因此模型通过训练来学习标签向量将音符识别任务转化为检测、分类任务.之后添加噪声、随机裁剪等数据增强方法来增加数据的多样性,使得训练出的模型更加鲁棒;在模型设计上,基于darknet53基础网络和特征融合技术,设计端到端的目标检测模型来识别音符.用深度神经网络darknet53提取乐谱图像特征图,让该特征图上的音符有足够大的感受野,之后将神经网络上层特征图和该特征图进行拼接,完成特征融合使得音符有更明显的特征纹理,从而让模型能够检测到音符这类小物体.该模型采用多任务学习,同时学习音高、时值的分类任务和音符坐标的回归任务,提高了模型的泛化能力.最后在Muse Score生成的测试集上对该模型进行测试,音符识别精度高,可以达到0.96的时值准确率和0.98的音高准确率.  相似文献   

4.
为实现玉米病害图像快速、准确识别,提出了一种基于非对称注意力机制残差网络(asymmetric convolution attention resnet,ACA-Resnet)的图像检测模型.在残差网络的基础上,通过引入非对称卷积结构减少参数量,加快模型训练速度,同时引入注意力机制,改善模型的表达能力,提高检测准确率.为减小由于病害图片数量不足而造成的过拟合现象,采用迁移学习的方法提高模型的稳定性和泛化能力.结果 表明,ACA-Resnet经过ImageNet数据集预训练后对玉米病害图像的平均识别准确率可达到97.25%,较VGG-16、Inception-V3和ResNet50等网络分类效果更好,相较于Resnet50训练速度明显提升.可见本文方法训练速度快,识别精度高,可为玉米病害检测提供借鉴.  相似文献   

5.
应用卷积神经网络将肺结节从含有背景、噪声的胸腔区域里检测并识别出来。首先,对图像进行预处理,获得肺实质图像。然后,应用Faster R-CNN多特征融合算法检测肺结节候选区域,再利用多角度特征融合方法滤除假阳性结节。接着,通过数据增强法、残差学习法、优化初始参数等对卷积神经网络的性能进行优化。最后,应用迁移学习方法对数据集进行训练,得出最终的检测结果。抽取LIDC数据集中含有肺结节图像数据,检测并识别肺结节的准确率达到98. 1%。实验结果表明,该算法优于其他3类算法,实现了肺结节的精确检测和识别,在保证检测和识别出正确结节的前提下,降低了过拟合率及训练时间,提高了算法效率,研究成果为早期肺癌的诊断提供参考依据。  相似文献   

6.
针对智能车环境感知中单一传感器所存在的局限性问题,本文提出一种通过激光雷达融合摄像机来感应识别智能车前方障碍物的方法。首先,通过激光雷达与摄像机之间的校准,来实现目标的三维数据的图像投影,并进行视觉图像与目标的三维雷达数据的融合,以提取障碍物候选区域。其次,提出了一种基于卷积神经网络和SVM的障碍物识别模型,用于训练KITTI数据库中的数据,检测视觉图像中的行人和车辆目标,以此来得到所需要的单帧下各传感器的目标检测数据。实验结果表明,所提出的模型在KITTI中选择的小数据集上获得的模型在实际测试中具有良好的性能,具有可靠的识别能力和良好的分类结果。  相似文献   

7.
为了克服传统数字图像处理方法进行桥梁裂缝识别时面临的效率低、效果不佳等问题,提出了集成深度学习YOLOv5和U-Net3+算法的一体化桥梁裂缝智能检测方法.通过调整算法宽度和深度参数,优化边界框损失函数,构建基于YOLOv5目标检测算法的裂缝识别定位模型,实现桥梁裂缝快速识别与定位;引入结合深度监督策略及预测输出模块的U-Net3+图像分割算法,训练并构建桥梁裂缝高效分割模型,实现像素级裂缝智能化提取;建立结合连通域去噪、边缘检测、形态学处理的八方向裂缝宽度测量法,基于U-Net3+裂缝分割结果实现裂缝形态及宽度高精度测量;利用LabelImg图像标注软件制作包含4 414张图像的裂缝识别定位模型训练数据集;利用LabelImg图像标注软件及CFD数据集制作包含908张图像的裂缝分割模型训练数据集;利用无人机航拍的485张5 280×2 970 pixels桥梁索塔裂缝图像,来制作裂缝智能检测模型的测试对象.将所提出的裂缝检测方法应用于上述裂缝测试对象,其裂缝识别定位准确率91.55%、召回率95.15%、F1分数93.32%,裂缝分割准确率93.02%、召回率92.22%、F1分数92.22%.结果表明,基于YOLOv5与U-Net3+的桥梁裂缝智能检测方法,可实现桥梁裂缝高效率、高精度、智能化检测,具有较强的研究价值和广泛的应用前景.  相似文献   

8.
基于不变矩特征和神经网络的图像模式模糊分类   总被引:6,自引:0,他引:6  
提出了一种基于不变矩特征和神经网络的医学图像识别模型·所设计的识别模型包括不变矩特征提取、不变矩矢量标准化、模糊化预处理、BP网络与竞争选择·利用不变矩方法提取医学图像的特征矢量,能有效检测出具有平移、旋转和比例变化的图像,利用神经网络作为分类器对提取的特征矢量分类,使用模糊化的方法先对输入特征数据做预处理再进行识别,每一个图像模式归属于某一类是以0到1的数字代表其归属程度·实验结果验证了模型的有效性,训练好的网络有很好的分类能力·  相似文献   

9.
针对雾天图像降质带来的车牌识别难题,提出一种采用图像自适应增强的轻量级车牌检测和识别算法。以目标检测网络YOLOv5s和车牌识别网络LPRNet为基础,设计一个改进的图像自适应增强模块级联于YOLOv5s之前,并引入混合注意力(SA)机制改进LPRNet。图像自适应增强模块由带参数的图像去雾和纹理增强模块以及自适应参数预测模块组成。自适应参数预测模块是轻量级卷积神经网络,与YOLOv5s联合训练,为不同程度的带雾图像自动提供合适的去雾和纹理增强参数以获得更准确的车牌检测结果。利用车牌位置的真实标签和实际检测结果,采用混合注意力机制和迁移学习策略得到最终的SA-LPRNet模型,缓解识别模型对检测结果的敏感性以获得更高的车牌识别准确率。在合成的雾天车牌数据集上的实验结果表明:本文算法对雾天车牌检测的mAP@0.5-0.95指标达到70.6%,车牌识别准确率达到93.5%,优于对比算法,且识别速度满足实时性要求。  相似文献   

10.
车牌识别技术作为智能交通系统的核心课题之一,一直受到广泛的关注.近年来深度学习技术的迅速发展,更是为其提供了一种良好的解决方案.但实际场景下,研究者有时很难收集到足够的数据以支持模型训练.本文聚焦于小样本车牌识别问题,提出了使用生成对抗网络生成车牌图像,辅助后续模型训练的方法.本文方法先使用CycleWGAN合成大量带标签车牌图像;之后用合成图像对识别模型进行预训练;最后使用原始真实数据微调模型,进一步提高模型的准确率.本文在多个数据集上验证此方法,均获得了明显的效果增益,特别是当真实数据相对有限时,本文方法将准确率从已经较高的基线上又提升了7.5%.另外,在较困难的双动态车牌图像上,本文方法也取得了不俗的效果.最后,引入模型压缩技术,在原方法的基础上设计并实现了LightRCNN,使识别速度提升近1倍.  相似文献   

11.
针对传统方法过分依赖颜色等特征,导致对古籍文档复印件检测效果不佳的问题,基于深度学习技术建立了一种新的满文文档图像印章检测方法。通过图像变换和合成技术建立满文古籍文档图像数据增广算法解决训练数据不足的问题,在所构建的增广数据集上建立Faster R-CNN深度学习模型挖掘深层图像特征,实现满文文档图像印章检测方法。对采集的真实满文文档复印件图像进行实验,印章检测精度可以达到99.6%,表明本文的方法可以有效的检测古籍文档复印件图像中的印章,对满文文档的研究有重要意义。  相似文献   

12.
针对驾驶员分心行为对交通安全产生隐患的问题,提出一种结合图像分割与卷积神经网络的驾驶员分心行为检测方法。该方法通过使用图像分割处理后的驾驶员不同分心行为的图像对卷积网络结构模型进行训练,来减轻背景噪声的影响,以提高模型的识别性能。试验中使用未经分割的图像与经过前景分割后图像分别训练卷积神经网络模型,用分割后图像训练的模型识别的准确率达到了93.84%,高于使用原图像训练的模型。试验结果表明,结合图像分割和深度学习的驾驶员分心行为检测方法对驾驶员的分心行为有较好的检测效果。  相似文献   

13.
大数据时代,图像是重要的信息传递媒介,但图像质量退化将影响信息识别.针对各种类型的图像退化问题,提出一种融合长短期记忆(LSTM)的深度卷积神经网络(DCNN)的带记忆分类方法,识别退化图像模糊类型及其参数,根据准确的模糊类型及模糊核进行图像去模糊.首先改进DCNN卷积模型,调节卷积运算步长算子,加快图像卷积收敛速度;引入串行LSTM网络,将训练过的图像微元进行记忆,提高识别速度和准确性;通过BP网络输出模糊类型及其参数,再进行图像反卷积去模糊.实验表明能识别出3种主要模糊类型并识别率在90%以上,模糊参数误差在一个像素内,能复原出清晰的图像;最后将算法应用到实际高速铁路轨道缺陷检测系统中,对质量较差的图像进行模糊识别及去模糊,提高图像识别率.  相似文献   

14.
针对工件缺陷种类多样和特征不明显,造成机器视觉识别精度不稳定的问题,提出了一种基于深度学习网络模型与大数据自动训练的工件缺陷识别算法,并以软件工程来实现其功能。首先,对存在缺陷的工件进行取样,采集缺陷图像,建立识别标准。然后,基于深度神经网络模型和缺陷标准图像,进行模型训练,采取分批训练,逐步迭代收敛的方式,达到准确识别工件缺陷目的。最后,基于Python语言与TensorFlow框架实现深度神经网络模型,并将模型移植到C++平台调用,嵌入到商业版本软件中,实现算法的落地应用。实验测试结果显示,相对于已有的缺陷识别技术而言,本文算法具有更高的识别准确性,可为机器视觉软硬件设备提供技术基础。  相似文献   

15.
针对合成孔径雷达(SAR)海面溢油检测问题,采用Yolov4目标检测模型、语义分割网络(U-Net)模型、Xception预训练模型等多种卷积神经网络模型进行SAR图像海面溢油检测的模拟实验。基于一个仅有790个样本的像素为256×256的SAR图像海面溢油数据集,深入对比研究了3种SAR图像海面溢油检测神经网络模型,分析了不同检测模型在海面溢油检测中的检测效果。实验结果表明,相较于其他两种检测模型,Xception预训练模型具有更高的SAR图像海面溢油检测精度,更加适合应用于小数据集的溢油检测。  相似文献   

16.
针对SAR图像中舰船目标的检测问题,单纯基于深度学习的图像处理技术难以达到检测准确性和实时性要求.SAR图像中目标尺寸较小,且易受噪声、光斑干扰,传统方法难以提取精细特征并克服复杂条件下的背景干扰.针对以上问题,设计基于YOLOv3检测框架的端到端检测模型,借鉴了残差模块结构来避免网络退化问题.同时结合深层与浅层的不同尺寸特征图检测,使用目标基础特征提取网络参数来避免重复训练初始化过程.针对SAR图像中海上舰船成像小目标的特点改进优化了神经网络结构,实现SAR海面广域舰船目标识别分类算法,并对检测模型进行轻量化压缩处理.构建SAR图像舰船目标数据集并进行了多次目标检测识别分类实验,体现了提出的检测方法在复杂场景下有可靠的抗干扰能力和准确的目标检测识别性能.  相似文献   

17.
为解决图像采集中噪声和复杂背景对图片的影响以及深度神经网络的高耗时问题,基于可能性聚类算法与卷积神经网络,提出一种道路交通标识识别算法.该方法运用了图像分割技术,并结合卷积神经网络模型对道路交通标识进行更准确的识别.首先,通过色彩增强、图像分割、特征提取、数据增强和归一化等批量预处理操作,形成一个完整的数据集;然后,结合Squeeze-and-Excitation思想和残差网络结构,充分训练出MRESE(My Residual-Squeeze and Excitation)卷积神经网络模型;最后,将优化的网络模型用于道路交通标志的识别.实验结果表明,该方法使训练时间缩短了5%左右,识别精度可达99.02%.  相似文献   

18.
场景文字识别的一个具有挑战性的方面是处理具有扭曲或不规则布局的文字.尤其是侧视文字和曲线文字在自然场景中较为常见,且难以识别.本文提出了一个带有灵活矫正功能的注意力增强网络,将其用于任意形状场景文字识别.此网络由基于卷积神经网络的文字矫正网络和基于注意力增强的识别网络两部分组成.矫正网络自适应地将输入图像中的文字进行矫正,降低识别难度,使基于注意力增强的序列识别网络直接根据矫正后的图像预测字符序列.整个模型可以进行端到端的训练,训练只需要图像和相应的文字真实标签.在各种公开数据集上进行了广泛的实验,包括SVT、ICDAR 2003和CUTE80等数据集,验证了此网络具有优异的性能.  相似文献   

19.
颗粒流场特征检测通常采用粒子图像测速(PIV)技术测得速度场,再对多帧连续图像进行人工识别,检测结果存在一定的主观误差。因此,提出了一种在单帧流场图像中识别准静止区的DC-UNet++网络。首先,通过电荷耦合器件(CCD)采集小球冲击颗粒床形成的流场图像,再用PIV技术分析并制作数据集。然后,在多组数据集上训练CNN模型、UNet++模型和提出的DC-UNet++模型,验证分析其在单帧图像上检测准静止区的可行性与准确性。最后,讨论了该模型在非透明和透明两类颗粒材料中的低速冲击流场上的泛化能力。实验结果表明:DC-UNet++网络在非透明和透明颗粒材料上的准确率分别达到87.76%和72.91%。DC-UNet++网络实现了在单帧图像上检测目标特征的任务,且对透明颗粒材料复杂流场下的特征仍具有较为准确的检测结果。  相似文献   

20.
手势识别是模式识别领域的一个热点研究方向。提出了一种利用Kinect传感器深度图像进行手势分割的方法,并研究了基于灰度图像HOG特征的手势识别模型;深入研究了HOG特征,分析其特征向量特点,探讨了不同特征维数对训练机的影响及处理效率;通过SVM机器学习方法实现手势的分类识别,经过对大量实验样本的优化训练,获得了最优SVM参数,并进行分析、对比识别率。本文方法维数少、识别率高、运行速度快、性能稳定,能满足实时性手势识别的要求。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号