首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
针对半导体生产过程中的晶粒缺陷检测任务,提出了一种融入多头注意力机制的新型CNN模型(AttnNet).该模型使用深度可分离卷积和标准卷积累加的卷积结构提取输入图像特征,借助多头注意力机制更新特征权重,输出注意力机制筛选的图像分类结果.在13 513张晶粒图像构成的数据集上训练、验证及测试,并与VGG-16、ResNet-50和MobileNet-v2进行对比.相较于现有经典CNN网络模型,Attn-Net检测用时更短(1.26 s),模型尺寸更小(25 MB),在测试集上的分类准确率超过99%,是一种高效且轻量化的晶粒缺陷检测和分类模型.  相似文献   

2.
针对合成孔径雷达(synthetic aperture radar,SAR)图像的目标分类,传统的卷积神经网络(convolutional neural network,CNN)需要大量的数据样本进行训练,无法在小样本条件下进行,其应用受到限制。提出将胶囊神经网络(capsule network,Capsnet)算法用于SAR雷达图像的分类,针对小样本SAR数据集对Capsnet结构进行轻量化设计,并在MSTAR数据集上验证了该算法的有效性。结果表明,与CNN相比,基于Capsnet的SAR目标分类抗过拟合性强,泛化效果较好,具有更高的准确性,能够很好地实现SAR图像样本的分类。  相似文献   

3.
针对现有图书页面检索方法检索精度低的问题,利用任务无关数据集训练卷积神经网络,提出了一种基于卷积神经网络的图书页面检索方法.首先将待检图书页面图像进行图像分割和畸变校正,降低背景的干扰和几何畸变的影响;然后将校正后的图像输入卷积神经网络提取图像特征;最后使用夹角余弦距离来度量待检图像和候选图像的相似度.实验结果表明:本方法在测试数据集上的Top-5命中率为97.31%,而直接使用任务无关数据集训练的卷积神经网络的Top-5命中率仅为58.47%.本方法避免了耗费大量的时间和精力去收集大规模图书页面图像数据库,而且利用卷积神经网络强大的图像特征描述能力,取得了优异的图书页面检索精度.  相似文献   

4.
针对杂草的精确喷洒问题提出一种基于卷积神经网络(Convolution Neural Network, CNN)的棉花植株和杂草的检测识别方法。首先采集不同环境下棉田中棉花植株和不同种类的杂草图像作为网络模型的数据集,对数据集进行数据增强来增加数据集的数量,将其分为训练集与测试集;然后构建CNN模型,在模型中添加Dropout层,以防止网络出现过拟合,将训练集数据输入网络模型,使模型学习棉花植株和杂草的特征信息;最后将测试集数据输入CNN模型,测试CNN模型对棉花植株和杂草的识别能力。研究结果表明CNN对于棉花植株和杂草的分类结果精度超过了99.95%,识别时间为197.2s,证明CNN可以快速高效的识别棉田中棉花植株和杂草,为农业智能精确除草装备的研发提供研究基础。  相似文献   

5.
通过对矿物扫描电镜图像进行分类与鉴定,能够获取矿物的微观信息,确定矿物的组成与类别,对于油气田生、储、盖类型的研究具有重要的意义.由于在一幅图像之中有时不止有一种矿物,且不同矿物之间具有相关性或共生性的特性,而普通的神经网络只提取图像特征或只注意图像局部的特征关系,忽略了矿物之间的相关性.因此如何利用标签之间的关系进行更优秀的多标签图像分类成为扫描电镜图像分类的重要任务.鉴于上述情况,通过构建基于Resnet50的图像特征学习模块与基于图卷积神经网络的分类器模块构成的引入图卷积的卷积神经网络模型可以很好地完成上述任务.使用卷积神经网络模块提取图像特征,并利用GCN模块学习矿物标签之间的相关性,达到提高分类准确率的目的 .此模型相比普通的CNN模型准确率提高了5%,相比引入注意力机制的CNN模型,此模型的准确率仍有3%的优势.实验表明,CNN与GCN相结合的分类模型在扫描电镜数据集分类任务中优于其他的分类模型.  相似文献   

6.
为了对灾难场景图像进行快速分析和识别,提出了一种基于多分辨率卷积神经网络和残差注意力机制(attention module)相结合的图像分类模型.首先,对灾难场景数据集进行预处理,在相同类型的条件下将其随机划分为训练集和测试集.基于改进的卷积神经网络(convolutional neural network,CNN),提取训练集的图像特征.使用训练集图片的特征进行训练,并且在测试集图片上实现分类测试.选取DenseNet、Xception和MobileNetV2三种模型,以灾难场景数据集(Disaster_Data_Scenes)为数据集进行实验验证.结果表明:改进的Xception和MobileNetV2网络在灾难场景数据集上进行的图像分类实验测试,比原网络精度分别提升了4.56%和3.04%.其中改进的DenseNet网络比原网络模型精度分别提升9.13%、17.88%和10.27%.可见改进的卷积神经网络模型的分类精度得到有效提高.  相似文献   

7.
针对半监督分类模型存在的模型复杂度高、构造正则化项难度大的问题,从丰富样本特征表示的角度出发,构造了自适应图结构的融合网络模型(AGSH)。该模型在卷积神经网络模型(CNN)基础上引入了自适应图卷积神经网络(AGCN)提取CNN模型特征间的关系。对AGSH模型泛化性能的分析证明了该模型在解决半监督相关问题时的有效性。实验结果表明:融合模型在五种图像数据集上的分类精度相比于单一CNN模型分类精度均有提升。研究结论为解决小样本分类问题的建模方法提供了参考。  相似文献   

8.
为了提高图像分类精度,降低训练复杂度,提出一种采用无监督学习算法与卷积构造的图像分类模型.首先,从输入无标签图像中随机抽取大小相同的图像块构成数据集,进行预处理.其次,将预处理后的图像块通过两次K-means聚类算法提取字典,并采用离散卷积操作提取最终图像特征.最后,采用Softmax分类器对提取的图像特征进行分类,得出准确率.将该模型与卷积神经网络(CNN),Dropout CNN网络进行比较,结果表明:在对大规模高维图像分类上,文中模型具有分类精确度高、简单、训练参数少、适应度高等优点.  相似文献   

9.
针对新型冠状病毒感染胸部 X-ray 图像分类任务数据集样本过少,现有的两阶段分类器和三阶段分类器模型对高纬度的图像特征提取效果差,模型训练慢等问题,提出一种基于 ConvNeXt 卷积神经网络改进的分类任务算法 ConvNeXt-AT。 ConvNeXt-AT 分类模型首先通过在 ConvNeXt Block 层添加混合域注意力机制 CBAM 来提高图像特征提取能力,不仅考虑了通道间的信息交互能力还考虑到了空间域上像素间的联系,得到 ConvNeXt-AT 模型;然后针对 X-ray 图片常见的泊松噪声使用全变差正则化方法对数据集进行降噪处理;最后在 COVID-19 公开的大型数据集共 21165 张图片进行对比实验。 实验结果表明,在训练数据集充分的情况下,改进的 ConvNeXt-AT 模型相较于常用分类模型 ResNet-50、MobileNet、EfficientNet 以及原 ConvNeXt-T 在准确率上分别提升了 2%、2. 7%、2. 1%、1. 9%。 最后通过 Grad-CAM 显示类激活图的图像可视化方法证明改进方法是可行的,模型具有很好的鲁棒性。  相似文献   

10.
为提高钢筋混凝土锈蚀裂缝检测分类的效率和精度,提出了一种基于深度学习卷 积神经网络(Convolutional Neural Network,CNN)的钢筋混凝土锈蚀裂缝识别模型 SCNet(Steel Corrosion Net). 首先通过原始数据采集和数据增强构建了39 000张图片的裂缝数据集,然后利 用 TensorFlow 学习框架和 Python构建神经网络模型并进行训练测试,根据模型的训练精度和 测试精度进行网络结构和网络参数的优化,最终将 SCNet识别模型与两种传统检测方法进行 对比 . 结果表明:文中所建立的 SCNet三分类神经网络模型达到了 96.8%的分类准确率,可以 有效识别分类钢筋混凝土锈蚀裂缝,并且具有较高的准确率和可测性;在图像数据有阴影、扭 曲等噪声干扰的条件下,两种传统检测方法已不能达到理想的分类效果,SCNet模型仍能表现 出相对稳定的分类性能.  相似文献   

11.
细粒度图像分类任务比一般图像分类任务更具有挑战性,其通常需要对类间差异小、类内差异大的样本进行分类.现有细粒度分类方法主要依赖视觉特征进行分类,而人类可以根据文本描述等属性描述来辅助识别图像类别.该文提出了一种通过预测属性引导的通道注意力模块,该模块可以插入到任意的卷积神经网络中,从而让模型学习到更高级的特征表示.最后,该算法在CUB-200-2011数据集上测试,在使用Resnet-50、VGG-19、Bilinear-CNN作为主干网络训练时的精度分别达到87.1%、82.1%、85.5%,精度得到显著提升.  相似文献   

12.
为了研究Gabor滤波器在卷积神经网络中的性能和特征提取能力,提出了模拟视觉神经元特性的Gabor卷积神经网络计算模型。利用符合视觉神经元感知特性的Gabor滤波器作为建议神经网络的卷积核,将Gabor滤波器与CNN相结合,从而构建Gabor卷积神经网络。实验采用3个公共图像数据集进行图像分类任务,验证GaborConv网络的各项性能,并与经典的VGG16进行对比分析。实验结果表明,Gabor卷积神经网络的图像分类精度相对CNN有所提高,其收敛速度也明显加快,同时大量减少网络训练参数数量,释放计算机的内存。  相似文献   

13.
【目的】为了充分利用动态的人体骨架特征,提高行为识别精度,提出一种基于人体时空骨架特征的图卷积行为识别算法。【方法】首先在空间上确定主关节点,再融合各关节点与主关节点之间的向量和关节点间的骨骼长度,获取瞬时状态下关节点的相对位置关系;然后计算相邻两帧之间由相同关节点构成的时序动作信息来描述运动状态;最后,将时空信息融合到时空图卷积网络中,进行端到端训练。【结果】与时空图卷积网络识别算法相比,在400分类Kinetics行为识别数据集上的Top-1和Top-5指标分别提升了1.78%和1.77%,在NTURGB+D数据集的两个基准上的Top-1分别提升4.13%和2.61%。【结论】提出的基于人体时空骨架特征的图卷积行为识别算法是有效实用的。  相似文献   

14.
卷积神经网络(Convolutional Neural Networks,CNN)可以提供比传统分类算法更强大的分类器并且能够自学习得到深层特征,有效地提高了图像语义分割的准确性.然而,基于CNN的语义分割算法依然存在一些挑战,例如在复杂场景中现有较优的方法较难分割小目标.为了解决复杂场景下小目标分割的难题,提出一种结合目标检测的小目标语义分割算法.与现有较优方法不同的是,该方法没有直接利用单个神经网络模型同时分割单幅图像中的小尺寸和较大尺寸目标,而是将小目标分割任务从完整图像的分割任务中分离.算法首先训练一个目标检测模型以获取小目标图像块,然后设计一个小目标分割网络得到图像块的分割结果,最终根据该结果修正整体图像的分割图.该算法提升了语义分割数据集的总体性能,同时能够有效地解决小目标分割的难题.  相似文献   

15.
为实现低资源嵌入式设备的图像分类识别,针对能实现简单图像识别任务、对图像识别准确率要求不高,且要求低成本的场景,将卷积神经网络(CNN:Convolutional NeuralNetwork)部署到资源受限的微控制器单元(MCU:Microcontroller Units)上。首先提出一种在资源受限MCU上的轻量化部署策略:为降低模型的参数量,提出一种轻量化的神经网络算法;为保证模型大小能适应有限的随机存取存储器(RAM:Random Access Memory),提出了一种基于闪存(FLASH:Flash Memory)扇区的替存储算法。其次,在资源受限的嵌入式设备上部署该策略。针对采集图像的质量和采集速度不匹配问题,设计了摄像头外围电路;对采集图像进行基于高斯分布的自适应阈值二值化处理并对图像样本完整性进行校验。实验结果表明,该系统取得大约80%~89%的识别准确率。虽然该准确率低于训练精度10%左右,但在上述对精度要求不高的实际场景中可以较好地应用。  相似文献   

16.
针对现有花卉识别方法存在的识别精度不高、模型体积大等问题,提出一种基于轻量化模型和迁移学习的花卉识别方法.首先,以MobileNetV2模型作为骨干网络构建轻量化的花卉识别模型;然后,采用迁移学习策略使模型具备良好的初始特征提取能力;最后,利用小规模的花卉图像数据集对模型进行逐级训练和微调,使模型获得最佳的花卉识别能力.实验结果表明,该花卉识别模型在花卉图像数据集Oxford flower-102上获得了97.76%的识别精度,并且模型体积只有9.2 MB,具有识别精度高、模型体积小的优点,方便在移动设备上部署和应用.  相似文献   

17.
针对细粒度图像分类中数据分布具有小型、非均匀和不易察觉类间差异的特征,提出一种基于注意力机制的细粒度图像分类模型.首先通过引入双路通道注意力与残差网络融合对图像进行初步特征提取,然后应用多头自注意力机制,达到提取深度特征数据之间细粒度关系的目的,再结合交叉熵损失和中心损失设计损失函数度量模型的训练.实验结果表明,该模型在两个标准数据集102 Category Flower和CUB200-2011上的测试准确率分别达94.42%和89.43%,与其他主流分类模型相比分类效果更好.  相似文献   

18.
针对Ada Boost算法训练分类器的特征具有大量冗余问题,提出了一种融合特征选择的Ada Boost集成算法.首先,使用一种特征选取方法,选择图像特征之间冗余度最小的特征,构造最优训练集;其次,采用Ada Boost算法训练分类器,构建分类模型;最后,使用分类模型实现待标注图像的自动标注.实验使用华盛顿大学用于图像自动标注的数据集,结果验证算法的有效性,并且相比其他传统算法,该算法具有更高的分类精度.  相似文献   

19.
为解决标记样本缺乏、提升分类精度及增强模型容错性等问题,提出一种基于辅助分类器生成对抗网络(ACGAN)的分类方法.首先,将预训练的ACGAN模型作为光谱特征提取器,采用局部二值模式(LBP)算法提取图像的纹理特征;然后,融合光谱特征和纹理特征,由卷积神经网络(CNN)进行分类.在2个广泛使用的数据集上进行实验,结果表明:相较于其他方法,文中方法可显著提高分类精度.  相似文献   

20.
为解决小样本沥青路面破损图片在分类识别中存在的识别精度差的问题,选择常见的5种路面破损类型,提出了一种基于VGG的浅层深度卷积神经网络模型的路面破损图像分类方法. 首先,将采集到的图像集进行预处理并自制成数据集. 其次,设置三种不同的批处理量尺寸和两种不同的网络层数作训练,选择最适合该网络模型的尺寸,得到浅层VGG模型. 将处理后的路面图片直接作为模型的输入,作模型的训练、验证及测试. 最后,将模型试验结果与支持向量机及目前主流的深度卷积神经网络模型的试验结果进行对比. 结果表明:浅层VGG模型在训练集、验证集及测试集的分类准确率接近,对路面破损图像的分类识别准确率都达到98%以上,表现出模型良好的识别能力;与支持向量机及目前主流的网络模型试验结果相比,浅层VGG网络模型训练耗时少且泛化能力更强,模型提取到的特征更丰富,可获得更加全局的信息. 可见,浅层VGG模型在对小规模图像的分类识别中具有显著优势,同时相比其他方法更具鲁棒性,结果更精确.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号