首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
细微的类间差异和显著的类内变化使得细粒度图像分类极具挑战性。为了对鸟类图像进行细粒度识别,提出一种基于跨层精简双线性池化的深度卷积神经网络模型。首先,根据Tensor Sketch算法计算出多组来自不同卷积层的精简双线性特征向量;其次,将归一化后的特征向量级联送至softmax分类器;最后,引入成对混淆对交叉熵损失函数进行正则化以优化网络。提出的模型无需额外的部件标注,可进行端到端的训练。结果表明,在公开的CUB-200—2011鸟类数据集上,该模型取得了较好的性能,识别正确率为86. 6%,较BCNN提高2. 5%。与多个先进细粒度分类算法的对比,验证了提出模型的有效性和优越性。  相似文献   

2.
随着大数据时代的发展,深度学习也渐渐变得更加实用,引领人工智能时代的发展.卷积神经网络在图像领域中发挥着非常重要的作用,是深度学习模型中重要组成部分之一.图像识别的关键攻破点在于如何提取图像的有效特征,从而有效地解决图像识别问题.针对这一难点,本文主要在残差网络(ResNet)的基础上引入空间变换网络.空间变换网络可以有效地提取目标区域特征,提高图像识别效率.同时由于Softmax分类器提取的特征区分并不明显,甚至存在类内间距大于类间间距弊端.但在图像识别任务中期望特征不仅可分,而且要求类间分别提取的特征区分差异大.针对这一问题,本文在软最大值(Softmax)分类器中引入中心损失函数(Center Loss). Center Loss损失函数能够使得提取的特征类间距离大,类内距离小,从而提高提取的特征识别度.在公开的CIFAR10数据集上,该模型取得了不错的性能,识别准确率达到了89%.相同实验条件下,相对于未改善的残差网络模型,本文提出的模型在公开的CIFAR10数据集识别正确率提高了6%.  相似文献   

3.
针对使用深度学习提取人脸表情图像特征时易出现冗余特征,提出了一种基于多层感知机(MLP)的改进型Xception人脸表情识别网络.该模型将Xception网络提取的特征输入至多层感知机中进行加权处理,提取出主要特征,滤除冗余特征,从而使得识别准确率得到提升.首先将图像缩放为48*48,然后对数据集进行增强处理,再将这些经过处理的图片送入本文所提网络模型中.消融实验对比表明:本文模型在CK+数据集、JAFFE数据集和MMI数据集上的正确识别率分别为98.991%、99.02%和80.339%,Xception模型在CK+数据集、JAFFE数据集和MMI数据集上的正确识别率分别为97.4829%、90.476%和74.0678%,Xception+2lay模型在CK+数据集、JAFFE数据集和MMI数据集上的正确识别率分别为98.04%、84.06%和75.593%.通过以上消融实验对比,本文方法的识别正确率明显优于Xception模型与Xception+2lay模型.与其他模型相比较也验证了本文模型的有效性.  相似文献   

4.
花卉图像类内差异性大和类间相似性高使得花卉图像分类较难.传统花卉分类方法和普通卷积神经网络很难完整地表达花卉图像的特征,故而分类效果不理想.为提高花卉分类准确率,提出改进的InceptionV3网络用于花卉图片的分类.采用迁移学习的方法,将在大规模数据集上训练的InceptionV3网络用于花卉图像数据集的分类,对其中的激活函数进行改进.在通用Oxford flower-102数据集上的实验表明:该模型在花类图像分类任务中比传统方法和普通卷积神经网络分类准确率高,且比未改进的卷积神经网络准确率高,迁移过程准确率达到81.32%,微调过程准确率达到92.85%.  相似文献   

5.
以真实场景中拍摄的交通标志图像数据集GTSRB为研究对象,将卷积神经网络与支持向量机相结合,提出一种基于二级改进LeNet-5的交通标志识别算法。该算法首先根据识别系统的实时性要求,对原始LeNet-5结构进行改进;然后用裁剪、灰度化、图像增强和尺寸归一化等操作对原始图像进行预处理,得到32×32的感兴趣区域;接下来,利用数据集GTSRB训练出一个二级改进LeNet-5,其中第一级改进LeNet-5将感兴趣区域中包含的交通标志粗分为6类,第二级改进LeNet-5对粗分类结果进行细分类,识别出交通标志所属的最终类别。实验结果表明,基于二级改进LeNet-5交通标志识别算法因网络模型能够提取交通标志的多尺度特征,识别正确率可达91.76%。  相似文献   

6.
针对人工检测桥梁表面缺陷存在精度低、速度慢和漏检率高等问题,该文提出了基于深度卷积生成式对抗网络(deep convolutional generative adversarial networks,DCGAN)和改进YOLOv5s的桥梁表面缺陷检测识别模型.首先,通过DCGAN网络对自主采集的桥梁表面缺陷图像进行数据增强,建立每类缺陷样本数量较为均衡的数据集; 其次,在YOLOv5s模型基础上嵌入CBAM注意力机制模块,使模型将注意力集中于缺陷区域,从而提升图像分类的准确率; 最后,为验证所提方法的适用性,将包含4类桥梁表面缺陷的数据集进行训练与测试.实验结果表明:该文提出的模型在桥梁表面缺陷检测上的准确率为92%,相比其他深度学习模型具有更高的检测精度和鲁棒性.  相似文献   

7.
光学乐谱识别是音乐信息检索中一项重要技术,音符识别是乐谱识别及其关键的部分.针对目前乐谱图像音符识别精度低、步骤冗杂等问题,设计了基于深度学习的端到端音符识别模型.该模型利用深度卷积神经网络,以整张乐谱图像为输入,直接输出音符的时值和音高.在数据预处理上,通过解析Music XML文件获得模型训练所需的乐谱图像和对应的标签数据,标签数据是由音符音高、音符时值和音符坐标组成的向量,因此模型通过训练来学习标签向量将音符识别任务转化为检测、分类任务.之后添加噪声、随机裁剪等数据增强方法来增加数据的多样性,使得训练出的模型更加鲁棒;在模型设计上,基于darknet53基础网络和特征融合技术,设计端到端的目标检测模型来识别音符.用深度神经网络darknet53提取乐谱图像特征图,让该特征图上的音符有足够大的感受野,之后将神经网络上层特征图和该特征图进行拼接,完成特征融合使得音符有更明显的特征纹理,从而让模型能够检测到音符这类小物体.该模型采用多任务学习,同时学习音高、时值的分类任务和音符坐标的回归任务,提高了模型的泛化能力.最后在Muse Score生成的测试集上对该模型进行测试,音符识别精度高,可以达到0.96的时值准确率和0.98的音高准确率.  相似文献   

8.
为弥合抽象图像底层视觉特征与高层情感语义间的鸿沟,同时缓解抽象图像情感识别所固有的小样本缺陷,将两层迁移学习策略引入传统的卷积神经网络,提出一种基于两层迁移卷积神经网络的抽象图像情感识别模型.该模型利用深度特征的层次性,首先通过大规模通用图像数据集来学习提取普适的底层图像特征;然后利用抽象图像风格分类数据集来学习提取抽象图像的专有高层语义特征;最后采用抽象图像情感识别数据集来微调整个网络.MART数据集上的实验结果表明,与传统的抽象图像情感识别方法相比,所提出的模型能够有效地提高识别精度.  相似文献   

9.
为解决小样本沥青路面破损图片在分类识别中存在的识别精度差的问题,选择常见的5种路面破损类型,提出了一种基于VGG的浅层深度卷积神经网络模型的路面破损图像分类方法. 首先,将采集到的图像集进行预处理并自制成数据集. 其次,设置三种不同的批处理量尺寸和两种不同的网络层数作训练,选择最适合该网络模型的尺寸,得到浅层VGG模型. 将处理后的路面图片直接作为模型的输入,作模型的训练、验证及测试. 最后,将模型试验结果与支持向量机及目前主流的深度卷积神经网络模型的试验结果进行对比. 结果表明:浅层VGG模型在训练集、验证集及测试集的分类准确率接近,对路面破损图像的分类识别准确率都达到98%以上,表现出模型良好的识别能力;与支持向量机及目前主流的网络模型试验结果相比,浅层VGG网络模型训练耗时少且泛化能力更强,模型提取到的特征更丰富,可获得更加全局的信息. 可见,浅层VGG模型在对小规模图像的分类识别中具有显著优势,同时相比其他方法更具鲁棒性,结果更精确.  相似文献   

10.
为了更加精确地识别混凝土表观病害,首先收集了包含混凝土一般性病害、风化、露筋和裂缝四种表观病害的图片,利用图像处理技术对图像集进行了扩充;然后建立了深度残差网络模型,得到了混凝土四种表观病害的分类器;最后通过迁移学习对残差网络模型进行优化,得到最优分类结果.结果表明:该基于深度学习的混凝土表观病害分类器可以针对混凝土单个病害图像进行智能分类,经过迁移学习的优化,准确率达到了91.3%,对混凝土破损露筋病害的识别准确度达到了97.6%,可以满足实际工程中混凝土表观病害智能检测的需要.  相似文献   

11.
已有的光纤收卷检测方法的泛化能力和环境适应性均较差,无法应用于工业生产.提出基于深度学习的机器视觉方法对收卷过程中的收卷图像进行分类来解决光纤收卷问题.通过考虑光纤收卷时光纤间力的作用,建立了光纤收卷模型,提出了光纤收卷时排线机构的速度表达式.使用相机采集大量光纤收卷图片形成数据集,搭建并训练神经网络模型用于对收卷情况进行分类.通过实验验证,该方法对间隙状态的识别正确率在94.67%以上,叠线状态识别正确率为100%,检测速度高于实际生产绕线速度,是一种可以和控制系统相结合替代人工收卷并实现自动精密绕线的良好方法.  相似文献   

12.
由于水下目标检测面临着图像模糊、尺度多样化、复杂背景等问题,给水下目标检测应用带来很多挑战.本文提出了一种基于类加权YOLO网络的水下目标检测方法,主要思想是在深度网络YOLO的基础上,构造了类加权损失函数,来平衡样本难易程度以获得更好的效果,并引入了目标框自适应维度聚类方法,进一步提升了检测性能.实验结果表明,本文算法与传统的YOLO网络模型相比,在每幅图片包含近20个目标的密集目标检测任务中,能够将平均准确率从71.2%提升至74.1%,召回率由71.1%提升到78.3%.  相似文献   

13.
针对人脸情绪识别类内差异大,类间差异小的特点,结合学生人脸图像的线上课堂情绪识别的场景,提出多尺度空洞卷积模块提取不同空间尺度特征的稠密深度神经网络模型,实现自然场景下学生人脸图像识别.该模型主要由多尺度空洞卷积和DenseNet神经网络两个子网络组成,其中多尺度空洞卷积由不同空洞率的四分支网络提取不同尺度特征,空洞卷积减小特征图尺寸,减少DenseNet内存资源占用;最后在DenseNet网络中结合Adam优化器和中心损失函数.使用稠密网络的旁路连接,加强情绪特征传递和复用.研究结果表明:基于稠密深度神经网络的情绪识别网络模型能够有效提高情绪分类的准确率,模型对预处理后的FER2013+数据集识别准确率达到93.99%,可为线上教学反馈提供技术支持.  相似文献   

14.
基于粗糙集理论的目标特征选择方法   总被引:1,自引:0,他引:1  
基于粗糙集理论中的分辨矩阵提出一种新的特征选择方法.此方法的基本思想是:对目标分类最有效的特征应该能划分最多的不同类样本.将该选择方法用于人造数据和实际数据的特征选择中.结果表明:该方法能正确选择人造数据中的相关特征,且能大幅度降低实际数据的特征数目.使用该方法对水下目标的识别特征进行选择时,可将识别特征数目下降至原特征数目的20%左右,对特征选择后的数据进行分类时,正确率可提高约6个百分点.  相似文献   

15.
针对细粒度图像分类中数据分布具有小型、非均匀和不易察觉类间差异的特征,提出一种基于注意力机制的细粒度图像分类模型.首先通过引入双路通道注意力与残差网络融合对图像进行初步特征提取,然后应用多头自注意力机制,达到提取深度特征数据之间细粒度关系的目的,再结合交叉熵损失和中心损失设计损失函数度量模型的训练.实验结果表明,该模型在两个标准数据集102 Category Flower和CUB200-2011上的测试准确率分别达94.42%和89.43%,与其他主流分类模型相比分类效果更好.  相似文献   

16.
使用生成对抗网络(GAN)扩充宫颈癌病理图像的数据集以提高计算机辅助诊断的准确率.首先,使用GAN进行细胞质部分图像生成;其次,使用两次k-means聚类对生成图像进行筛选;最后,使用Inception-V3模型对数据集进行分类训练.结果表明,在测试集相同的情况下,该方法可以将总体分类准确率提升约2.5%,尤其对低分化宫颈癌病理图像有显著效果.通过GAN解决了组织病理学图像无方向性、内容复杂、前景目标规则性差等问题,证明了该方法的有效性及发展潜力.  相似文献   

17.
针对原有双流时空卷积网络模型中网络深度不足,从而导致人体行为识别结果偏低的问题,针对该网络模型进行改进,且融入Kinect骨骼序列数据.对于输入数据,通过Kinect相机对人体动作转化为骨骼序列;改进双流卷积网络模型是在原有的模型框架下,用RestNet-50网络结构替代原VGG-16网络结构,再对数据进行一系列处理.在HMDB-51和UCF-101两个公开数据集上进行模型的训练和验证,其识别结果分别为70.8%和91.4%,通过对比结果表明,本文提出的改进双流卷积网络融合Kinect骨骼数据能够有效提升人体行为识别的正确率.  相似文献   

18.
用支持向量机检测乳腺X线影像中的结构扭曲   总被引:1,自引:0,他引:1  
利用频域小波变换对乳腺X线影像中结构扭曲的图像进行小波分解,从得到的分解图像中计算了12个与纹理有关的特征参数.用支持向量机分类算法对样本集2组实验对象(乳腺结构扭曲、正常样本各19个)进行乳腺结构扭曲的识别分类;通过优化支持向量机参数条件,得到最好的分类结果.分类结果表明:本研究确定的12个纹理特征参数组合,用优化的支持向量机分类器检测和识别乳腺结构扭曲,分类正确率为92.1%、灵敏度89.5%和特异度94.7%.  相似文献   

19.
对宫颈的检查图像进行识别可以有效预防宫颈癌的发生,然而,正确分辨出患癌趋势的图像对人类来说是极难掌握的技术。使用深度学习方法对宫颈检查图像进行识别分类,以辅助人类专家做出诊断;首先对图像进行手动裁剪来增大信噪比,把原始图像进行格式转换来提高数据读取效率,并在图像输入模型之前进行随机变换以增大训练集;然后建立CNN模型,进行训练并调整参数;最后在测试集上分类准确率达到了89.1%,结果表明,使用深度学习辅助专家进行宫颈癌的早期诊断是可行的。  相似文献   

20.
为解决图像采集中噪声和复杂背景对图片的影响以及深度神经网络的高耗时问题,基于可能性聚类算法与卷积神经网络,提出一种道路交通标识识别算法.该方法运用了图像分割技术,并结合卷积神经网络模型对道路交通标识进行更准确的识别.首先,通过色彩增强、图像分割、特征提取、数据增强和归一化等批量预处理操作,形成一个完整的数据集;然后,结合Squeeze-and-Excitation思想和残差网络结构,充分训练出MRESE(My Residual-Squeeze and Excitation)卷积神经网络模型;最后,将优化的网络模型用于道路交通标志的识别.实验结果表明,该方法使训练时间缩短了5%左右,识别精度可达99.02%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号