首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 421 毫秒
1.
针对环视鱼眼图像中目标几何畸变大导致建模难的问题,提出一种基于可变形卷积网络的实例分割方法,主要是在Mask R-CNN框架的基础上引入可变形卷积和可变形RoI Pooling(候选区域池化)来提升网络对几何畸变的建模能力.针对深度神经网络训练数据缺乏、易过拟合的问题,提出了基于多任务学习的训练方法.首先将现有的大规模普通图像数据集转换为鱼眼数据集来弥补训练数据不足的问题,然后采用多任务学习的训练方法将转换的图像和真实图像放在同一个框架中训练以提高网络的泛化能力.用该方法在真实的环视鱼眼图像上做测试,结果表明:相对于原始Mask R-CNN的方法平均精度提升了3.1%,证明了该方法在真实交通环境中的有效性.  相似文献   

2.
基于改进卷积神经网络的苹果叶部病害识别   总被引:2,自引:0,他引:2  
针对苹果病害叶片图像病斑区域较小导致的传统卷积神经网络不能准确快速识别的问题,提出基于改进卷积神经网络的苹果叶部病害识别的网络模型.首先,将VGG16网络模型从ImageNet数据集上学习到的先验知识迁移到苹果病害叶片数据集上;然后,在瓶颈层后采用选择性核(selective kernel,简称SK)卷积模块;最后,使用全局平均池化代替全连接层.实验结果表明:与其他传统网络模型相比,该模型能更准确快速捕获苹果病害叶片上微小的病斑.  相似文献   

3.
针对单幅图像超分辨率重建问题(SISR),提出了一种新的基于Dirac残差的超分辨率重建算法.算法使用全局跳跃重建层来直接利用输入LR图像的低频特征,通过多个dirac残差块来自适应学习输入LR图像的高频特征,通过亚像素卷积进行图像重建.算法通过权重参数化来改进残差层,同时使用输入图像的卷积特征与残差网络学习特征结合进行重建.实验采用Adam优化器进行网络训练.使用L1范数作为损失函数.在PSNR、SSIM和视觉效果与其他先进算法进行对比,实验结果表明,在常用测试集上与其他深度学习算法相比有较大提高.  相似文献   

4.
为了有效解决大面积语义信息缺失、孔洞区域大小及形状不规则、图像背景复杂时修复结果出现边缘模糊、伪影或修复失真等缺陷,提出了一种基于混合空洞卷积网络的多鉴别器图像修复算法.首先,将待修复图像输入一个基于混合空洞卷积层的模糊卷积网络,以重构损失为标准,进行粗修复.然后,将粗修复结果输入双平行卷积网络,该网络包含混合空洞卷积(HDC)层的卷积路径及一个与之平行的感知层卷积路径,两个平行路径的输出经过解码和反卷积后,送入鉴别器进行判别优化.最后,在网络的优化过程中,利用全局鉴别器、局部鉴别器和中心鉴别器增强修复图像的整体及局部语义一致性和细节特征.在国际公认的人脸数据集CelebA和风景数据集Places2上,对提出算法进行训练和测试,实验结果表明:提出方法在修复背景复杂和各种大小及形状的孔洞时,增强了图像细节的修复精度,有效避免了修复失真,在修复的视觉效果、峰值信噪比、结构相似度和平均误差方面,优于对比的4种经典修复算法.  相似文献   

5.
传统的超分辨率卷积神经网络难以获得丰富的细节和边缘信息。提出了一种多映射残差卷积神经网络(MMRCNN)来解决这些问题。具体来说,MMRCNN直接使用低分辨率图像作为网络的初始输入,然后使用卷积层提取特征。其次,通过残差学习构建多映射网络,添加批量归一化层优化网络,使聚合高分辨率图像时所需要的特征信息能够变得极为丰富。最后,使用反卷积层来完成图像上采样,输出高分辨率图像,因此不需要预处理,就能够直接完成低分辨率图像与高分辨率图像之间端到端的映射关系。在不同模型的基准数据集上的实验表明,MMRCNN在峰值信噪比、结构相似性和视觉效果方面均有所提升。  相似文献   

6.
针对传统的工件识别流程是由人工根据工件的特点设计需要提取的特征,整个过程具有耗时高、成本大、通用性较差和识别准确率不高等问题,改进了经典的卷积神经网络模型AlexNet和LeNet-5,通过将AlexNet网络的输入图像尺寸缩小到120×120,用BN层代替LRN层,减少两层卷积和全连接层,用3×3的卷积核代替第一层卷积层11×11的卷积核;将LeNet-5的输入图像尺寸提升至60×60,用ReLU取代原始Sigmoid激活函数,使用多个小卷积核代替大卷积核;分别使用改进前后的网络模型对工件数据集进行训练、测试.结果表明,改进后的两种网络模型,在测试集上分别达到94.31%和92.75%的平均识别准确率,平均识别时间分别为0.271s和0.321 s,满足生产需求.  相似文献   

7.
针对传统Faster-RCNN方法中候选区域生成网络(RPN)模块在进行目标检测时对目标特征提取不够充分的问题,提出一种基于改进RPN的Faster-RCNN网络SAR图像车辆目标检测方法.首先基于VGG-16网络提取出图片的多层特征,然后利用卷积核对最深的3个特征层作进一步的特征提取和正则化处理,最后对处理后的3个特征层进行信息融合.利用MSTAR数据集中车辆目标SAR图像和自然背景SAR图像,通过图像分割和贴图的方式制作了SAR场景数据集,对所改进网络进行训练和测试.实验结果表明,在SAR图像车辆目标检测中,与传统RPN相比,改进RPN收敛速度更快,不仅将检测结果的查准率从97.7%提高到了99.7%,虚警率明显降低,而且泛化性能更强,针对训练范围以外的目标,能将查准率由98.0%提高到99.0%.  相似文献   

8.
为有效解决修复大面积不规则洞孔出现的纹理模糊、结构失真等问题,提出了基于改进知识一致性注意力机制图像修复算法.首先使用部分卷积对待修复图像进行处理,随后将处理的特征图送入包含混合空洞卷积(HDC)与改进知识一致性注意力机制(KCA)的特征推理模块.推理完成后将输出特征图输入至部分卷积与特征推理模块进行循环推理,逐步提升网络的修复能力,循环完成后对输出图像进行特征合并.最后将合并特征图进行去残差瓶颈层以增强修复图像的结构完整性.提出模型使用组归一化方式(GN)加快损失函数收敛速度.在公开数据集上验证提出算法的性能,主客观实验结果表明:提出算法能有效修复大面积连续不规则区域,能够较好地避免修复失真,其峰值信噪比和结构相似度及运算速度优于对比算法.  相似文献   

9.
为了实现井壁缺陷的自动检测,提出去除井壁图像噪声的卷积神经网络(CNN)模型(ELU-CNN)。该模型为深28层的全卷积网络模型,由5个特征提取模块(FEM)和跳跃连接组成;跳跃连接将第一卷积层的输出特征与每一个FEM的输出特征串联融合,保证图像特征的充分提取;使用残差学习来缓解梯度消失并提高收敛速度,保证训练后的去噪模型学习到的非线性映射是图像噪声;选用ELU作为激活函数,它具有软饱和性且输出均值接近于零,能增强模型对输入噪声的鲁棒性并加速模型收敛。在标准测试集BSD68、set12及实际井壁图像上,验证ELU-CNN模型的去噪性能并和先进方法作比较,实验结果表明:与FFDNet模型相比,ELU-CNN模型的平均峰值信噪比,在含噪声浓度σ为(15,25,35,50,75)的BSD68、set12测试集上分别提高了(0.17,0.11,0.08,0.05,0.03) dB、(0.18,0.16,0.08,0.06,0.07) dB。在去除井壁图像盲噪声时,ELU-CNN模型能更好地保留缺陷的纹理信息。  相似文献   

10.
针对目标图像利用导向滤波算法进行图像抠图时参数需要根据不同图像进行人为设定的问题,提出了一种利用隐藏的支持向量机LSVM(latent support vector machine)自动设定参数的潜在半径优化的数字图像抠图算法.该方法首先是应用LSVM潜在性的思想,利用已知数据库模板训练输入目标图像的样本集,再利用样本集将导向图像和二值图像以不同半径进行分块并进行判定,确定半径值,从而能够自动产生合理参数.最后利用导向滤波器对图像进行抠图,从而优化抠图算法,最终实现抠图算法的智能化和灵活化.  相似文献   

11.
针对传统目标轮廓识别算法对图像目标轮廓识别精度较低、 效果较差的问题, 提出一种基于深度学习的二值图像目标轮廓识别算法. 首先, 选取深度学习算法中的深度卷积网络算法识别二值图像目标轮廓, 将二值图像划分为不重叠的、 大小相同的子块图像输入深度卷积网络第一层; 其次, 卷积网络中的滤波器(卷积核)采用传统神经网络算法优化的代价函数对输入子块图像实施卷积滤波, 并将卷积滤波后下采样图像发送至第二层, 第二层经过相同处理后将结果输入第三层, 第三层输出图像即为该子块目标轮廓识别结果; 最后, 所有子块识别结束后在输出层通过全连接方法将其聚类, 并输出最终二值图像目标轮廓识别结果. 实验结果表明, 该算法识别15幅二值图像目标轮廓的识别精度平均为98.75%, 信噪比平均为2.42, 识别效果较优.  相似文献   

12.
针对传统目标轮廓识别算法对图像目标轮廓识别精度较低、 效果较差的问题, 提出一种基于深度学习的二值图像目标轮廓识别算法. 首先, 选取深度学习算法中的深度卷积网络算法识别二值图像目标轮廓, 将二值图像划分为不重叠的、 大小相同的子块图像输入深度卷积网络第一层; 其次, 卷积网络中的滤波器(卷积核)采用传统神经网络算法优化的代价函数对输入子块图像实施卷积滤波, 并将卷积滤波后下采样图像发送至第二层, 第二层经过相同处理后将结果输入第三层, 第三层输出图像即为该子块目标轮廓识别结果; 最后, 所有子块识别结束后在输出层通过全连接方法将其聚类, 并输出最终二值图像目标轮廓识别结果. 实验结果表明, 该算法识别15幅二值图像目标轮廓的识别精度平均为98.75%, 信噪比平均为2.42, 识别效果较优.  相似文献   

13.
张膑  张运杰  白明明 《科学技术与工程》2021,21(26):11253-11262
卷积稀疏编码网络模型(convolutional sparse coding network, CSCNet)虽然能够有效解决去噪问题,但是该算法并没有考虑到迭代求解近似编码向量过程中卷积层、反卷积层之间的叠加会改变原始数据分布方式。为解决该问题,借鉴深度学习领域常用方法对原始模型进行改进。讨论了在CSCNet模型中加入以及不加入批处理标准化(batch normalization, BN)、非线性激活函数、残差学习(residual learning, RL)对模型图像去噪效果的影响,然后再此基础上分别设计了两个不同的网络模型结构。为使输入数据分布方式不因模型层与层之间传播而改变,模型1是在原始CSCNet网络的每一层加入非线性激活函数以及BN层。CSCNet模型中所训练的卷积核都是同样大小,为增加图像特征的多样性,模型2在模型1基础之上加入了简单残差块结构改变了原始模型参数传播方式,并将其通过Shortcut Connections结构与原始输入联结起来。从实验结果可以看出,在不降低原始模型计算效率的前提下,使用文中设计的模型所得去噪后的结果相比原卷积稀疏编码网络略有提升。  相似文献   

14.
提出一种基于图像抠图与copy-paste结合的数据增强方法(matting-paste),采用图像抠图法获取单个垃圾实例的准确轮廓,并对单个实例进行旋转和亮度变换.根据物体轮廓信息,把实例粘贴到背景图上,无需额外的人工标注即可生成新的带有标注的数据,从而提高数据集的多样性和复杂性.结果表明:数据集扩充后的mask比数据集扩充前的识别精度提高了0.039,matting-paste能在已有数据集上有效地扩充数据,进一步提高模型的识别精度.  相似文献   

15.
为解决大学校园的垃圾回收分类问题, 提出了一种基于卷积神经网络和归一化技术的垃圾图像分类方法, 不需要对输入的图像进行复杂的处理, 网络模型即可根据算法提取图像特征, 通过加入群组归一化(GroupNormalization)和网络模型各层之间的协作, 克服传统分类算法的缺点, 实现对垃圾图像的分类。 实验表明,该识别方法具有较高准确率, 可以较好识别不可回收及可回收垃圾。  相似文献   

16.
为解决低光照条件下已有图像分割模型性能降低的问题,提出了一个基于RGB和深度图特征融合网络的MDF-ANet图像分割方法.为了对原始数据进行充分的特征学习,采用两路特征提取网络分别提取RGB和深度图特征;设计了一个特征融合模块,分别将两路特征提取网络对应尺度下的输出特征图通过融合模块进行融合,并作为RGB网络下一层的输入,通过不受光照条件影响的深度图来辅助RGB的特征提取;将各个尺度输出的特征图输入多尺度上采样融合模块,进行不同感受野间的信息互补,再上采样至原始输入图像大小,得到分割图像.在Cityscapes及其转化后的低光照图像上进行了一系列实验,在其验证集上取得了62.44%的均交并比(mean intersection over union,mIOU),相比只使用RGB输入的模型,性能提高了9.1%,达到了在低光照条件下提高图像分割性能的目的.   相似文献   

17.
针对高压管汇损伤需要提高检测效率和准确率的问题,提出一种基于多尺度一维卷积神经网络(multi-scale one-dimensional convolutional neural network, MS-1DCNN)的弯管冲蚀损伤智能检测新方法,即用多尺度卷积层代替传统的单一尺度卷积层。在MS-1DCNN模型中,把通过模拟实验所得弯管冲蚀损伤原始时域信号作为多尺度一维卷积神经网络的输入,这样能解决传统方法依赖人工提取特征和专家知识的问题;然后,通过多尺度卷积层和池化层的交替连接对输入信号进行特征提取;最后,经由输出层输出弯管冲蚀损伤分类结果。模型试验结果表明:基于MS-1DCNN弯管冲蚀损伤检测方法可以有效检测出弯管冲蚀损伤,且平均检测准确率达到99.18%。研究可为高压管汇冲蚀损伤智能检测提供一种新思路。  相似文献   

18.
利用超声图像获取胎儿的各项生物指标,对诊断胎儿发育过程中的异常有重要作用.当前主要依靠医生对超声图像的手动测量来确定这些指标.然而,医师手动测量不仅具有主观性,而且在重复作业下效率低下.针对以上问题,提出一种基于DenseASPP模型的超声图像分割改进算法,以辅助医生完成对胎儿各项生物指标的测量.在DenseASPP模型中,首先利用普通卷积预先提取原始图像的特征得到预特征图,再以扩张卷积及金字塔池化结构为基础将前层所有扩张卷积的输出特征图与预特征图拼接在一起传输到下一层扩张卷积以获得更大感受野的多尺度特征图,最终将所有特征合并后通过Attention机制获得相关联的特征,再利用sigmoid函数获取分割结果.分别使用胎儿的头臀径,头围,腹围三个部位的超声图像作为数据集对本文提出的DenseASPP方法进行了评估.实验结果表明,DenseASPP方法优于其他当前常见的分割方法,取得了更好的性能.  相似文献   

19.
针对传统LeNet-5卷积神经网络用于交通标志等多种类识别任务中,存在识别正确率低、网络容易过拟合以及梯度消失等问题进行改进。引入Inception卷积模块组来提取目标丰富的特征,同时增加网络的深度。引入BN (batch normalization)层对输入批量样本进行规范化处理;同时改用性能更好的Relu激活函数,并使用全局池化层代替全连接层,合理改变卷积核的大小和数目。研究结果表明,改进LeNet-5网络能够有效解决过拟合和梯度消失等问题,具有较好的鲁棒性;网络识别率达到98. 5%以上,相比CNN (convolutional neural network)+SVM (support vector machine)提高了约5%,比传统的LeNet-5网络提高了3%。可见,改进后的LeNet-5网络图像识别的准确率得到显著提高。  相似文献   

20.
图像语义分割和实例分割是计算机视觉领域基础挑战性工作,图像全景分割统一解决两者的任务,其核心为图像中每一个像素分配相应的类别标签以及为类别中每一个实例分配ID。经典UPSNet已经取得了较好的全景分割效果,但是使用了一种单向信息流动的特征金字塔网络,将存在实例分支的目标实例定位不够准确的问题,并且语义分支的语义分割能力还需进一步提升。本文通过考虑两个任务的差异性以及共性,重新设计特征金字塔网络结构以提取出更适合全景分割的特征图,从而提高了实例分支的AP评价指标。在语义分支中引入了克罗内克卷积,与可变形卷积进行融合使得特征图的感受野更大并且捕获了局部信息,使语义分支的mIoU评价指标得到了提高。此模型在Cityscapes数据集上进行实验,验证了所设计的每个模块及整个模型的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号