首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对眼底图像训练数据集少的问题,该文采用了无监督的主成分分析网络(principal components analysis networks, PCANet)和有监督的支持向量机(support vector mochine, SVM)相结合的算法,通过对彩色眼底图像视网膜渗出物特征的提取,检测出含渗出的糖尿病性视网膜病变眼底图像和正常眼底图像.在对眼底图像进行渗出物特征提取之前,为了减少对渗出物特征提取的干扰,首先对眼底图像进行图像预处理,包括去除冗余背景、通道分离、直方图均衡化、血管去除和视盘去除.无监督的PCANet不需要进行标签训练,与SVM结合,既节约了训练时间,又在训练数据集较小的情况下实现眼底图像的准确分类.实验结果表明:PCANet和SVM相结合的模型在准确性、灵敏度和特异值3个方面与相关方法比较都具有一定的提升.  相似文献   

2.
CCCV2017发布遥感图像飞机数据集,用于评测飞机检测算法.针对该遥感图像数据集中的飞机朝向不确定、图像覆盖范围广、图像背景复杂度高,导致飞机检测难度大、检测算法准确率和算法泛化能力低等问题,提出了基于Faster-RCNN的飞机检测改进算法.首先,通过对图像采用翻转以及角度旋转等方式对数据集进行合理的扩增;然后,在扩增后的数据集上,使用深度残差网络对图像进行特征提取,针对数据集中飞机目标的长宽比特点优化区域建议网络;同时,为了防止训练集中正负样本不均衡,采用在线困难样本挖掘方法对数据进行训练.在CCCV2017数据集上评估表明,改进后的Faster-RCNN算法极大提高了初始的Faster-RCNN算法性能,在测试集上m AP达到了89.93%.在NWPUVHR-10、NWPU-RESISC45、UCAS-AOD遥感图像飞机数据集测试表明,该改进模型同样具有良好的性能,从而验证了该模型具有良好的鲁棒性和泛化能力.  相似文献   

3.
针对病变视网膜血管结构的计算机辅助诊断问题,提出了一种多尺度卷积核U-Net模型的视网膜血管分割方法.在U-Net模型基础上设计了融合Inception模块和最大索引值上采样方法的多尺度卷积神经网络结构.在网络训练阶段,采取旋转、镜像等操作进行数据集扩充,运用CLAHE算法进行图像预处理;训练后得到的双通道特征图,进行Softmax归一化;最后通过改进的代价损失函数对归一化结果迭代优化,得到完整的视网膜血管分割模型.实验结果表明,所提方法在DRIVE数据集上分割的准确率达到0.9694,灵敏性达到0.7762,特异性达到0.9835,比U-Net模型具有更优的分割效果和泛化能力,与其他现存方法相比具有一定的竞争力.  相似文献   

4.
SSD通常被认为适合于求解小目标图像检测问题,但在特征表征和检测效率两方面还存在改进空间.提出一种聚类残差SSD模型,一方面将原始SSD模型中的VGG16基础网络替换为更深的ResNet50残差网络,以改善特征表征能力.另一方面采用K-均值聚类算法取代盲目搜索机制,确定SSD中默认窗口的大小,以改善检测效率.针对德国交通标志检测数据集,模型获得了97.1%mAP和每幅图像0.07 s的检测速度.针对中国交通标志数据集,模型获得89.7%mAP和每幅图像0.08 s的检测速度.与原始SSD模型比较,本文所提模型的检测性能得到改善.  相似文献   

5.
为解决现有水下图像增强方法对水下图像特征提取能力不足而导致的模型通用性不足的问题,本文提出一种改进U-Net网络用于水下图像增强。首先,提出用生成对抗网络拟合一个新的水下退化模型,再用无水深度图像经过生成对抗网络合成对应的水下图像,从而建立水下数据集。然后,提出一种改进的U-Net网络充分提取水下图像特征,自适应地学习水下图像到无水图像的映射关系。在3种不同类型的数据集上对本文所提出的算法与其他具有代表性的增强方法进行对比验证,结果表明,本文提出的算法能够对不同场景下的水下图像进行颜色校正,提高了图像的清晰度和对比度。  相似文献   

6.
为了对灾难场景图像进行快速分析和识别,提出了一种基于多分辨率卷积神经网络和残差注意力机制(attention module)相结合的图像分类模型.首先,对灾难场景数据集进行预处理,在相同类型的条件下将其随机划分为训练集和测试集.基于改进的卷积神经网络(convolutional neural network,CNN),提取训练集的图像特征.使用训练集图片的特征进行训练,并且在测试集图片上实现分类测试.选取DenseNet、Xception和MobileNetV2三种模型,以灾难场景数据集(Disaster_Data_Scenes)为数据集进行实验验证.结果表明:改进的Xception和MobileNetV2网络在灾难场景数据集上进行的图像分类实验测试,比原网络精度分别提升了4.56%和3.04%.其中改进的DenseNet网络比原网络模型精度分别提升9.13%、17.88%和10.27%.可见改进的卷积神经网络模型的分类精度得到有效提高.  相似文献   

7.
针对基于传统机器学习方法设计的DR胸片肺结核检测器存在着泛化能力不强,实际检测精度低等问题,提出了一种基于Focal Loss的深度学习检测方法Tuberculosis Neural Net(TBNN).医学图像的特殊性,存在带标注的数据量小导致无法充分训练深层网络模型等问题.该方法利用肺炎和肺结核同为呼吸道感染疾病且在DR胸片上有相似表征的特点,基于迁移学习原理训练特征提取子网络,减少肺结核胸片样本不足对模型训练造成的影响.首先在大型的肺炎胸片数据集上训练特征提取网络,以获取DR图像中丰富的深层图像语义信息,然后使用样本较少的肺结核数据集微调网络参数,并将多层卷积的输出作为TBNN分类子网络的输入,得到基于DR胸片的肺结核病灶检测模型.实验结果表明,该方法生成的检测模型在分类精度和性能上均优于基于传统机器学习的肺结核检测器.在同等训练数据量和训练周期下,模型性能高于其他采用传统数据增强方法的深层网络肺结核检测算法,且能标识病灶区域,准度上有不低于放射科阅片医生的表现.  相似文献   

8.
糖尿病视网膜病变(Diabetic Retinopathy,DR)是一种致盲率很高的眼科疾病。不同病变等级的视网膜图像之间差异小且病灶点分布无规律。针对现有深度模型对DR中的相似病灶点识别率低,严重影响模型分类精度的问题,本研究以深度学习为基础,构建新的模型架构进行训练,提出一种集成MobileNetV2和EfficientNetB0深度模型的注意力网络:ME-ANet。模型集成分为头部和主干两部分,将深度模型的浅层部分融合构成网络的头部,训练时采用迁移学习的策略对网络模型参数进行初始化,减少训练中的过拟合问题。主干部分利用上述两种模型的核心结构,设计3个阶段集成模块进行特征提取。同时设计全局注意力机制(Global Attention Mechanism,GAM)并分别嵌入到3个阶段的集成模块中。模型的改进加速了网络的收敛速度,该网络模型实现了对图像浅层信息的特征融合提取,减少了微病灶特征信息在训练过程中的卷积丢失问题,模型的分类精度进一步得到改善。通过模型集成构建特征提取主干网络,提高了模型对低级特征信息的学习,注意力机制抑制非病变特征信息,强化典型病灶特征学习,从而实现细粒度分类,进一步提升了模型的分类性能。  相似文献   

9.
针对SAR图像中舰船目标的检测问题,单纯基于深度学习的图像处理技术难以达到检测准确性和实时性要求.SAR图像中目标尺寸较小,且易受噪声、光斑干扰,传统方法难以提取精细特征并克服复杂条件下的背景干扰.针对以上问题,设计基于YOLOv3检测框架的端到端检测模型,借鉴了残差模块结构来避免网络退化问题.同时结合深层与浅层的不同尺寸特征图检测,使用目标基础特征提取网络参数来避免重复训练初始化过程.针对SAR图像中海上舰船成像小目标的特点改进优化了神经网络结构,实现SAR海面广域舰船目标识别分类算法,并对检测模型进行轻量化压缩处理.构建SAR图像舰船目标数据集并进行了多次目标检测识别分类实验,体现了提出的检测方法在复杂场景下有可靠的抗干扰能力和准确的目标检测识别性能.  相似文献   

10.
针对新型冠状病毒感染胸部 X-ray 图像分类任务数据集样本过少,现有的两阶段分类器和三阶段分类器模型对高纬度的图像特征提取效果差,模型训练慢等问题,提出一种基于 ConvNeXt 卷积神经网络改进的分类任务算法 ConvNeXt-AT。 ConvNeXt-AT 分类模型首先通过在 ConvNeXt Block 层添加混合域注意力机制 CBAM 来提高图像特征提取能力,不仅考虑了通道间的信息交互能力还考虑到了空间域上像素间的联系,得到 ConvNeXt-AT 模型;然后针对 X-ray 图片常见的泊松噪声使用全变差正则化方法对数据集进行降噪处理;最后在 COVID-19 公开的大型数据集共 21165 张图片进行对比实验。 实验结果表明,在训练数据集充分的情况下,改进的 ConvNeXt-AT 模型相较于常用分类模型 ResNet-50、MobileNet、EfficientNet 以及原 ConvNeXt-T 在准确率上分别提升了 2%、2. 7%、2. 1%、1. 9%。 最后通过 Grad-CAM 显示类激活图的图像可视化方法证明改进方法是可行的,模型具有很好的鲁棒性。  相似文献   

11.
针对Faster-RCNN算法在遥感图像当中对小目标的漏检、检测精度不高等问题作出改进.用特征提取能力更强的ResNet50网络替换VGG16;同时为了加强对遥感小目标信息的提取,引入特征金字塔,添加多尺度扩张卷积模块来增强特征金字塔的上下文特征,扩充小目标信息,使用通道注意力机制来减少特征融合过程中带来的信息混淆,提高模型对遥感小目标的检测效果.实验表明,所改进的方法在HRRSD遥感数据集达到86.7%的检测精度,较改进前提升了5.2%,同时检测效果也优于当前的一些主流检测模型,证明了改进后模型的有效性.  相似文献   

12.
针对小样本间的细粒度分类中同种样本间不同个体的差异性不明显,导致特征难以提取的问题,设计了使用自监督的抠图式度量学习图像分类建模训练方法,在不增加数据集人工标注成本的基础上提高分类精度.首先,将数据集进行抠图处理,扩大检测目标在图像中的占比,突出样本特征.其次,通过比较网络结构模型及距离度量函数,择优对模型进行改进.最后,采用孪生网络的思想将样本集和验证集输入特征提取器中通过度量函数的计算得到两者相似度.选用的样本集为公开数据集CUB_200_2011和Standford Dogs Dataset,实验结果显示,提出的方法在性能和精度上得到了较好提升.  相似文献   

13.
地铁车辆车侧下人工巡检存在漏检、劳动强度大、效率低等问题,本文提出一种基于改进Faster-RCNN算法的地铁车辆车侧下结构检测识别方法,分别采用MobileNetV2、ResNet-101+FPN和DarkNet53+FPN三种特征提取网络替换原Faster-RCNN的特征提取网络VGG16,再通过5 000张地铁车辆车侧下结构的图像对更换特征提取网络的Faster-RCNN进行训练以及检测验证.实验结果表明,以DarkNet53+FPN为特征提取网络的Faster-RCNN模型比其余两种模型检测效果好,模型平均精确度AP达到96.7%,均值平均精度mAP达到92.7%,检测速度可达20.5 fps.改进算法成功将巡检由线下改为了线上,地铁车辆车侧下各结构的检测识别都取得很好的效果.  相似文献   

14.
针对现有算法在行人目标检测中存在精度低、速度慢、算法鲁棒性有限的问题,提出了一种基于深度神经网络目标检测算法YOLOX-L改进的行人目标检测算法YOLOX-H.使用改进型的主干特征提取网络HarDNet85替换原有的CSPDarkNet53,新的主干特征提取网络相较于原有的网络具有更强的特征提取能力以及更快的速度,同时提升了网络检测较大目标的能力.在HarDNet85卷积神经网络中引入了Softplus激活函数提升算法的检测精度,构建了CityPersons、PRW、ETHZ和MOT17多场景的联合数据集,以提升网络对于行人目标检测的鲁棒性.在联合数据集上的实验表明:YOLOX-H相比于YOLOX-L,每秒检测帧数(FPS)提高了32.95%,检测精度提高了3.1%,大目标检测精度提高了6.9%.  相似文献   

15.
针对目前SAR(Synthetic Aperture Radar)图像中样本人工标记成本高、传统算法分类识别较低的情况,提出一种基于改进半监督阶梯网络(Semi-supervised Ladder Network,SSLN)的SAR图像分类识别方法 .首先在原SSLN模型的解码器网络中使用卷积神经网络代替全连接层,对编码器输出的每层数据进行全局深度特征提取,这样做有利于图像降噪,实现对输出数据的重构.其次,为解决SAR图像各类数据集分布不均衡的问题,同时提高网络的泛化性能,对阶梯网络训练层中各类别损失函数的权重进行优化,根据各类别样本数所占总样本数的比重,对少样本类别损失函数调高权重,对多样本类别损失函数调低权重.在公开数据集MSTAR(Moving and Stationary Target Automatic Recognition)上的实验表明,改进后的半监督阶梯网络分类的识别准确度明显优于SSLN算法,且具有更好的泛化性.  相似文献   

16.
针对传统卷积神经网络层级较为浅,对物体识别精确度较低的原因,利用改进的深层卷积网络VGG16模型检测视频运动目标.首先,预处理过程中对数据集进行剪裁和旋转操作,补充数据集数量,以解决前期图像资源不足等问题;其次,在PASCAL VOC数据集上先预训练模型,接着加载自定义视频数据集对预训练模型进行第二次训练.实验结果表明,该网络模型能很好用于视频目标识别,提高了检测精确度,有效减少网络参数计算量,降低硬件内存资源消耗,具有较强的鲁棒性.  相似文献   

17.
针对传统图像处理算法不能对存在过饱和像素和随机高强度噪声影响的铁路桥梁裂缝图像有效分类的问题,设计了一种基于改进Faster R-CNN+ZF模型的铁路桥梁裂缝自动分类方法.首先将原始图像集进行数据增强后,参照Pascal Voc数据集格式自制训练所需数据集;然后在Faster R-CNN网络模型前添加一层Prewitt算子锐化卷积层提升模型特征提取能力;最后重置ZF模型中相关卷积核的尺度、优化模型超参数和学习率,使模型的鲁棒性和高实时性得到有效保障.该方法在实际采集的49 124幅铁路桥梁裂缝图像数据集中进行测试.结果表明:新的算法能实现所有铁路桥梁裂缝类型的分类,有效裂缝识别率达93.7%以上,明显优于投影法和支持向量机法,具有很强的工程应用价值.  相似文献   

18.
作为深度学习的一种有效算法,深度卷积网络已成功应用在处理图像、视频和音频等领域.通过建立一卷积神经网络模型并应用于网络入侵检测,选取的卷积核与数据进行卷积操作提取特征的局部相关性从而提高特征提取的准确度.采集到的网络数据通过多层"卷积层-下采样层"的处理对网络中正常行为和异常行为的特征进行深度刻画,最后通过多层感知机进行正确分类.KDD 99数据集上的实验表明,文中提出的卷积神经网络模型与经典BP神经网络、SVM算法等相比,有效提高了入侵检测识别的分类准确性.   相似文献   

19.
周奥  杨岗  闫磊  张东兴 《科学技术与工程》2022,22(33):14801-14808
虹膜定位是虹膜识别系统中不可或缺的环节,针对传统的虹膜定位方法对镜面反射、眨眼等复杂环境下质量差的虹膜图像定位准确率低、计算复杂度高和鲁棒性差等问题,提出了一种基于改进YOLOv3模型的虹膜快速定位方法。针对眼周图像中虹膜内、外圆尺寸变化不大,将YOLOv3网络的多尺度结构改进为双尺度检测;引入了轻量级网络Mobilev3中bneck块来改进特征提取网络,减小模型复杂度;利用K-means++算法对虹膜数据集进行类聚,获得更优的锚点框;模型边框损失函数采用LossGIoU改进原均方差(mean squared error, MSE)损失函数;利用虹膜特有几何特征,将模型矩形预测框更改为圆形预测框。在CASIA-IrisV4数据集验证表明,改进模型定位准确率为96.32%,平均精度均值(mean average precision, mAP)为99.37%,检测速度为49.4帧/s,模型参数减少到4.13×106。结果表明改进后的模型较小,并且能够快速精准对虹膜区域定位,具有较高鲁棒性,能够满足虹膜实时定位的场景。  相似文献   

20.
基于卷积神经网络的小目标交通标志检测算法   总被引:1,自引:0,他引:1  
PVANet(performance vs accuracy network)卷积神经网络用于小目标检测的检测能力较弱.针对这一瓶颈问题,采用对PVANet网络的浅层特征提取层、深层特征提取层和HyperNet层(多层特征信息融合层)进行改进的措施,提出了一种适用于小目标物体检测的改进PVANet卷积神经网络模型,并在TT100K(Tsinghua-Tencent 100K)数据集上进行了交通标志检测算法验证实验.结果表明,所构建的卷积神经网络具有优秀的小目标物体检测能力,相应的交通标志检测算法可以实现较高的准确率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号