期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

《南京师大学报(自然科学版)》2018,(4)

CCCV2017发布遥感图像飞机数据集,用于评测飞机检测算法.针对该遥感图像数据集中的飞机朝向不确定、图像覆盖范围广、图像背景复杂度高,导致飞机检测难度大、检测算法准确率和算法泛化能力低等问题,提出了基于Faster-RCNN的飞机检测改进算法.首先,通过对图像采用翻转以及角度旋转等方式对数据集进行合理的扩增;然后,在扩增后的数据集上,使用深度残差网络对图像进行特征提取,针对数据集中飞机目标的长宽比特点优化区域建议网络;同时,为了防止训练集中正负样本不均衡,采用在线困难样本挖掘方法对数据进行训练.在CCCV2017数据集上评估表明,改进后的Faster-RCNN算法极大提高了初始的Faster-RCNN算法性能,在测试集上m AP达到了89.93%.在NWPUVHR-10、NWPU-RESISC45、UCAS-AOD遥感图像飞机数据集测试表明,该改进模型同样具有良好的性能,从而验证了该模型具有良好的鲁棒性和泛化能力. 相似文献

2.

面向不均衡小样本训练集的改进Boosting算法

程有龙庄连生李斌庄镇泉《中国科学技术大学学报》2010,40(2)

传统的Boosting算法训练出的分类器常会出现过拟合和向多数类偏移.为此,提出一种基于自适应样本注入和特征置换的Boosting学习算法,通过在训练过程中加入人工合成样本,逐渐平衡训练集,并通过合成的样本对分类器学习进行扰动,使分类器选择更多有效的特征,提高了分类器的泛化能力.最后,在两类和多类图片分类问题上对该算法的有效性进行了考察,实验结果表明,该算法能够在样本数很少,且正负样本数量极不均衡的情况下,有效提高booting算法的泛化能力. 相似文献

3.

深度自编码与改进损失函数在极端不均衡故障诊断中的应用

段敏霞刘鑫董增寿《科学技术与工程》2021,21(11):4432-4438

在实际应用中,滚动轴承大多时候都是在正常状态下工作,因此收集到的故障数据较少,这就会产生数据不均衡的问题.这种数据不均衡问题极大地影响着模型的拟合和泛化能力,导致模型产生过拟合情况,而往往忽视对小类别样本的学习.尤其当故障样本数极少时,此问题更突出.针对这个问题,提出一种基于改进交叉熵损失函数的深度自编码器的诊断模型,首先提取振动数据的小波包能量,其次将小波包能量输入到深度自编码器中,最后通过SoftMax分类器得到诊断结果.改进的加权损失函数可以根据各类别样本的数量调整权重系数,样本数量越少,系数越大,使得模型在训练时更专注于数量较少的样本.通过在凯斯西储大学及西安交通大学的轴承数据集上的两个实验表明,加权损失函数可以提高极端不均衡数据的诊断精度. 相似文献

4.

不均衡数据分类算法的综述 总被引：2，自引：1，他引：2

陶新民郝思媛张冬雪徐鹏《重庆邮电大学学报(自然科学版)》2013,25(1):101-110

传统的分类方法都是建立在类分布大致平衡这一假设基础上的,然而实际情况中,数据往往都是不均衡的.因此,传统分类器分类性能通常比较有限.从数据层面和算法层面对国内外分类算法做了详细而系统的概述.并通过仿真实验,比较了多种不平衡分类算法在6个不同数据集上的分类性能,发现改进的分类算法在整体性能上得到不同程度的提高,最后列出了不均衡数据分类发展还需解决的一些问题. 相似文献

5.

一种处理不均衡多分类问题的特征选择集成方法

下载免费PDF全文

宿晨徐华崔鑫王玲娣《重庆大学学报(自然科学版)》2022,45(5):125-134

为解决不均衡多分类问题，提出一种特征选择和AdaBoost的集成方法。首先，数据进行预处理。利用WSPSO算法进行特征选择，根据特征重要性选取初始粒子构建初始种群，使得算法初期就可以沿着正确的搜索方向开展，减少不相关特征的影响。其次，利用AdaBoost算法对于样本权重较敏感的特点，增强对小类样本的关注度。并且利用AUCarea作为评价标准，相对于其他评价标准，AUCarea具有可视化的优点且对较差AUC更加敏感。最后，与其他几种不均衡分类算法在不平衡数据集上进行对比，结果证明该算法可有效处理不均衡多分类问题。相似文献

6.

基于改进的半监督阶梯网络SAR图像识别

《南京大学学报(自然科学版)》2021,(1)

针对目前SAR(Synthetic Aperture Radar)图像中样本人工标记成本高、传统算法分类识别较低的情况,提出一种基于改进半监督阶梯网络(Semi-supervised Ladder Network,SSLN)的SAR图像分类识别方法 .首先在原SSLN模型的解码器网络中使用卷积神经网络代替全连接层,对编码器输出的每层数据进行全局深度特征提取,这样做有利于图像降噪,实现对输出数据的重构.其次,为解决SAR图像各类数据集分布不均衡的问题,同时提高网络的泛化性能,对阶梯网络训练层中各类别损失函数的权重进行优化,根据各类别样本数所占总样本数的比重,对少样本类别损失函数调高权重,对多样本类别损失函数调低权重.在公开数据集MSTAR(Moving and Stationary Target Automatic Recognition)上的实验表明,改进后的半监督阶梯网络分类的识别准确度明显优于SSLN算法,且具有更好的泛化性. 相似文献

7.

面向不平衡数据的逻辑回归偏标记学习算法

周瑜顾宏《大连理工大学学报》2017,57(2):184-188

偏标记学习是近几年提出的新机器学习框架,已有的逻辑回归偏标记算法尚不能解决数据不平衡问题.建立了一种可以解决数据不平衡的逻辑回归模型偏标记学习算法.基本思想是在多元逻辑回归模型中定义新的似然函数以达到处理不平衡数据的目的.算法先根据训练集中各个类别样本所占比例定义了一个新的似然函数,之后通过逼近和求导等数学手段推导得到了能够求解的光滑的逻辑回归偏标记学习模型.在UCI数据集和真实数据集上的仿真实验表明,所提算法在数据存在不平衡问题时提高了样本的平均分类精度. 相似文献

8.

面向不平衡数据集的一种改进的k-近邻分类器

刘鹏杜佳芝吕伟刚窦明武《东北大学学报(自然科学版)》2019,40(7):932-936

心脏心律失常数据集的心电图(ECG)数据往往存在各心律失常类型下样本数量不平衡问题.针对此问题,提出了一种新的模式识别分类方法,即改进的基于核的差重建的加权k-近邻分类器(modified kernel difference-weighted k-nearest neighbor classifier, MKDF-WKNN),通过引入修正因子对含样本数较多的类别进行权值抑制,对含样本数较少的类别进行权值的加大,并使用UCI心脏心律失常数据集对ECG数据进行分类.实验结果表明,提出的算法和其他一些基于KNN的算法如KNN,DS-WKNN,DF-WKNN和KDF-WKNN相比,对于不平衡的心律失常数据集的分类有更好的效果. 相似文献

9.

不均衡数据混合取样分类算法

《燕山大学学报》2015,(2)

针对不均衡数据分类决策面偏移导致少数类识别率较低的问题,提出一种混合取样算法.首先计算类样本数的比值K;然后分别在多数类和少数类中随机选取一个样本,计算该样本的K-1近邻,以K个样本的中心作为新样本;再对剩余的样本重复上面操作,直到所有样本都被处理;最后所得新样本与原少数类样本共同构成新的训练集.该算法在改变样本密度的同时保持了原样本的空间分布,实验结果表明该算法能够提高SVM在不均衡数据下的分类性能,尤其是少数类的分类性能. 相似文献

10.

基于网络资源的大规模珊瑚数据集构建

花明珠王连明江佳蔚《东北师大学报(自然科学版)》2023,(1):72-79

针对目前公开已有珊瑚数据集种类、样本少等问题.为构建种类丰富的大规模珊瑚数据集，本文首先以珊瑚属名为关键词，通过爬虫技术在网络中搜集大量珊瑚图片形成初始数据集；其次使用感知哈希算法对初始数据集中的图片进行去重处理；再次采用YOLO V3深度学习网络对去重后的数据集进行清洗，去除大噪声样本；然后通过旋转、镜像、随机裁剪、改变亮度和对比度等方法进行数据增强，均衡各个珊瑚属包含的图像数量；最后，构建了一个包含34个珊瑚属，218 467张珊瑚图像的珊瑚数据集.所构建的珊瑚数据集种类和样本数均高于已有的、公开的珊瑚数据集.所提出的珊瑚数据集构建方法也适用于其他难以获得样本的数据集的构建. 相似文献