首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对最小二乘回归分类法对原始数据进行分类时容易受到噪声样本影响的不足,利用系数增强的方法提出一种缓解噪声样本对表示系数影响的鲁棒分类法. 该方法是一种两阶段最小二乘回归分类法: 第一阶段通过最小二乘回归分类法获得表示系数,第二阶段强化近邻表示系数的作用得到表示系数. 最后用最小误差准则对测试样本进行分类,利用核理论进一步提出非线性两阶段最小二乘回归分类法,并在4个常用人脸图像数据集上验证了该方法的有效性.  相似文献   

2.
利用分层分类法把厦门岛城市土地类型分为七类,并对分类结果进行了验证.在TM图像光谱特征分析和归一化差异型指数分析结论上,提出分层分类法的分类步骤.利用ERDAS的专家分类器逐类地提取土地类型,并利用掩膜法将原图像上新提取地类所对应区域掩膜掉,使得分类过程越来越容易.分层分类法避免了一次划分多种类别方法在选择波段组合上的矛盾.精度评价结果表明,总分类精度达到90.9%,达到分类要求标准.  相似文献   

3.
针对同物异谱现象以及分类过程中样本代表性差、人工参数设置等原因导致高光谱遥感影像分类精度差的问题,提出了一种样本集优化的最优代表向量分类法,对感兴趣区中的样本进行密度峰值聚类提纯,并对每类地物提纯后样本的均值向量集进行隶属度聚类择优,获取最优代表向量集作为该类地物的中心向量,最终依据距离准则进行分类.通过对比实验验证,本文算法总体分类精度高于90%,表明最优代表向量分类法能够有效消除样本差异性的影响,提高冰川分类精度.   相似文献   

4.
近些年,基于深度学习的算法和模型在各种图像分析任务中都取得了显著的成功,与常见的自然图像相比,医学图像数据集依然面临高度不平衡的问题,不平衡数据会导致特征空间里的决策边缘倾向样本多的类别,导致分类效果的下降.为了解决该问题,提出一种基于卷积神经网络考虑特征类内紧凑性的不平衡医学图像分类方法(Z-Score Compactness-based Convolutional Neural Network,ZC3NC).首先,从一个卷积神经网络的最后一层卷积层提取训练集样本与测试集样本的特征图,随后引入一个新的Z分数来度量测试集数据的特征图相对训练集每个类在特征空间上的偏离度,偏离度的度量基于类内的紧凑度,其主要关注样本的分布特性,对各类样本数量的不平衡性不敏感.最终,根据计算的偏离度,对测试集的数据进行分类.在DermaMNIST数据集上的实验表明,在不对数据和神经网络模型做任何额外增强的情况下,该方法的平衡准确率比原卷积神经网络模型平均提高11.15%,最多提高14.08%,证明提出的分类方法能有效地提高多种卷积神经网络对不平衡医学图像数据的分类性能.此外,和最先进的不平衡分类方法 Und...  相似文献   

5.
核函数选择是支撑向量机(Support Vector Machine,SVM)研究的热点和难点.针对目前SVM核函数的选择没有统一规则的现状,探讨极坐标核在样本分类问题中的应用,提出一种结合样本分布特征进行SVM核选择的方法.首先分析极坐标核的映射原理,采用主成分分析方法(Principle Component Analysis,PCA)对高维数据集合理降维,在得到样本集分布特征的基础上进行SVM核选择,在Matlab环境中,采用四组数据集进行分类实验,验证结合样本分布特征选择SVM核函数的分类效果.实验结果表明,呈类圆形分布的样本集采用极坐标核进行分类,识别率达到100%,训练时间最短,优于采用高斯核SVM的分类效果.该方法提高了SVM的泛化能力,方案具有可行性和有效性.  相似文献   

6.
为解决癌症基因组图谱中DNA甲基化数据不平衡导致假阴率上升的问题,提出一种基于TCGA数据库不平衡数据的改进分类方法.使用合成少数类过采样技术和Tomek Link算法进行混合采样,解决数据不平衡问题.在此基础上,将经特征选择后的训练集数据输入改进模型进行训练、学习及分类.基于TCGA数据库6种癌症DNA甲基化数据的实验结果表明:改进方法对少数类样本的分类性能有显著提高,对多数类样本的分类性能也有一定的提升.  相似文献   

7.
基于LM-BP神经网络模式的酸性染料分类方法   总被引:2,自引:1,他引:1  
提出用Levenberg-Marquardt Backpropagation Neural Network(LM-BP)网络对酸性偶氮染料进行分类,网络结构为4-6-5。优化了隐含层神经元数和网络训练次数,表明隐含层神经元数应比输出层神经元数多一个。考察了训练集样本的选择对结果的影响,测试集的样本参数大小要处于训练集样本之间。本网络把其中22种染料作为训练集,把另外18种染料作为测试集,与采用GCEDM逐次分类法比较,测试集识别率为83%。  相似文献   

8.
在保证分类性能的前提下,如何从大量的训练样本集合中选择重要样本子集,是模式分类中的一个重要问题.基于该问题提出了一种新的样本选择算法,并将该算法应用于文本分类,在标准文档集Reuters-21578、复旦文档集和20newsGroup新闻组文档集上进行了实验.实验结果表明:该方法能有效地选取边界样本,且采用SVM和KNN分类能得到较好的分类结果,尤其是在不均衡文档集上效果更佳.  相似文献   

9.
引进一种数据流关联规则分类法(AC-DS),并应用该方法对UCI机器学习库中标准数据集进行分类验证,验证结果表明该方法准确且有效。然后将该方法应用到水电机组故障的诊断分类中,证明该方法的分类精度随着测试样本的增加而增加。该方法对现场不同类型机组故障分类有一定意义。  相似文献   

10.
稀有类分类在许多领域有重要应用,针对稀有类在数据中所占比例少,容易被忽略的特点,提出一种基于聚类和Ripper的稀有类分类方法,该方法在一趟聚类的结果中,通过将在整个数据集中所占的比例低于15%的聚类标识为少数类,再应用Ripper分类算法分别对少数类和多数类分别进行分类建模,并按照一定的组合方式调整得出整个数据集的最终规则集.在UCI数据集上的测试结果表明,基于一趟聚类和Ripper的稀有类分类方法对稀有类可产生高质量的分类效果.可以将该方法应用于现实生活的领域中进行稀有数据的分类.  相似文献   

11.
遥感图像场景分类在地理空间对象检测、自然灾害检测、地理图像检索、环境监测等方面具有广泛的应用前景,引起了人们的广泛关注.文章改进了传统的深度卷积神经网络(DCNN),将其应用于遥感图像场景分类研究,提出了一种改进后的7层网络结构,在激活函数的选择上,针对神经元通过Relu进行激活容易激活失败的情况,采用PRelu函数替代Relu;针对传统的深度学习方法不能融合多种细粒度深度学习特征的问题,采用分层特征融合的方法,通过实验对比,将第四个卷积层、池化层和最后一个全连接层提取到的特征进行串联融合,得到一种更加有效的深度特征.与传统深度学习方法相比,文章所提方法分类准确率提高了8.81%.实验结果表明,该方法在准确率、Kappa系数上均有良好表现,取得了良好的分类效果.  相似文献   

12.
针对不平衡分类问题的极端情况,即用于训练的样本极少甚至只有一个实例,该文提出了一种单实例分类算法,这种方法使用球面作为分类面,在目标类的单实例在球内和反类尽量位于球面外的约束条件下,最大化该分类球面的半径,该方法能够有效地处理线性可分的数据分布.当输入样本分布结构呈高度非线性时,该算法通过核映射将低维输入空间中的非线性可分问题变换为高维特征空间中可能的线性可分问题,并以内积形式刻画,最终在特征空间上通过核技巧获得原问题的解决.通过对标准数据集和实际数据集的实验,验证了单实例分类算法在处理数据不平衡问题上的有效性.  相似文献   

13.
基于密度聚类的支持向量机分类算法   总被引:8,自引:0,他引:8  
为了解决支持向量机的分类仅应用于较小样本集的问题,提出了一种密度聚类与支持向量机相结合的分类算法.在密度聚类中,当一个样本点不存在拟密度可达的样本点,则其显著特征即表现为该簇的边缘点,将该点加入约简集合,直至选出样本集合中的所有边缘对象,然后再利用约简集合寻找支持向量.实验表明,采用该算法,分类的准确率可从基于无监督聚类的支持向量机算法的86.81%提升至95.43%,核函数计算量由原数量级109下降到106以下,采取限制密度聚类中的核心点ε-邻域内的反例百分比的方法,可以增加约简样本的个数,可将分类准确率提高5%~8%左右.  相似文献   

14.
针对微博多类垃圾用户的检测问题,设计了一种基于模糊多类支持向量机的垃圾用户检测方法。首先,采用一对多SVM(support vector machines)的构造思想来构造多分类器,并针对每类用户的分类器重新选择训练集;然后,利用构造好的训练集来训练多分类器,经过反复调整参数,得到5个用户分类器;最后,针对多分类器的不可分样本,采用模糊聚类来进行模糊处理,即在垂直于SVM的最优分类面上定义一个改进的隶属度函数,选择最大隶属度对样本进行再分类。实验结果表明,该方法在保证垃圾用户检测效果的前提下,可以解决多分类中存在的混分和漏分问题。  相似文献   

15.
采用经验风险最小化归纳原则和梯度下降方法调整传统中心分类法的类别中心向量, 解决了传统中心分类法因忽略训练集文本权值因素而导致的类别中心向量表达能力较差问题, 得到了与支持向量机分类性能基本一致的一种改进的中心分类法. 实验结果表明, 该方法是提高中心分类法分类性能的一种有效方法.  相似文献   

16.
由于数据量的不断增长,出现了大量的不平衡高维数据,传统的数据挖掘分类算法在处理这些数据时,易受到样本分布和维数的影响,存在分类性能不佳的问题.提出一种针对不平衡高维数据集的改进支持向量机(Supported Vector Machine,SVM)分类算法,首先通过核函数将数据集映射到特征空间中,再引入改进的核SMOTE(Kernel Synthetic Minority Over-sampling Technique)算法而得到正类样本,使两类样本数目平衡化;然后将维数高的数据集通过稀疏表示的方法投影到低维的空间中,实现降维;最后根据空间的距离关系来确定在输入空间中合成样本的原像,再对得到的平衡样本集通过SVM来分类,通过仿真实验验证了该算法对于高维不平衡数据集有较优的分类性能.  相似文献   

17.
针对基于特征分布校准的小样本分类算法无法准确揭示新类特征分布的问题,提出一种融合隐空间变换和密度聚类的改进算法,以解决N way-K shot任务模式下的小样本图像分类问题.首先,通过广度残差神经网络提取基类和新类图像的深度特征;其次,采用隐空间变换方法约束新类特征分布,使其更接近正态分布;再次,利用密度聚类方法为新类选取合适基类,将基类统计信息迁移到新类,并通过多元正态分布矩阵实现样本扩充;最后,构建基于集成学习的分类器,完成小样本图像分类任务.实验结果表明,相比于传统特征分布校准方法,该算法的分类准确率更高.  相似文献   

18.
基于几何边界的分类方法是一种典型的智能分类方法,已有的一些方法不仅忽略数据的分布特性,而且没有考虑不同样本对分类结果的影响,因而分类精度有待于进一步提高.鉴于此,受磁极效应启发,该文提出一种新颖的融合磁极效应和数据分布特征的最大间隔学习机.该模型构造的分类超平面距离一类尽可能近,而距离另一类尽可能远,尽量地将这2类分开.该模型利用类内离散度和类间离散度来刻画数据分布特征,以期在分类决策时将数据的分布形状考虑在内.此外,模糊隶属度的引入突出了不同样本对分类结果的影响.在UCI标准数据上的比较实验表明该方法是有效的.  相似文献   

19.
针对不平衡数据中类重叠区域易造成分类错误的问题,提出一种引入合成因子改进边界分类的Borderline-SMOTE过采样方法(IBSM).首先根据少数类样本近邻分布情况找出处于边界的少数类样本,然后计算边界样本对应的合成因子,并根据其取值更新该样本需生成的样本数,最后在近邻中根据合成因子挑选距离最近的top-Z少数类样本进行新样本生成.将提出的方法与八种采样方法在KNN和SVM两种分类器、10个KEEL不平衡数据集上进行对比实验,结果表明,提出的方法在大部分数据集上的F1,G-mean,AUC (Area under Curve)均获得最优值,且F1与AUC的Friedman排名最优,证明所提方法和其余采样方法相比,在处理不平衡数据中的边界样本分类问题时有更好的表现,通过合成因子设定一定的约束条件与分配策略,可以为同类研究提供思路.  相似文献   

20.
特征选择是机器学习领域中的基本问题之一,在大规模数据处理中至关重要.目前大多数特征选择方法以单一值作为特征的分类能力评价标准,本文提出基于子类问题分类能力的特征选择方法,该方法用特征对各子类问题的分类能力及其加权平均值来度量特征的分类能力,既能保证总分类能力强的特征被选择,也能保证对子类问题分类能力强但总分类能力不强的特征被选择.将该方法与已有的3个特征选择方法在4个公开的基因表达数据集上进行比较,结果表明该方法是有效的,且可以提高分类预测准确率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号