首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
针对不平衡数据集数据分布不均匀及边界模糊的特点,提出基于局部密度改进的SVM(NLDSVM)不平衡数据集分类算法。该算法先用层次k近邻法计算多数类中每个样本的局部密度,依据每个样本的局部密度值分别选出边界区域、靠近边界区域的与少数类数目相等的样本与少数类完成SVM初始分类;用所得的支持向量机和剩余的多数类样本对初始分类器迭代优化。人工数据集和UCI数据集的实验结果表明,与WSVM,ALSMOTE-SVM和基本SVM算法相比,NLDSVM算法G-mean的平均值提高了7%,F-measure的平均值提高了6%,AUC的平均值提高了6%。NLDSVM算法分类效果良好,能有效改进SVM算法在分布不均匀及边界模糊数据集上的分类性能。  相似文献   

2.
针对不平衡数据集数据分布不均匀及边界模糊的特点,提出基于局部密度改进的SVM不平衡数据集分类算法.该算法先将多数类划分成多个子类,并依据子类内每个样本的局部密度选出边界区域、靠近边界区域的与少数类数目相等的样本,与少数类完成SVM初始分类;用所得的支持向量机和剩余的多数类样本对初始分类器进行迭代优化.结果表明,与WSVM,ALSMOTE-SVM和基本SVM算法相比,该算法分类效果良好,能有效改进SVM算法在分布不均匀及边界模糊数据集上的分类性能.  相似文献   

3.
KNN算法在分类准确率和召回率方面具有较好的性能,但由于样本相似度计算开销大,导致分类效率低.针对此问题,本文提出一种基于密度的训练样本裁剪算法,对训练样本的各个样本类进行聚类,根据密度不同聚集成不同的簇,删除噪声数据并计算每个样本类的相似度阈值,然后将样本类内大于类相似度阈值的样本进行合并,以减少训练样本总数.实验表明,此样本裁剪算法能够在保持KNN算法分类性能基本稳定的前提下,实现各个样本类内高相似度样本的合并,减少分类计算开销.  相似文献   

4.
通过分析同类数据点在空间中的几何形态,从数据点集所构成几何形态的凹凸性着手,提出边界提取算法并对高维数据进行分类。针对现实生活中的高维数据,利用局部线性嵌入将数据进行降维处理,得到低维特征数据。在此基础上,对于单分类数据集,用数据集表面的点的近邻样本与过该点的切平面之间的关系寻找边界点;对于多分类数据集,利用贝叶斯后验概率来寻找边界重复的点,以此更快达到提取边界点的目的。由此可以粗略筛选出边界点。为去除不重要的边界点,降低分类误差,通过构造最优超平面和支持向量机对边界点赋予权重,并设置阈值去除不重要的边界点,由此达到用较少的边界点准确分类数据的目的。通过100个测试样本进行分类测试并计算其分类准确率,验证了此分类方法的可行性。  相似文献   

5.
基于一类SVM的贝叶斯分类算法   总被引:1,自引:0,他引:1  
提出一种基于一类支持向量机(one-class SVM)的贝叶斯分类算法,该算法用一类SVM对类条件概率密度进行估计以构造贝叶斯分类器. 证明采用高斯核的一类SVM,其解可以归一化为密度函数,并把该密度函数看作类条件概率密度的平滑估计,构造贝叶斯分类器. 实际数据集上的实验结果表明,提出的分类算法测试准确率高于简单贝叶斯分类器与贝叶斯网络分类器,不低于传统二类SVM;比传统二类SVM需要计算的核矩阵规模更小,训练时间更短.  相似文献   

6.
基于SVM的分类算法与聚类分析   总被引:5,自引:0,他引:5  
运用结构风险最小化原理和聚类原理,将支持向量机中有监督的分类算法与统计中无监督的聚类算法有机地结合起来。对线性可分与线性不可分两种情况分别建立了无监督的分类模型,模型的求解转化为一个二次规划问题。同时此模型也适合于多分类情况,在应用到心脏病的医疗诊断中,准确率为88.5%,较以前的方法有了明显的提高。  相似文献   

7.
采用稳健的改进主成分分析与支持向量机(PCA-SVM)算法进行特征提取,分析中国股票市场的股票选择问题,并采用中国沪、深A股市场中上市公司数据验证该方法的有效性.结果表明,运用PCA-SVM算法得到的组合回报率超过了市场基准.  相似文献   

8.
支持向量机(Support vector machines)在人像识别、文本分类等模式识别问题中有广泛的应用,可以有效地解决一些实际生活中的分类问题。针对半监督两分类问题,提出了基于Seeded-Kmeans和SVM的分类算法(SK-SVM)。用Seeded-Kmeans算法对无标签点进行处理,使其获得初始标签,再选取有效的标签点加入已有带标签点中,构成新的带标签训练集,最后结合SVM进行分类。选取UCI中的8个数据集进行数值实验,基于Seeded-Kmeans和SVM的分类算法的有效性得到了验证。  相似文献   

9.
对预处理后的指纹图像进行分类相关算法研究,提出一种无需迭代的指纹参考点定位方法,该算法具有简单、快速、效果好的优点;基于指纹方向场的半区域特征提取方法,采用二叉树结构的支持向量机多分类策略解决指纹的多分类问题.实验表明,分类精度良好.  相似文献   

10.
对预处理后的指纹图像进行分类相关算法研究,提出一种无需迭代的指纹参考点定位方法,该算法具有简单、快速、效果好的优点;基于指纹方向场的半区域特征提取方法,采用二叉树结构的支持向量机多分类策略解决指纹的多分类问题.实验表明,分类精度良好.  相似文献   

11.
经典KNN算法在处理高维数据或样本数繁多的样本集时需要巨大的计算量,这使其在实际应用的过程中存在着一定的局限性;提出一种基于聚类和密度裁剪的改进KNN算法。在训练阶段,首先根据样本密度对整个训练集进行裁剪,然后将裁剪好的训练集进行聚类处理,得到若干个密度比较均匀的类簇并将其转化为超球。在测试阶段,采用两种方法,第一种是找出距离待测样本最近的k个超球,然后将这个k个超球内的训练样本作为新的训练样本集,在这个新的训练样本集上使用经典KNN算法得到待测样本的类别;第二种则是找出距离待测样本最近的1个超球,然后根据该超球的类别得出待测样本的类别。实验采用8个UCI样本集进行测试,实验结果表明,该算法同经典KNN相比具有良好的性能,是一种有效的分类方法。  相似文献   

12.
基于二叉树的SVM多类分类算法研究   总被引:3,自引:0,他引:3  
支持向量机是一种高效的分类识别方法,在解决高维模式识别问题中表现出许多特有的优势.支持向量机本身是一个两类问题的判别方法,不能直接应用于多类问题.介绍了基于二叉树的SVM多类分类算法,通过对其原理和实现方法的分析,对这些方法的优缺点进行了归纳和总结,给出了进一步的研究方向.  相似文献   

13.
为了实现对大量的网络信息的正确分类以便使用户迅速获取所需信息,提出一种新的网页内容分类算法,该算法将遗传算法(GA)与支持向量机(SVM)结合起来,利用遗传算法良好的寻优能力优化SVM的分类性能。在由新闻网页文本构成的数据集上的仿真实验结果表明,GA和SVM融合的算法能够有效提高SVM的分类性能,新算法的分类正确率相比基本的SVM有非常显著的提高。由此证明,提出的基于GA的SVM改进算法是有效的,能够用于对大量网络信息的分类问题中。  相似文献   

14.
针对支持向量机中当样本集训练规模很大且存在野点时,其分类速度慢且精度不高的问题,提出一个支持向量机快速算法。其基本步骤是首先求取每类样本点的壳向量和中心向量,然后将求出的壳向量和中心向量合在一起,组成新的训练集进行训练,得到最终的分类器。实验表明采用这种学习策略,不仅大幅度降低了学习代价,而且获得的分类精度与直接通过大规模样本集训练得到的分类器的分类精度相当,同时分类速度也得到大幅度提高。  相似文献   

15.
提出一种基于数据关系(Data Relationship,DR)的多分类支持向量机(Support Vector Machine,SVM)学习算法(Multi-Classification SVM Algorithm Based on Data Relationship,DR-SVM).DR-SVM算法根据每类数据的关系(如向量积等)获取子学习嚣的冗余信息,从而优化多分类器组,然后通过经典的SVM算法训练分类器组.算法在简化分类器组的同时可对多类数据分类问题获得满意的泛化能力,在标准数据集上的实验结果表明,与经典的SVM多分类方法相比,DR-SVM具有更好的泛化性能,尤其对单个类别精度要求较高的数据尤其有效.  相似文献   

16.
为解决多类分类问题,在分析SVM决策树分类器及存在问题的基础上,通过引入类间可分离性测度,并将其扩展到核空间,提出一种改进的SVM决策树分类器。实验表明了该分类算法对提高分类正确率的有效性。  相似文献   

17.
支持向量机(Support Vector Machine,SVM)是一种公认有效的分类算法,在处理小规模二分类问题时表现出较好的性能,但在处理非平衡数据的分类问题时能力有限,针对非平衡数据的分类问题,文章提出一种基于划分融合的非平衡SVM算法(Imbalanced SVM Algorithm based Divisio...  相似文献   

18.
设计了一种基于统计的多层次分类算法:在一个树状的层次分类体系中,对文档进行自动分类时,首先从根结点开始找到对应的大类,然后递归往下直到找到对应的最底层子类.每一层中使用支持向量机作为分类模型,并使用类别均衡的方法解决数据稀疏的问题,在经过大规模网页语料训练后取得了很好的分类效果.  相似文献   

19.
针对不平衡数据集数据分布不均匀及边界模糊的特点,提出一种新的近邻密度SVM(NNDSVM)不平衡数据集分类算法。该算法先计算多数类中每个样本K近邻范围内的密度值,依据该密度值分别选出边界区域、靠近边界区域的与少数类数目相等的样本与少数类完成SVM初始分类;用所得的支持向量机和剩余的多数类样本对初始分类器迭代优化。人工数据集和UCI数据集的实验结果表明,与SVM、ALSMOTE-SVM和WSVM算法相比,本文算法分类效果良好,能有效改进SVM算法在分布不均匀及边界模糊数据集上的分类性能。  相似文献   

20.
简单介绍了SVM的理论背景,详细介绍了基于SVM的分类预测方法。给出了基于SVM的分类预测技术的性能测试结果。指出该分类预测技术可将实际问题通过非线性变换转换到高维的特征空间,在高维空间中构造线性辨别函数来实现原空间中非线性辨别函数。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号