首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基于支持向量机的不平衡数据分类的改进欠采样方法   总被引:3,自引:0,他引:3  
支持向量机作为一种有监督分类算法,具有小样本,非线性等独特优势,但其在处理不平衡数据分类时效果不够理想.欠采样是一类常用的数据重构方法,它被广泛用于解决不平衡数据的分类问题,然而,传统的随机欠采样方法受随机性影响,稳定性较差.提出一种改进的欠采样方法,并应用在支持向量机上进行分类对比实验.实验结果表明,相比传统随机欠采样方法,该方法的稳定性更好,且在许多情况下可以提高支持向量机对不平衡数据的分类性能.  相似文献   

2.
用于不平衡数据分类的模糊支持向量机算法   总被引:1,自引:0,他引:1  
作为一种有效的机器学习技术,支持向量机已经被成功地应用于各个领域.然而当数据不平衡时,支持向量机会产生次优的分类模型;另一方面,支持向量机算法对数据集中的噪声点和野点非常敏感.为了克服以上不足,提出了一种新的用于不平衡数据分类的模糊支持向量机算法.该算法在设计样本的模糊隶属度函数时,不仅考虑训练样本到其类中心距离,而且考虑样本周围的紧密度.实验结果表明,所提模糊支持向量机算法可以有效地处理不平衡和噪声问题.  相似文献   

3.
分类问题是机器学习领域的重要研究方向之一。支持向量机是一种基于结构风险最小化的学习机器,在解决分类问题上有着出色的效果。但基于支持向量机的分类器在处理不平衡样本时,对少类样本分类准确率偏低。诸多研究在对此问题做分析时往往把主要原因归结为各类样本间数量上的不平衡,而没有充分考虑样本点在特征空间上的分布情况。针对此问题做出原因分析,并给出结论:样本的不平衡性主要是由特征空间下各类样本的分布所决定的,而和数量上的不平衡关系较小。通过实验验证结论的科学有效性。  相似文献   

4.
针对不平衡数据分类问题,提出了一种带有间隔感知标签分布损失函数的支持向量机,称为基于间隔放大损失的支持向量机(support vector machine with margin magnification loss,MM-SVM)。考虑各类样本的分布情况以及数据不平衡比,设计了一种间隔放大损失函数,最小化基于间隔的泛化误差界;将间隔放大损失函数应用于SVM模型中,增强了少数类样本对分类超平面的影响,实现对少数类样本的准确分类。在Keel和UCI数据库上的实验表明,MM-SVM在不平衡数据分类精度和时间效率上均优于其他5种对比方法,实现了对不平衡数据的有效分类。  相似文献   

5.
提出基于支持向量机的不平衡样本集分类算法,以支持向量机为基础,利用重采样技术及特征子空间等相关理论,通过分层抽样方法和重采样技术,分别对不平衡数据集的样本底层特征和样本数量进行平衡,在不同数据集上进行实验,实验表明该方法能有效提高不平衡数据分类的准确度.  相似文献   

6.
给出了输入数据含有不确定信息的一个支持向量机分类方法.通过未确知数理论,得到支持向量机分类的一个概率约束模型,然后通过一定方法将概率约束转化为一般约束,由此将给出的概率约束优化模型转化为一个确定性支持向量机分类模型,从而有效解决了含有不确定数据的分类计算问题.  相似文献   

7.
为解决支持向量机在分类识别前需要利用已知训练集进行训练的问题,本文提出了一种基于k均值的对无标识数据进行分类的支持向量机分类算法。首先利用k均值算法将未知数据划分成某个数量的子集,然后对新数据进行支持向量机训练得到决策边界与支持矢量,最后对无标识数据进行分类。模拟结果表明:训练时消耗的CHU时间为1.8280秒,支持向量个数为60时,分类错误率小于2%。  相似文献   

8.
提出了随机平衡数据采样算法,以此为基础对Ada Boost算法进行修改并构建了随机平衡集成分类算法,采用6组UCI数据集对随机平衡集成分类算法进行实验,并与SMOTEBoost算法、RUSBoost算法、AdaBoost算法进行比较.实验结果表明,随机平衡数据集成算法具有更好的分类性能,在处理不平衡数据集方面有一定的优势,具有较强的多元性和鲁棒性.  相似文献   

9.
DNA 微阵列技术,使人们可以同时观测成千上万个基因的表达水平,对其数据的分析已成为生物信息学研究的焦点.针对微阵列基因表达数据维数高、样本小、非线性的特点,设计了一种基于粗糙集的支持向量机基因表达数据分类方法,该方法采用粗糙集进行基因特征约简,运用支持向量机进行数据分类,实验表明其分类效果良好.  相似文献   

10.
基于支持向量机的图像分类   总被引:2,自引:1,他引:2  
介绍了支持向量机(SVM)的基本原理,并将它应用于图像分类.提取多种视觉特征作为SVM的输入向量,比较单一视觉特征和综合视觉特征作为SVM输入向量时的分类性能.还比较了多项式核和高斯径向基核的分类效果.实验结果表明,混合特征明显优于单一视觉特征,高斯径向基核优于多项式核.  相似文献   

11.
费娜 《科技资讯》2011,(30):89-90
支持向量机是建立在统计学习理论基础上的一种小样本机器学习方法,用于解决二分类问题。本文阐述了支持向量机的理论基础并对核函数的参数选择进行了分析研究。  相似文献   

12.
针对传统的SMOTE方法在类别区域重合的数据集应用时,可能产生多个更接近多数类的人工样例,甚至突破类别边界,从而影响整体分类性能的情况,提出了一种最近三角区域的SMOTE方法,使合成的人工样例只出现在少数类样例的最近三角区域内部,并且删除掉距离多数类更近的合成样例,从而使生成的样例更接近少数类,且不突破原始的类别边界。实验分别在人工数据集和改进的UCI数据集上进行,并和原始的SMOTE方法分别在G-mean和F-value的评价指标上进行了对比,实验结果验证了改进的SMOTE方法在类别区域有重合的数据集上要优于原始SMOTE方法。  相似文献   

13.
利用遥感技术对红树林进行群落级识别在红树林的资源详查、利用和保护方面具有重要意义。基于World View-2卫星影像的光谱特征、植被指数及纹理特征信息,结合实地调查中红树林植物的生长区位信息,采用面向对象结合支持向量机(Support Vector Machine,SVM)的方法对珠海淇澳岛红树林自然保护区大围湾片区的红树林植物进行群落分类,对比分析单一尺度和多尺度两种方式的分类效果。结果表明,尽管红树林群落之间光谱反射特征相似度较高,但拥有8个光谱波段的World View-2数据在此分类中仍具有很好的应用潜力;多尺度分类结果总体精度达到84.2%(kappa系数0.794),高于单一尺度分类结果的69.8%(Kappa系数为0.616)。  相似文献   

14.
不平衡数据广泛存在于现实世界中,严重影响了传统分类器的分类性能。本文提出了随机平衡采样算法(random balance sampling,RBS),并以此为基础提出了随机平衡采样bagging算法(RBSBagging)用于解决不平衡数据集的分类问题。最后,采用6组UCI数据集对提出的分类算法进行验证,结果表明本文提出的RBSBagging算法可以较好地解决不平衡数据集的分类问题。  相似文献   

15.
针对传统重采样方法大多使用固定采样策略,无法根据模型的优化需求改变采样策略的问题,提出一种基于自适应采样的不平衡分类方法(ASIC)。该方法根据分类模型在验证集上的表现动态调整训练集上不同类别样本的采样概率,使不同类别的采样概率由当前分类模型的需求动态决定;同时,该方法对少数类给予额外的关注,在其余条件相同的情况下为少数类赋予更大的采样概率,以弥补少数类本身样本数量不足对分类模型造成的不良影响,从而提高分类模型对少数类的识别能力。实验结果表明,使用ASIC方法训练的分类模型的平均类准确率和召回率的几何平均值均比对比方法更好,且数据分布越不平衡,ASIC方法的优势越明显。  相似文献   

16.
基于小波变换和支持向量机的音频分类   总被引:1,自引:0,他引:1  
音频特征提取是音频分类的基础,而音频分类又是基于内容的音频检索的关键。使用小波变换和支持向量机的方法对音频进行分类。研究了小波变换域的音频特征提取,分析了这些特征在小波变换域中的意义。把得到的特征向量作为支持向量机的输入,把音频分成纯语音、带背景音乐的语音、音乐、环境音4种类型。实验结果表明,基于小波域的特征计算简单、能够较好地区分不同的音频类型,得到较高的分类精度。  相似文献   

17.
针对人工镜检分类白细胞准确率和效率低的问题,基于深度学习和机器学习算法,提出了一种基于迁移学习和支持向量机的白细胞分类方法.首先对迁移模型进行微调训练,其次用微调训练后的迁移模型进行特征提取,然后将特征输入至神经网络和支持向量机中进行训练,最后通过神经网络和支持向量机的组合分类器对白细胞进行分类.实验结果表明,白细胞分类准确率由最初微调训练的83.26%,随着迁移模型的优化提升为90.43%,最后通过组合分类器再次提升为93.52%,可以在临床实践中帮助医生提高诊断的准确率和效率.  相似文献   

18.
针对现有数据挖掘模型解决客户价值分类的不足,提出了基于粗糙集和支持向量机理论的客户分类模型,该模型首先应用粗糙集理论对主要指标属性进行特征提取,约简出主要指标体系,然后将训练样本送入支持向量机进行学习和训练,进而对检验样本的客户类别进行判别.结果表明:与传统的客户分类模型相比,基于粗糙集和支持向量机的客户分类模型对检验样本的预测精度更高,具有良好的分类效果,是一种更为高效和实用的分类方法.  相似文献   

19.
基于小波变换和支持向量机的图像分类   总被引:1,自引:0,他引:1  
提出了一种基于小波变换和支持向量机的图像分类新方法,该方法利用小波变换进行图像特征提取,利用支持向量机进行图像分类,并与基于图像底层特征的分类方法进行了实验比较.实验结果表明该方法具有较好的分类性能.  相似文献   

20.
为了有效地利用信息技术发展而产生的海量信息,信息检索与数据挖掘得到了快速的发展,通过对传统支持向量机的特点分析,针对其在文本分类中的局限性,采用了一种基于二叉树的模糊支持向量机的多分类算法,通过实验证明该算法有更好的抗干扰能力和更好的分类效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号