首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于SMOTEBoost的非均衡数据集SVM分类器
引用本文:李正欣,赵林度.基于SMOTEBoost的非均衡数据集SVM分类器[J].系统工程,2008,26(5).
作者姓名:李正欣  赵林度
作者单位:东南大学,系统工程研究所,江苏,南京,210096
摘    要:在对实际问题进行数据挖掘时面临的多数是非均衡数据集,即各种类型的数据分布并不均匀,且关注的类型常是少数类.运用含有少量少数类型事例的数据集训练后的模型进行预测时,通常对多数类的预测精度很高,而少数类的预测精确性却很差.提出了一种集成方法SMOTEBoostSVM,通过SMOTE技术人工生成增加少数类样本量,以具有较强分类性能和泛化性能的SVM作为弱分类器,并以AdaBoost算法构建集成分类器.实验结果表明,SMOTEBoostSVM集成分类器比单纯运用SMOTE技术、AdaBoost算法以及SVM等的分类器,在非均衡数据集的分类预测中具有更好的效果.

关 键 词:SMOTE  AdaBoost  支持向量机  非平衡数据集  的非均衡  数据集  集成分类器  Based  效果  分类预测  结果  实验  算法  AdaBoost  弱分类器  泛化性能  分类性能  样本量  技术人  集成方法  预测精度  测时  模型  训练

A SVM Classifier for Imbalanced Datasets Based on SMOTEBoost
LI Zheng-xin,ZHAO Lin-du.A SVM Classifier for Imbalanced Datasets Based on SMOTEBoost[J].Systems Engineering,2008,26(5).
Authors:LI Zheng-xin  ZHAO Lin-du
Institution:Institute of System Engineering Southeast University;Nanjing 210096;China
Abstract:Many real world data mining applications involve imbalanced data sets,where all kinds of data are unevently distributed and the particular events of interest may be very few when compared to the other classes.Data sets that contain rare events usually produces biased classifiers that have a higher predictive accuracy over the majority classes,but poorer predictive accuracy over the minority class of interest.This paper presents a novel ensemble algorithm,SMOTEBoostSVM,which balances the classes distribution...
Keywords:SMOTE  AdaBoost  SVM  Imbalanced Datasets  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号