首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种基于投票的不平衡数据分类集成算法
引用本文:李勇.一种基于投票的不平衡数据分类集成算法[J].科学技术与工程,2014,14(21).
作者姓名:李勇
作者单位:新疆师范大学
基金项目:教育部人文社会科学研究青年基金项目; 新疆自治区高校科研计划项目
摘    要:不平衡数据分类是机器学习的研究热点之一。传统的机器学习分类算法通常假定用于训练的数据集是平衡的,不能直接应用于不平衡数据分类。利用朴素贝叶斯和决策树对数据不平衡的敏感度不同,提出一种基于投票的不平衡数据分类集成算法。基分类器选择NB和C4.5,通过投票平均方法进行分类决策;并选择公开的不平衡数据集进行实验验证。实验结果表明,该算法能有效提高不平衡数据的分类性能,特别是对正类(少数类)的误报率较低,具有良好的鲁棒性。

关 键 词:不平衡数据分类  朴素贝叶斯  决策树  投票表决
收稿时间:2014/2/20 0:00:00
修稿时间:2014/3/31 0:00:00

An Ensemble Algorithms based Voting for Imbalanced Data Classification
LI Yong.An Ensemble Algorithms based Voting for Imbalanced Data Classification[J].Science Technology and Engineering,2014,14(21).
Authors:LI Yong
Abstract:Imbalanced data classification has become the hot research in machine learning. Traditional machine learning classification algorithm is usually assumed for the training data set is balanced, the imbalanced data cannot be directly learned. Naive Bayes and decision trees for different imbalanced sensitivity of classification, we proposed an ensemble algorithms based voting for imbalanced data classification. NB and C4.5 were selected for base classifier, classification decisions by voting average method, and select public imbalanced datasets for experimental verification. Experimental results show that the algorithm can effectively improve the classification performance of imbalanced data, especially the low FPR and highSrobustness for the positives minority class.
Keywords:Imbalanced data  Naive Bayes  Decision trees  Voting
本文献已被 CNKI 等数据库收录!
点击此处可从《科学技术与工程》浏览原始摘要信息
点击此处可从《科学技术与工程》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号