首页 | 本学科首页   官方微博 | 高级检索  
     检索      

若干评价准则对不平衡数据学习的影响
引用本文:林智勇,郝志峰,杨晓伟.若干评价准则对不平衡数据学习的影响[J].华南理工大学学报(自然科学版),2010,38(4).
作者姓名:林智勇  郝志峰  杨晓伟
作者单位:1. 华南理工大学,计算机科学与工程学院,广东,广州,510640
2. 广东工业大学,应用数学学院,广东,广州,510006
3. 华南理工大学,理学院,广东,广州,510640
基金项目:广东省教育部产学研结合项目,广东高校优秀青年创新人才培育项目 
摘    要:为解决绝大部分传统的以精度准则为优化目标而获得的分类器不适于不平衡数据学习(IDL)的问题,文中通过在支持向量机(SVM)模型上进行"元学习",研究了精度、平衡精度、几何平均、F1得分、信息增益、AUC(ROC曲线下方图面积)以及文中新提出的GAF和GBF等评价准则对IDL的影响.在16个来自UCI的不平衡数据集上进行了仿真实验.对实验结果的统计分析表明:不同准则对分类器性能的影响有显著差异;即便是对于先进的学习方法支持向量机(SVM)而言,若以精度准则最大化选择分类器,那么得到的SVM分类器也容易偏向预测多类;通过在其他准则上优化,能输出纠偏了的SVM分类器,它们的整体性能更好,尤其是在预测少类能力方面;在GAF以及GBF准则上优化所得的SVM分类器具有稳定且良好的性能.

关 键 词:评价准则  不平衡数据学习  支持向量机  GAF准则  GBF准则  
收稿时间:2009-3-12
修稿时间:2009-9-1

Effects of Several Evaluation Metrics on Imbalanced Data Learning
Lin Zhi-yong,Hao Zhi-feng,Yang Xiao-wei.Effects of Several Evaluation Metrics on Imbalanced Data Learning[J].Journal of South China University of Technology(Natural Science Edition),2010,38(4).
Authors:Lin Zhi-yong  Hao Zhi-feng  Yang Xiao-wei
Abstract:
Keywords:evaluation metric  imbalanced data learning  support vector machine  GAF metric  GBF metric
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《华南理工大学学报(自然科学版)》浏览原始摘要信息
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号