首页 | 本学科首页   官方微博 | 高级检索  
     检索      

非平衡数据集Fisher线性判别模型
引用本文:谢纪刚,裘正定.非平衡数据集Fisher线性判别模型[J].北京交通大学学报(自然科学版),2006,30(5):15-18.
作者姓名:谢纪刚  裘正定
作者单位:北京交通大学计算机与信息技术学院,北京100044
基金项目:浙江省自然科学基金 , 北京市重点实验室基金
摘    要:非平衡数据是指两类问题中正类样本与负类样本个数不相等,甚至相比悬殊.非平衡数据集会导致许多分类器的性能下降,这与分类器的构造原理有关.本文首先阐述了Fisher线性判别的分类机制,指出当两类样本的协方差矩阵不同时,样本不平衡会导致Fisher线性判别的性能下降.在此基础上,提出了一种加权Fisher线性判别(WFELD),以减小样本不平衡的影响.然后,从UCI中选择了8个非平衡数据集,并采用ROC曲线下面积作为评估指标进行比较,实验结果证明了WFLD模型的有效性.

关 键 词:非平衡数据集  Fisher线性判别  ROC曲线下面积(AUC)  非平衡  数据集  Fisher  线性判别  判别模型  Class  Model  Discriminant  有效性  结果  实验  比较  评估指标  曲线下面积  选择  影响  加权  样本不平衡  协方差矩阵  分类机制
文章编号:1673-0291(2006)05-0015-04
收稿时间:2006-01-16
修稿时间:2006年1月16日

Fisher Linear Discriminant Model with Class Imbalance
XIE Ji-gang,QIU Zheng-ding.Fisher Linear Discriminant Model with Class Imbalance[J].JOURNAL OF BEIJING JIAOTONG UNIVERSITY,2006,30(5):15-18.
Authors:XIE Ji-gang  QIU Zheng-ding
Institution:School of Computer and Information Technology, Beijing Jiaotong University, Beijing 100044, China
Abstract:As the majority of classification methods previously designed usually assume that their training sets are well-balanced,they have to be affected by class imbalance in which examples in training data belonging to one class heavily outnumber the examples in the other class.This paper demonstrates that,when the two sample covariance matrices are not identical,class imbalance has a negative effect on the performance of Fisher linear discriminant(FLD).A weighted FLD(WFLD) is proposed for reducing the negative effects of the class imbalance.Using area under the ROC curve as performance measarement,eight UCI imbalanced data sets are tested to show WFLD's effectiveness.
Keywords:class imbalance  Fisher linear discriminant(FLD)  area under the ROC curve(AUC)  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号