首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于分布不完整数据选择性分类器
引用本文:陈景年,黄厚宽,杨莉萍,田凤占.基于分布不完整数据选择性分类器[J].北京交通大学学报(自然科学版),2008,32(2):26-29.
作者姓名:陈景年  黄厚宽  杨莉萍  田凤占
作者单位:北京交通大学,计算机与信息技术学院,北京,100044;山东财政学院,信息与计算科学系,济南,250014;北京交通大学,计算机与信息技术学院,北京,100044
摘    要:通过删除数据集中的无关属性和冗余属性构建的选择性分类器可以有效地提高分类精度和效率.由于处理不完整数据的复杂性,已有的选择性分类器大都是针对完整数据的.然而,现实中的数据通常是不完整的并且包含许多冗余属性或无关属性.为解决这一问题,在构建的不完整数据分类器DBNB的基础上给出了一种有效的选择性分类器:SDBNB.在12个标准的不完整数据集上的实验结果显示,SDBNB的分类准确率比分类效果较好的选择性不完整数据分类器SNB和SRBC平均高出0.69%和0.58%,而其标准离差比SNB和SRBC平均低0.11和0.05.这表明SDBNB不仅有较高的分类准确率,而且分类效果更稳定.

关 键 词:数据分类  特征选择  贝叶斯方法  不完整数据
文章编号:1673-0291(2008)02-0026-04
修稿时间:2007年9月26日

Distribution-Based Selective Classifiers for Incomplete Data
CHEN Jingnian,HUANG Houkuan,YANG Liping,TIAN Fengzhan.Distribution-Based Selective Classifiers for Incomplete Data[J].JOURNAL OF BEIJING JIAOTONG UNIVERSITY,2008,32(2):26-29.
Authors:CHEN Jingnian  HUANG Houkuan  YANG Liping  TIAN Fengzhan
Abstract:Selective classifiers are a kind of algorithms that can effectively improve the accuracy and efficiency of classification by deleting irrelevant or redundant attributes of a data set.Due to the complexity of processing incomplete data,however,most of them deal with complete data.Yet actual data are often incomplete and have many redundant or irrelevant attributes.a selective classifier for incomplete data(SDBNB),which is based on a newly constructed Bayes classifier(DBNB),is presented.Experiments results from twelve benchmark incomplete data sets show that the average accuracy of SDBNB is 0.69 percent and 0.58 percent higher than that of the effective selective classifiers: SNB and SRBC.Furthermore,its standard deviation is 0.11 and 0.05 lower than that of SNB and SRBC.This shows that not only SDBNB has higher accuracy,but also performs more stably as well.
Keywords:data classification  feature selection  Bayesian method  incomplete data
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号