首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于信息熵的相对离群点的检测方法:ENBROD
引用本文:于绍越,商琳.基于信息熵的相对离群点的检测方法:ENBROD[J].南京大学学报(自然科学版),2008,44(2):212-218.
作者姓名:于绍越  商琳
作者单位:南京大学计算机软件新技术国家重点实验室,南京大学计算机科学与技术系,南京210093
摘    要:提出一种检测离散属性数据集中相对离群点的算法.目前已有的关于离群点的检测方法大多关注连续属性的数据集,由于离散属性值之间并没有类似于连续属性值之间那样固有的距离度量关系,故不能简单的把用于连续属性数据集的检测算法应用到离散属性数据集中来.本文首先引入了一种新的信息熵增量的概念--去一划分信息熵增量,通过形式化分析得到了其性质.然后,在去一划分信息熵增量的基础上,给出了每个对象所对应的相对离点群因子(ROF)的定义.每个对象的ROF是相对的,因为其只取决于这一对象的邻域.接着,提出了ENBROD算法来实现对ROF的计算.最后,通过实验说明当邻域大小较小时,ENBROD算法可以找到已存在的方法所找不到的相对离群点;而当邻域的大小足够大时,ENBROD算法寻找全局离群点的能力也与其他的一些离群点检测算法的能力相近.

关 键 词:离群点  离散属性  信息熵

An entropy-based algorithm to detect relative outliers:ENBROD
Yu Shao-Yue,Shang Lin.An entropy-based algorithm to detect relative outliers:ENBROD[J].Journal of Nanjing University: Nat Sci Ed,2008,44(2):212-218.
Authors:Yu Shao-Yue  Shang Lin
Abstract:
Keywords:
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号