排序方式: 共有2条查询结果,搜索用时 0 毫秒
1
1.
基于信息熵的相对离群点的检测方法:ENBROD 总被引:3,自引:0,他引:3
提出一种检测离散属性数据集中相对离群点的算法.目前已有的关于离群点的检测方法大多关注连续属性的数据集,由于离散属性值之间并没有类似于连续属性值之间那样固有的距离度量关系,故不能简单的把用于连续属性数据集的检测算法应用到离散属性数据集中来.本文首先引入了一种新的信息熵增量的概念--去一划分信息熵增量,通过形式化分析得到了其性质.然后,在去一划分信息熵增量的基础上,给出了每个对象所对应的相对离点群因子(ROF)的定义.每个对象的ROF是相对的,因为其只取决于这一对象的邻域.接着,提出了ENBROD算法来实现对ROF的计算.最后,通过实验说明当邻域大小较小时,ENBROD算法可以找到已存在的方法所找不到的相对离群点;而当邻域的大小足够大时,ENBROD算法寻找全局离群点的能力也与其他的一些离群点检测算法的能力相近. 相似文献
2.
属性约简是个NP难问题,目前已有很多解决方法,但是每种算法由于其自身的局限性,只适用于特定条件下的求解。蚁群算法是较新的仿生优化算法,在解决各类组合优化问题中都取得了很好的效果。提出一种基于Rough集和蚁群算法的属性约简方法,能够克服传统蚁群算法在前期收敛速度慢的问题,并通过实验验证了该方法的有效性。 相似文献
1