基于聚类和局部信息的离群点检测算法 |
| |
作者姓名: | 张强 王春霞 赵健 武龙举 李静永 |
| |
作者单位: | 1. 白城师范学院 计算机科学学院, 吉林 白城 137000;2. 中国科学院 长春光学精密机械与物理研究所, 长春 130033;3. 吉林大学 计算机科学与技术学院, 长春 130012 |
| |
基金项目: | 吉林省科技发展计划重点项目(批准号:20090304) |
| |
摘 要: | 针对目前大部分离群点检测算法未考虑数据的局部信息, 导致离群点检测的准确率低问题, 提出一种新的基于聚类和局部信息的两阶段离群点检测算法. 通过定义新的局部离群因子作为判断数据对象是否为离群点的衡量标准, 改进了传统离群点检测算法的过程. 实验结果表明, 该算法在保持线性复杂度的同时, 能更准确、 有效地挖掘出数据集中的离群点.
|
关 键 词: | 离群点检测 k-means聚类 局部离群因子, |
收稿时间: | 2012-01-18 |
本文献已被 CNKI 等数据库收录! |
| 点击此处可从《吉林大学学报(理学版)》浏览原始摘要信息 |
|
点击此处可从《吉林大学学报(理学版)》下载全文 |
|