首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于聚类和局部信息的离群点检测算法
引用本文:张强,王春霞,赵健,武龙举,李静永.基于聚类和局部信息的离群点检测算法[J].吉林大学学报(理学版),2012,50(6):1214-1217.
作者姓名:张强  王春霞  赵健  武龙举  李静永
作者单位:1. 白城师范学院 计算机科学学院, 吉林 白城 137000;2. 中国科学院 长春光学精密机械与物理研究所, 长春 130033;3. 吉林大学 计算机科学与技术学院, 长春 130012
基金项目:吉林省科技发展计划重点项目(批准号:20090304)
摘    要:针对目前大部分离群点检测算法未考虑数据的局部信息, 导致离群点检测的准确率低问题, 提出一种新的基于聚类和局部信息的两阶段离群点检测算法. 通过定义新的局部离群因子作为判断数据对象是否为离群点的衡量标准, 改进了传统离群点检测算法的过程. 实验结果表明, 该算法在保持线性复杂度的同时, 能更准确、 有效地挖掘出数据集中的离群点.

关 键 词:离群点检测    k-means聚类    局部离群因子  
收稿时间:2012-01-18

Outlier Detecting Algorithm Based on Clustering and Local Information
ZHANG Qiang,WANG Chun-xia,ZHAO Jian,WU Long-ju,LI Jing-yong.Outlier Detecting Algorithm Based on Clustering and Local Information[J].Journal of Jilin University: Sci Ed,2012,50(6):1214-1217.
Authors:ZHANG Qiang  WANG Chun-xia  ZHAO Jian  WU Long-ju  LI Jing-yong
Institution:1. School of Computer Science, |Baicheng Teachers College, Baicheng 137000, Jilin Province, China;2. Changchun Institute of Optics, Fine Mechanics and Physics, Chinese Academy of Sciences, Changchun 130033, China|3. College of Computer Science and Technology, Jilin University, Changchun 130012, China
Abstract:Most existing outlier detection algorithms ignore localinformation of data sets, they are of low accuracy. We adopted a two phase algorithm based on k-means clustering algorithm, defined a new local stray factor as the standard to judge whether data objects are outliers. We also improved the process of detecting outliers and solved the above problem. Experiments showthat our algorithm overcomes the shortcomings of existing methods, ensure the algorithm has linear time complexity and is able to find outliers in data sets more accurately and effectively.
Keywords:outlier detecting  k-means clustering  local outlier factor  
本文献已被 CNKI 等数据库收录!
点击此处可从《吉林大学学报(理学版)》浏览原始摘要信息
点击此处可从《吉林大学学报(理学版)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号