首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种简单有效的基于密度的聚类分析算法
引用本文:陈燕俐,洪龙,金达文,朱梧槚.一种简单有效的基于密度的聚类分析算法[J].南京邮电大学学报(自然科学版),2005,25(4):24-29.
作者姓名:陈燕俐  洪龙  金达文  朱梧槚
作者单位:1. 南京邮电大学,计算机科学与技术系,江苏 南京,210003
2. 南京邮电大学,计算机科学与技术系,江苏 南京,210003;南京航空航天大学,信息科学与技术学院,江苏 南京,210016
3. 南京航空航天大学,信息科学与技术学院,江苏 南京,210016
摘    要:对数据挖掘中基于密度聚类的相关概念和算法进行了讨论,对OPTICS(O rdering Pointers to Iden-tify the C lustering Structure)算法聚类分析的正确性给以了证明。以DBSCAN,OPTICS为基础,提出了一种基于密度的简单有效的聚类算法。新算法主要在ε-邻域查询和种子队列的更新两个方面作了改进,给出了一种简单、效率较高的邻域查询方法-哈希表法,即对整个数据集合或部分数据作网格化处理。测试结果表明新算法能够有效地对大规模数据进行聚类,效率较高。

关 键 词:数据挖掘  聚类  距离  密度  邻域查询
文章编号:1000-1972(2005)04-0024-06
修稿时间:2004年9月2日

A Simple and Valid Density-Based Clustering Algorithm
CHEN Yan-li,HONG Long,JIN Da-wen,ZHU Wu-jia.A Simple and Valid Density-Based Clustering Algorithm[J].Journal of Nanjing University of Posts and Telecommunications,2005,25(4):24-29.
Authors:CHEN Yan-li  HONG Long  JIN Da-wen  ZHU Wu-jia
Institution:CHEN Yan-li~1,HONG Long~
Abstract:After discussing the concepts and algorithms of density-based clustering,the correctness of cluster analysis of OPTICS(Ordering Pointers to Identify the Clustering Structure) algorithm is proved.Moreover,a simple and valid density-based clustering algorithm is proposed,which is based on the original DBSCAN and OPTICS.The new algorithm makes improvements on region query and update of seeds queue.A simple and efficient region query method,hash-table method is developed.Experimental results show that the new algorithm is effective and efficient in clustering large-scale data sets.
Keywords:Data Mining  Clustering  Distance  Density  Region Queries  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号