首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于网格的层次聚类算法
引用本文:姚玉钦,李金广. 一种基于网格的层次聚类算法[J]. 河南师范大学学报(自然科学版), 2009, 37(4)
作者姓名:姚玉钦  李金广
作者单位:安阳工学院,教务处,河南,安阳,455000;安阳工学院,计算机科学与信息工程系,河南,安阳,455000
摘    要:传统的凝聚层次聚类算法的时间复杂度为O(n3),由于时间复杂度太高而无法应用到大的数据集.针对这一问题,提出了一种新的基于网格的层次聚类算法,先用基于网格的方法进行一次微聚类,然后再用凝聚的层次聚类算法进行聚类.在进行凝聚的层次聚类时,提出了一种新的簇间距离度量方法,该方法采用簇中权值最高的代表点的最小距离作为簇间的距离.理论分析和实验结果表明,基于网格的层次聚类算法比传统的凝聚层次算法具有更高的效率和正确性.

关 键 词:数据挖掘  聚类  层次距离  网格聚类

A Grid-based Hierarchical Clustering Algorithm
YAO Yu-qin,LI Jin-guang. A Grid-based Hierarchical Clustering Algorithm[J]. Journal of Henan Normal University(Natural Science), 2009, 37(4)
Authors:YAO Yu-qin  LI Jin-guang
Abstract:A new measure of the distance between clusters is proposed.The new measure method of distance between clusters is the distance between weight highest representative points in every cluster.Extensive experiment demonstrates that Grid-based hierarchical clustering algorithm has higth efficiency and effectiveness of clustering compared with traditional agglomerative hierarchical clustering algorithm.
Keywords:data mining  clustering  hierarchy distance  grid-based clustering
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号