首页 | 本学科首页   官方微博 | 高级检索  
     

一个近似的线性时间聚类算法
引用本文:孙军华. 一个近似的线性时间聚类算法[J]. 广西师范学院学报(自然科学版), 2005, 22(3): 80-84
作者姓名:孙军华
作者单位:江苏广播电视大学信息工程学院,江苏南京210036
摘    要:聚类分析是数据挖掘的一个重要研究方向,而PAM算法是聚类算法中一个重要的方法.本文针对PAM算法不适应大数据集的缺点,给出一个近似的线性时间聚类算法(ALCM),并且从理论上证明了该算法复杂度为关于数据集个数的线性时间复杂度.通过比较实验表明:1)随着数据个数的增大,PAM所花费的时间将激剧增大,而ALCM花费时间与数据集个数呈近似线性增长的关系,即ALCM是适应大数据集的.2)PAM算法和AL-CM算法随数据个数增大,二者的代价函数并无明显差异.

关 键 词:聚类分析  线性时间  算法  数据挖掘
文章编号:1002-8743(2005)03-0080-05
收稿时间:2005-06-08
修稿时间:2005-06-08

An Approximated Linear Clustering Method
SUN Jun-hua. An Approximated Linear Clustering Method[J]. Journal of Guangxi Teachers Education University:Natural Science Edition, 2005, 22(3): 80-84
Authors:SUN Jun-hua
Abstract:Cluster is an important research direction and the PAM algorithm is one of the most important method.But the PAM can work well with large data set.To solve the problem,this paper shows an Approximated Linear Clustering Method(ALCM),and proves that the complexity of the new algorithm is O(n),where n is the number of data set.The comparing experiment shows that the performance of ALCM method is higher than the PAM with large data set,and it is not obviously different between two methods about the value of Cost function.
Keywords:cluster   linear time   algorithm   data mining
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号