首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种基于划分的聚类算法分析与改进
引用本文:郭伟,唐晓君,刘万军.一种基于划分的聚类算法分析与改进[J].辽宁工程技术大学学报(自然科学版),2004,23(6):826-828.
作者姓名:郭伟  唐晓君  刘万军
作者单位:1. 辽宁工程技术大学,软件学院,辽宁,阜新,123000
2. 大连轻工业学院,信息工程系,辽宁,大连,116034
摘    要:K-means 是一种基于划分的聚类算法,由于 K-means 算法在选择初始聚类中心时是随机选取 k 个点,因此一旦 k 个点选取不合理,将会误导聚类过程,得到一个不合理的聚类结果。在分析聚类结果对初值依赖性的基础上,对初值选取方法进行了分析和研究,采取“射靶”的原理进行类中心搜索。从实验结果中可以发现,改进后 K-means 得到的聚类结果更加稳定,对初始聚类中心的依赖性减弱了。

关 键 词:数据挖掘  聚类  算法  K-means
文章编号:1008-0562(2004)06-0826-03
修稿时间:2004年12月20

Analysis and improvement based on a partitional clustering algorithm
GUO Wei,TANG Xiao-jun,LIU Wang-jun.Analysis and improvement based on a partitional clustering algorithm[J].Journal of Liaoning Technical University (Natural Science Edition),2004,23(6):826-828.
Authors:GUO Wei  TANG Xiao-jun  LIU Wang-jun
Institution:GUO Wei1,TANG Xiao-jun2,LIU Wang-jun1
Abstract:K-means is a partitioning algorithm,So it is obvious that outputs are especially sensitive to initial starting condition for random selections about K initial starting points,which will lead to bad solutions,so the quality of cluster relies on the initial starting points. This paper, analyses the method of random selection and proposes a method of serching initial starting points through aiming at target many times.It can demonstrate that the improved K-means algorithm can get better solution and is less sensitive to initial starting points.
Keywords:data mining  cluster  algorithm  k-means
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号