首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于新型聚类算法IncreaseK-Means的Blog相似度分析
引用本文:吴海华,李绍滋,林达真,柯逍,曹冬林.基于新型聚类算法IncreaseK-Means的Blog相似度分析[J].厦门大学学报(自然科学版),2009,48(2).
作者姓名:吴海华  李绍滋  林达真  柯逍  曹冬林
作者单位:厦门大学信息科学与技术学院,福建,厦门,361005
摘    要:针对现有聚类算法K-均值存在事先指定聚类类数及仿射传播存在计算复杂度偏高的缺陷,提出了一种新型的聚类算法Increase K-Means,并将其应用到Blog内容的相似度聚类分析中,较好地满足了社区发现和话题跟踪的需求.仿真结果表明:在Blog文本聚类分析中,Increase K-Means在时间上与K-Means相近,在精度上与仿射传播接近,适用于大规模网络文本的分析处理.

关 键 词:仿射传播  聚类  特征提取

Analyze Blog's Simularity Passing the New Clustering Algorithm Called Increase K-Means
WU Hai-hua,LI Shao-zi,LIN Da-zhen,KE Xiao,CAO Dong-lin.Analyze Blog''s Simularity Passing the New Clustering Algorithm Called Increase K-Means[J].Journal of Xiamen University(Natural Science),2009,48(2).
Authors:WU Hai-hua  LI Shao-zi  LIN Da-zhen  KE Xiao  CAO Dong-lin
Abstract:
Keywords:Increase K-Means  K-Means
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号