首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于相似性的文档聚类算法
引用本文:杨靖涛,王学林,胡于进. 一种基于相似性的文档聚类算法[J]. 华中科技大学学报(自然科学版), 2002, 30(12): 59-61
作者姓名:杨靖涛  王学林  胡于进
作者单位:华中科技大学机械科学与工程学院
摘    要:针对常见信息检索技术的缺陷,提出一种基于相似性的文档聚类分析算法,将文档集合转化为向量集合,基于向量之间的余弦相似度,采取凝聚的层次聚类算法来获得聚类,给出了算法的详细描述的一个测试实例。

关 键 词:相似性 文档聚类算法 聚类分析 最邻近簇 信息检索
文章编号:1671-4512(2002)12-0059-03
修稿时间:2002-07-10

A document clustering algorithm based on similarity
Yang Jingtao Wang Xuelin Hu Yujin. A document clustering algorithm based on similarity[J]. JOURNAL OF HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY.NATURE SCIENCE, 2002, 30(12): 59-61
Authors:Yang Jingtao Wang Xuelin Hu Yujin
Affiliation:Yang Jingtao Wang Xuelin Hu Yujin
Abstract:This paper proposed the algorithm for a document clustering based on similarity to overcome the drawbacks of ordinary information search. A set of documents was converted into a set of vectors. Based on cosine similarity between vectors clusters were obtained by adopting the algorithm for agglomerative hierarchical clustering. The algorithm was described and a test example was offered.
Keywords:cluster analysis  similarity  partitioning  nearest cluster  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号