首页 | 本学科首页   官方微博 | 高级检索  
     

基于语句-词条矩阵的聚簇式动态增长聚类算法
引用本文:孙辉,陈晓云,马志新. 基于语句-词条矩阵的聚簇式动态增长聚类算法[J]. 清华大学学报(自然科学版), 2005, 45(9): 1814-1817
作者姓名:孙辉  陈晓云  马志新
作者单位:兰州大学,信息科学与工程学院,兰州,730000
摘    要:Web信息在以指数级的速度增长,然而传统搜索引擎的检索方式难以使用户找到精简而准确的信息.为此该文提出了一种基于语句-词条矩阵的聚簇式动态增长聚类算法.该平面分割的算法的整个工作过程有3个步骤预处理Web数据,进行文本摘取和过滤处理;形成每个文档的语句-词条矩阵,构成若干文档的矩阵集合;通过聚簇式动态增长聚类算法,对相似文档进行聚类.对该算法进行了实验分析.结果表明,该算法在保持文档语义联系的同时,其对文档的聚类有较高的准确性.

关 键 词:文档聚类  词频和反向词频  语句-词条矩阵  文档矩阵集合
文章编号:1000-0054(2005)S1-1814-04
修稿时间:2005-05-20

Clustering-dynamic-growing clustering algorithm based on sentence-words matrix
SUN Hui,CHEN Xiaoyun,MA Zhixin. Clustering-dynamic-growing clustering algorithm based on sentence-words matrix[J]. Journal of Tsinghua University(Science and Technology), 2005, 45(9): 1814-1817
Authors:SUN Hui  CHEN Xiaoyun  MA Zhixin
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号