首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于STC的中文文本聚类算法
引用本文:王国强[],郑海清[],牛军钰[].基于STC的中文文本聚类算法[J].上海师范大学学报(自然科学版),2006,35(5):21-26.
作者姓名:王国强[]  郑海清[]  牛军钰[]
作者单位:1. 上海市杨浦区业余大学,上海,200092
2. 复旦大学计算机科学与工程系,上海,200433
摘    要:提出了一种文档聚类方法,对用户的检索结果中类似的文档进行聚类,提供目录结构,辅助用户浏览检索结果.首先分析了现有的文本聚类方法,讨论了它们的优势和不足,然后提出了基于后缀树的中文文本聚类算法,并详细描述了该算法的原理和构造使用过程,及在算法实现的过程中遇到的关键问题及解决方案.

关 键 词:后缀树  文本聚类  文本处理
文章编号:1000-5137(2006)05-0021-06
收稿时间:2006-05-20
修稿时间:2006-05-20

An STC-based Chinese text clustering method
WABG Guo-qiang , ZHENG Hai-qing, NIU Jun-yu.An STC-based Chinese text clustering method[J].Journal of Shanghai Normal University(Natural Sciences),2006,35(5):21-26.
Authors:WABG Guo-qiang  ZHENG Hai-qing  NIU Jun-yu
Abstract:This article proposes a document clustering method,which chisteres the result of the user's search,gives the directory structure of those results and helpes the user to explore the results.The article first analyzes the classical text clustering algo- rithms,and points out their advantages and disadvantages.A suffix-tree based Chinese text clustering method is proposed and discusses the main idea and the construction of this algorithm.Then some problems of the realization are discussed and the corre- sponding solution is given.
Keywords:suffix tree clustering  text clustering  text processing
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《上海师范大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《上海师范大学学报(自然科学版)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号