首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于潜在语义空间维度特性的多层文档聚类
引用本文:刘云峰,齐欢,HU Xiang'en,CAI Zhiqiang,代建民.基于潜在语义空间维度特性的多层文档聚类[J].清华大学学报(自然科学版),2005,45(9):1783-1786.
作者姓名:刘云峰  齐欢  HU Xiang'en  CAI Zhiqiang  代建民
作者单位:华中科技大学,系统工程研究所,武汉,430074;Institute of Intelligent Systems,University of Memphis,Tennessee,Memphis,TN 38152,USA
摘    要:为实现文档在不同概念层次下的自动聚类,研究了潜在语义空间中维度的统计特性,发现对应大奇异值的维度描述了语义元素间的共性,对应小奇异值的维度描述了语义元素间的特性,呈现出潜在语义空间维度与概念粒度之间隐含的对应关系.基于这种认识,通过采用不同维度来实现文档在不同概念粒度下的聚类,并获得了很好的聚类准确率.另外,在基于潜在语义分析的文档聚类算法中,采用文档自检索矩阵的行向量,代替低维文档向量作为聚类对象,获得了更好的聚类准确率.

关 键 词:信息处理  潜在语义分析  文档自检索矩阵  文档聚类  概念粒度
文章编号:1000-0054(2005)S1-1783-04
修稿时间:2005年5月20日

Multi-hierarchy documents clustering based on LSA space dimensionality character
LIU Yunfeng,QI Huan,HU Xiang'en,CAI Zhiqiang,DAI Jianmin.Multi-hierarchy documents clustering based on LSA space dimensionality character[J].Journal of Tsinghua University(Science and Technology),2005,45(9):1783-1786.
Authors:LIU Yunfeng  QI Huan  HU Xiang'en  CAI Zhiqiang  DAI Jianmin
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号