首页 | 本学科首页   官方微博 | 高级检索  
     

基于LSI和Rough集的文本分类研究
引用本文:赵顺,迟呈英. 基于LSI和Rough集的文本分类研究[J]. 辽宁科技大学学报, 2005, 28(5)
作者姓名:赵顺  迟呈英
作者单位:鞍山科技大学,高等职业技术学院,辽宁,鞍山,114044;鞍山科技大学,计算机科学与工程学院,辽宁,鞍山,114044
摘    要:针对传统的基于VSM的文本分类算法未能考虑到VSM中各特征向量间相互影响关系,构成VSM的词条集合并不能完全、准确地反映文本的内容,分类精度不是很理想的问题,提出了一种基于LSI和Rough集的文本分类方法.在构造VSM的过程中引入了LSI理论,将语义关系体现在VSM中,从而减少了向量空间的维数,然后再运用粗糙集理论中规则推理方法,建立文本分类的规则库,对于任意一个未知文本,只需要将其条件属性与规则库中的规则进行相似匹配,即可完成分类.实验表明,该方法在文本分类的精度和效率方面比传统的基于VSM的文本分类方法均有10%以上的提高.

关 键 词:LSI  Rough集  文本分类

Research on text categorization based on LSI and Rough sets
ZHAO Shun,CHI Cheng-ying. Research on text categorization based on LSI and Rough sets[J]. Journal of University of Science and Technology Liaoning, 2005, 28(5)
Authors:ZHAO Shun  CHI Cheng-ying
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号