首页 | 本学科首页   官方微博 | 高级检索  
     

一种改进的特征选择方法在文本分类系统中的应用
引用本文:李长虹,李堂秋. 一种改进的特征选择方法在文本分类系统中的应用[J]. 厦门大学学报(自然科学版), 2005, 44(Z1): 239-242
作者姓名:李长虹  李堂秋
作者单位:厦门大学软件学院,福建,厦门,361005
摘    要:在介绍文本分类的背景及传统基于向量空间模型特征选择不足之处的同时,提出了不同特征选择方法相结合的文本分类模型.该模型首先对文本进行分析,把文本表示成向量空间的形式.文本在经过预处理后,按一定规则提取关键词的提取中增加了对名词短语的识别.特征选择的方法上,结合了文档频数和互信息量,并对他们进行了改进.实验结果表明,使用新方法进行分类所得到的分类精度得到了一定的提高.关键词,

关 键 词:文本分类  特征选择  文档频数  互信息量
文章编号:0438-0479(2005)Sup-0239-04
修稿时间:2005-03-04

Application of Improved Feature Selection in Text Categorization System
LI Chang-hong,LI Tang-qiu. Application of Improved Feature Selection in Text Categorization System[J]. Journal of Xiamen University(Natural Science), 2005, 44(Z1): 239-242
Authors:LI Chang-hong  LI Tang-qiu
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号