首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种组合型中文文本分类特征选择方法
引用本文:刘海峰,王元元,刘守生.一种组合型中文文本分类特征选择方法[J].广西师范大学学报(自然科学版),2007,25(4):208-211.
作者姓名:刘海峰  王元元  刘守生
作者单位:1. 中国人民解放军理工大学指挥自动化学院,江苏,南京,210007;中国人民解放军理工大学理学院,江苏,南京,210007
2. 中国人民解放军理工大学指挥自动化学院,江苏,南京,210007
3. 中国人民解放军理工大学理学院,江苏,南京,210007
基金项目:国家自然科学基金资助项目(70571087)
摘    要:根据基于频数分布和基于互信息的特征选择模式的特点,将传统的tf-idf因子以及基于互信息的特征选择方法分别进行了改进,并在此基础上提出了一种新的组合型特征选择方法。试验结果表明,该算法提高了文本分类的准确率。

关 键 词:特征选择  文本分类  特征权重  互信息
文章编号:1001-6600(2007)04-0208-04
收稿时间:2007-05-20
修稿时间:2007年5月20日

A Combined Feature Selection Method in Chinese Text Classification
LIU Hai-feng,WANG Yuan-yuan,LIU Shou-sheng.A Combined Feature Selection Method in Chinese Text Classification[J].Journal of Guangxi Normal University(Natural Science Edition),2007,25(4):208-211.
Authors:LIU Hai-feng  WANG Yuan-yuan  LIU Shou-sheng
Abstract:Based on the characteristic of feature selection that relates to the frequency distribution and the information,the traditional feature selection method and the MI have been improved,and a new feature selection method is put forward.The experiment shows that this method has improved the precision of the text classification.
Keywords:feature selection  text categorization  feature weight  MI
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号