首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于类别相关性和交叉熵的特征选择方法
引用本文:朱颢东,钟勇.基于类别相关性和交叉熵的特征选择方法[J].郑州大学学报(理学版),2010,42(2).
作者姓名:朱颢东  钟勇
作者单位:中国科学院,成都计算机应用研究所,四川,成都,610041;中国科学院,研究生院,北京,100039
基金项目:四川省科技计划项目,四川省科技厅科技攻关项目
摘    要:文本分类首先要解决的一个问题就是特征选择.简单分析了几种经典的特征选择方法,总结了它们的不足,提出了一个类别相关性方法,把交叉熵引入粗糙集并提出了一个基于交叉熵的属性约简算法,把该属性约简算法同类别相关性方法结合起来,提出了一个综合的特征选择方法.该方法首先利用类别相关性方法进行特征初选以过滤掉一些词条来降低特征空间的稀疏性,然后利用属性约简算法消除冗余,从而获得较具代表性的特征子集.实验结果表明,此特征选择方法效果良好.

关 键 词:文本分类  特征选择  类别相关性  交叉熵  属性约简

Feature Selection Method Based on Category Correlation and Cross Entropy
ZHU Hao-dong , ZHONG Yong.Feature Selection Method Based on Category Correlation and Cross Entropy[J].Journal of Zhengzhou University:Natural Science Edition,2010,42(2).
Authors:ZHU Hao-dong  ZHONG Yong
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号