首页 | 本学科首页   官方微博 | 高级检索  
     检索      

结合ODF和辨识集的特征选择
引用本文:朱颢东,周姝,钟勇.结合ODF和辨识集的特征选择[J].重庆邮电学院学报(自然科学版),2010(1).
作者姓名:朱颢东  周姝  钟勇
作者单位:中国科学院成都计算机应用研究所;中国科学院研究生院;
基金项目:四川省科技计划项目(2008GZ0003);;四川省科技厅科技攻关项目(07GG006-014)
摘    要:在中文文本分类中,由于中文词条总数较高,限制了中文文本分类算法的选择空间。特征选择是文本分类的一个核心研究课题。提出了一个优化的文档频(optimal document frequency,ODF),再结合粗糙集提出了一个新的基于辨识集的属性约简算法,最后把该属性约简算法同优化的ODF结合起来,提出了一个综合的特征选择方法。该综合选择方法首先使用优化的ODF进行特征初选以过滤掉一些词条来降低特征空间的稀疏性,然后再利用所提出的属性约简算法消除冗余,从而获得较具代表性的特征子集。实验结果表明该方法有较好的准确率和召回率。

关 键 词:特征选择  文档频  粗糙集  辨识集  属性约简  

Feature selection combined ODF with discernible sets
ZHU Hao-dong,ZHOU Shu,ZHONG Yong.Feature selection combined ODF with discernible sets[J].Journal of Chongqing University of Posts and Telecommunications(Natural Sciences Edition),2010(1).
Authors:ZHU Hao-dong    ZHOU Shu  ZHONG Yong
Institution:1.Chengdu Institute of Computer Application;Chinese Academy of Sciences;Chengdu 610041;P.R.China;2.Graduate School;Beijing 100039;P.R.China
Abstract:In Chinese text categorization,the selection space of Chinese text categorization algorithm is restricted due to the high quantity of Chinese entries.Feature selection is the core research topic in text categorization.This paper firstly presents an optimal document frequency(ODF),and introduces rough sets and a new attributes reduction algorithm based on discernible sets.Finally,combining the attribute reduction algorithm with the ODF,the paper proposes a comprehensive feature selection method.The comprehen...
Keywords:feature selection  document frequency  rough set  discernible set  attribute reduction  
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号