首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于特征贡献度的特征选择方法在文本分类中应用
引用本文:孟佳娜,林鸿飞,李彦鹏.基于特征贡献度的特征选择方法在文本分类中应用[J].大连理工大学学报,2011,51(4):611-615.
作者姓名:孟佳娜  林鸿飞  李彦鹏
作者单位:1. 大连理工大学计算机科学与工程系,辽宁大连116024 大连民族学院理学院,辽宁大连116600
2. 大连理工大学计算机科学与工程系,辽宁大连,116024
基金项目:国家自然科学基金资助项目(60973068,61002039); 高等学校博士学科点专项科研基金资助项目(20090041110002); 中央高校自主科研基金资助项目(DC10040118)
摘    要:在目前的文本分类问题中,特征选择方法被认为是提高分类精度和效率的一种有效方法.提出了一种基于特征贡献度FCD(feature contribution degree)的特征选择方法,本方法将某个特征对于类别之间区分能力的贡献度大小作为该特征被选取的条件,特征对于某一类别的FCD值为特征在该类中出现的文档数与在所有类别中出现的文档数的比值.对该方法进行了实验,并与一些常用的特征选择方法进行了比较,实验结果表明该方法具有更好的分类效果.

关 键 词:文本分类  特征选择  向量空间模型  特征贡献度

Application of feature selection method to text categorization based on feature contribution degree
MENG Jian,LIN Hongfei,LI Yanpeng.Application of feature selection method to text categorization based on feature contribution degree[J].Journal of Dalian University of Technology,2011,51(4):611-615.
Authors:MENG Jian  LIN Hongfei  LI Yanpeng
Institution:MENG Jia-na1,2,LIN Hong-fei1,LI Yan-peng1(1.Department of Computer Science and Engineering,Dalian University of Technology,Dalian 116024,China,2.College of Science,Dalian Nationalities University,Dalian 116600,China)
Abstract:At present,the feature selection method is viewed as an efficient method for improving the accuracy and efficiency of classification in text categorization.A feature selection method based on feature contribution degree(FCD) is proposed.In this method,a feature will be selected according to the contribution degree for differentiating a certain category from others.The FCD of a feature in a particular category is a ratio between the number of documents occurring in a certain category and the number of docume...
Keywords:text categorization  feature selection  vector space model  feature contribution degree  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《大连理工大学学报》浏览原始摘要信息
点击此处可从《大连理工大学学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号