首页 | 本学科首页   官方微博 | 高级检索  
     

文本分类中特征降维方式的研究
引用本文:伍建军,康耀红. 文本分类中特征降维方式的研究[J]. 海南大学学报(自然科学版), 2007, 25(1): 62-66
作者姓名:伍建军  康耀红
作者单位:海南大学,信息科学技术学院,海南,海口,570228;海南大学,信息科学技术学院,海南,海口,570228
摘    要:
首先介绍了几种常见的特征选择和特征抽取方法,并结合K-近邻分类算法对4种特征选择方法进行了分类测试,同时通过测试分析,提出了一些改进的、可行的互信息评价函数.

关 键 词:文本分类  特征降维  特征选择  互信息
文章编号:1004-1729(2007)01-0062-05
修稿时间:2006-05-13

A Study on Feature Dimension Reduction in Text Categorization
WU Jian-jun,KANG Yao-hong. A Study on Feature Dimension Reduction in Text Categorization[J]. Natural Science Journal of Hainan University, 2007, 25(1): 62-66
Authors:WU Jian-jun  KANG Yao-hong
Abstract:
This paper first introduces five methods of feature selection and feature extraction.Second,K-nearest neighbor is selected as an evaluating classifier to compare the performance of the four feature selection methods in TC.From the test result,a new improved method of FS is presented based on mutual information.The experiment results show that it is effective.
Keywords:text categorization  feature reduction  features selection mutual information
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号