一种改进的特征选取方法 |
| |
引用本文: | 苑俊英,陈海山.一种改进的特征选取方法[J].科技信息,2009(4):172-173. |
| |
作者姓名: | 苑俊英 陈海山 |
| |
作者单位: | 中山大学南方学院;中山大学信息科学与技术学院; |
| |
摘 要: | 从人工分类的角度看,标题、摘要及关键词中的词条对于文本分类具有更重要的作用,在特征选取中低DF值的词条可能更能代表文本的类别信息。针对以上两个问题,本文提出了基于类别核心词的特征选取方法。首先,从标题、摘要及关键词中提取类别核心词;然后。通过加权方式,强化它们在特征选取中的作用;最后在朴素贝叶斯分类方法上进行实验。实验结果表明,提出的方法能够有效提高中文文本的分类准确率。
|
关 键 词: | 特征选取 类别核心词 朴素贝叶斯 文本分类 |
本文献已被 CNKI 维普 等数据库收录! |
|