一种改进的文本特征选择方法 |
| |
作者姓名: | 魏海平 |
| |
作者单位: | 辽宁石油化工大学计算机与通信工程学院,抚顺,113001 |
| |
摘 要: | 随着Internet技术的飞速发展,网页上存在着各种各样、类目繁多的信息,因此网页分类技术就显得越来越有意义。本文使用向量空间模型(VSM)来表示网页文本,提出了一种改进X2的文本特征选择方法,最后通过支持向量机方法进行分类。实验结果表明,相对于传统的X2文本分类统计方法,改进后的特征选择方法的分类效果要好于传统的X2统计方法。
|
关 键 词: | 文本分类 特征选择 X2统计 |
收稿时间: | 2012-02-07 |
修稿时间: | 2012-02-07 |
本文献已被 CNKI 万方数据 等数据库收录! |
| 点击此处可从《科学技术与工程》浏览原始摘要信息 |
|
点击此处可从《科学技术与工程》下载免费的PDF全文 |
|