用于文本挖掘的特征选择方法TFIDF及其改进 |
| |
引用本文: | 景丽萍,黄厚宽,石洪波. 用于文本挖掘的特征选择方法TFIDF及其改进[J]. 广西师范大学学报(自然科学版), 2003, 0(1) |
| |
作者姓名: | 景丽萍 黄厚宽 石洪波 |
| |
作者单位: | 北方交通大学计算机科学与技术学院,北方交通大学计算机科学与技术学院,北方交通大学计算机科学与技术学院 北京100044,北京100044,北京100044 |
| |
基金项目: | 铁路数据中心体系结构的研究与设计基金资助(2002X039) |
| |
摘 要: | 文章使用TFIDF特征选择方法对数据源进行预处理,建立了空间矢量模型,为文本分类提供了便利的数据结构.通过分类结果测试该特征选择方法的精确度.根据实验结果分析TFIDF的优缺点,并提出改进的方法.
|
关 键 词: | 文本挖掘 TFIDF 评估函数 空间矢量模型 特征选择 |
FEATURE SELECTION METHOD TFIDF IN TEXT MINING AND IMPROVEMENT |
| |
Abstract: | |
| |
Keywords: | text mining TFIDF evaluation function SVM model feature selection |
本文献已被 CNKI 等数据库收录! |