首页 | 本学科首页   官方微博 | 高级检索  
     检索      

文本分类实现技术
引用本文:王灏,黄厚宽,田盛丰.文本分类实现技术[J].广西师范大学学报(自然科学版),2003(1).
作者姓名:王灏  黄厚宽  田盛丰
作者单位:北方交通大学计算机与信息技术学院,北方交通大学计算机与信息技术学院,北方交通大学计算机与信息技术学院 北京100044,北京100044,北京100044
基金项目:铁路数据中心体系结构的研究与设计(2002X039)
摘    要:文本分类是文本数据挖掘的重要技术.从文本分类实现过程的各个环节,包括建立文档模型、特征提取、维数约简、选择分类策略几个方面分别给出了目前实用的解决方案,同时对各种算法进行了分类和性能上的定性与定量的比较,最后讨论了国内文本分类研究中的一些问题和未来的发展.

关 键 词:文本分类  特征提取  维数约简  向量空间模型  相似度  组合模型

AN OVERVIEW OF TEXT CATEGORIZATION TECHNIQUES
Abstract:
Keywords:text categorization  feature selection  dimensionality reduction  vector space model (VSM)  similarity  combination model
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号