首页 | 本学科首页   官方微博 | 高级检索  
     检索      

中文文本分类技术比较研究
引用本文:胡龙茂.中文文本分类技术比较研究[J].安庆师范学院学报(自然科学版),2015(2):49-53.
作者姓名:胡龙茂
作者单位:安徽财贸职业学院,安徽 合肥,230601
摘    要:文本分类中特征选择、权重计算及分类算法三个阶段中都存在一些经典方法,在实际的中文文本分类任务中,如何从各阶段不同方法的组合中找到一个好的组合成为值得研究的问题。比较研究中文文本分类中各阶段经典方法的不同组合对分类效果的影响结果表明:采用CHI特征选择方法、TFIDF权重计算方法及SVM分类方法的组合为最佳组合。

关 键 词:文本分类  特征选择  权重计算  分类算法

A Comparative Study on Chinese Text Categorization Techniques
HU Long-mao.A Comparative Study on Chinese Text Categorization Techniques[J].Journal of Anqing Teachers College(Natural Science Edition),2015(2):49-53.
Authors:HU Long-mao
Abstract:Since there are some classic methods in feature selection, weight calculation and classification algorithms in text categorization, therefore, how to find a good combination becomes a problem worthy of study in the actual Chinese text categoriza-tion task.This paper is a comparative study of different combination of classical methods among three steps in Chinese text catego-rization.It is found that text classification obtained high performance, while using CHI feature selection technique, TFIDF weight calculation technique and SVM classify technique in the test, is an effective combination method.
Keywords:text categorization  feature selection  weight calculation  classifier algorithms
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号