首页 | 本学科首页   官方微博 | 高级检索  
     

基于改进分类模型的文本分类系统实现
引用本文:吕佳. 基于改进分类模型的文本分类系统实现[J]. 重庆师范大学学报(自然科学版), 2009, 26(2): 79-83
作者姓名:吕佳
作者单位:重庆师范大学,数学与计算机科学学院,运筹学与系统工程重庆市市级重点实验室,重庆,400047
基金项目:重庆市教委科学技术研究项目,运筹学与系统工程重庆市市级重点实验室开放课题 
摘    要:提出一种基于改进的分类模型的文本分类系统来实现文本的自动分类.针对传统的特征提取算法不能很好区分特征词在类内和类间分布情况的缺陷,该系统利用方差对该算法作了改进,用改进的特征提取算法量化各个特征词的权重,为了降低特征向量的维数,采用为每个类建分类器的分类模型,利用遗传算法来修正各个类特征词的权重,直到为每个类训练出能够代表本类的特征向量,最后用这些类的特征向量进行分类.通过在同一数据集上进行对比实验,说明本文提出的改进分类模型的文本分类系统是正确可行的.

关 键 词:文本分类系统  特征词  特征提取算法  分类模型  遗传算法  KNN算法

Realization of Text Classification System Based on Improved Classification Model
LV Jia. Realization of Text Classification System Based on Improved Classification Model[J]. Journal of Chongqing Normal University:Natural Science Edition, 2009, 26(2): 79-83
Authors:LV Jia
Affiliation:Chongqing Key Lab. of Operations Research and System Engineering;College of Mathematics and Computer Science;Chongqing Normal University;Chongqing 400047;China
Abstract:Text classification is to automatically classify an unknown class text into its corresponding text class. With the increasing growth of information, as an important research task in information-processing fields, automatic text classification has nowadays become a research hotspot. A text classification system based on improved classification model presented in this paper is used to realize automatic text classification. The traditional feature selection algorithm doesn't take the distribution of feature te...
Keywords:text classification system  feature term  feature selection algorithm  classification model  genetic algorithm  KNN algorithm  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《重庆师范大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《重庆师范大学学报(自然科学版)》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号