中文文本的特征抽取和分类算法期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

中文文本的特征抽取和分类算法

作者单位：	南京邮电大学吴江职业技术学院计算机系江苏苏州215200(周剑)，江苏广播电视大学现代教育技术中心江苏南京210036(王晓军)，常熟理工学院计算机系江苏苏州215500(杨明珠)

摘要：	文本分类是根据文本内容自动确定文本类型的过程。介绍现有特征抽取和分类算法,提出用模糊聚类算法FCM确定文本类标签,Boosting算法构造分类器的方法,使文本分类具有更好的分类精度和时效性,以及对未知类标签语料库中文本的自适应性。
关键词：	特征抽取文本分类 FCM算法 Boosting算法
本文献已被 CNKI 等数据库收录！