中文文本的特征抽取和分类算法 |
| |
作者单位: | 南京邮电大学吴江职业技术学院计算机系 江苏苏州215200(周剑),江苏广播电视大学现代教育技术中心 江苏南京210036(王晓军),常熟理工学院计算机系 江苏苏州215500(杨明珠) |
| |
摘 要: | 文本分类是根据文本内容自动确定文本类型的过程。介绍现有特征抽取和分类算法,提出用模糊聚类算法FCM确定文本类标签,Boosting算法构造分类器的方法,使文本分类具有更好的分类精度和时效性,以及对未知类标签语料库中文本的自适应性。
|
关 键 词: | 特征抽取 文本分类 FCM算法 Boosting算法 |
本文献已被 CNKI 等数据库收录! |
|