基于k-近邻方法的渐进式中文文本分类技术 |
| |
引用本文: | 袁方,杨柳,张红霞. 基于k-近邻方法的渐进式中文文本分类技术[J]. 华南理工大学学报(自然科学版), 2004, 32(Z1): 88-91 |
| |
作者姓名: | 袁方 杨柳 张红霞 |
| |
作者单位: | 1. 东北大学信息科学与工程学院,辽宁,沈阳,110004 2. 河北大学,数学与计算机学院,河北,保定,071002 3. 保定金融高等专科学校,计算机系,河北,保定,071000 |
| |
基金项目: | 河北省自然科学基金资助项目(200400129) |
| |
摘 要: | 针对k-近邻方法分类准确率较高、但分类效率较低的特性,提出了一种基于k近邻方法的渐进式中文文本分类技术,利用文本的标题、摘要、关键词、重点段落进行渐进式的分类处理.这样,不用分析全文就能将部分待分类文本成功分类,从而提高了文本分类的效率.实验结果表明,该方法在保证分类准确率的基础上能够有效地提高分类效率.
|
关 键 词: | k-近邻方法 渐进式方法 中文文本分类 |
文章编号: | 1000-565X(2004)S-0088-04 |
修稿时间: | 2004-08-29 |
A Gradual Chinese Text Classification Technology Based on the k-nearest Neighbor Method |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 万方数据 等数据库收录! |
|