基于模糊-粗糙集的文本分类方法 |
| |
引用本文: | 付雪峰,王明文.基于模糊-粗糙集的文本分类方法[J].华南理工大学学报(自然科学版),2004,32(Z1):73-76. |
| |
作者姓名: | 付雪峰 王明文 |
| |
作者单位: | 江西师范大学,计算机信息工程学院,江西,南昌,330027 |
| |
摘 要: | 在文本分类过程中,类别之间的重叠以及标志类别属性的不足会导致类别的边界之间出现模糊不确定性和粗糙不确定性,而传统的k-近邻方法无法解决这一问题;同时,在传统的k-近邻方法以及其他一些改进的k-近邻方法中,最优k值的选取需要通过训练得到.文中借助模糊-粗糙集理论来改进传统的k-近邻方法,并使用基于距离的邻域空间,以不经训练地确定适宜每个待分类文本的k值,最后将所提方法和其他一些k-近邻方法进行了实验比较,结果表明模糊-粗糙集方法能够在一定程度上提高分类的精度和召回率.
|
关 键 词: | 模糊-粗糙集 模糊-粗糙隶属函数 k-近邻方法 文本分类 邻域空间 |
文章编号: | 1000-565X(2004)S-0073-04 |
修稿时间: | 2004年8月30日 |
Text Categorization Method Based on the Theory of Fuzzy-rough Sets |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 万方数据 等数据库收录! |
|