基于中心抽样的KNN算法在文本分类中的应用 |
| |
引用本文: | 肖绍武,王子牛,高建瓴.基于中心抽样的KNN算法在文本分类中的应用[J].贵州大学学报(自然科学版),2018(1). |
| |
作者姓名: | 肖绍武 王子牛 高建瓴 |
| |
作者单位: | 贵州大学大数据与信息工程学院;贵州大学信息与网络管理中心 |
| |
摘 要: | 文本分类是文本数据挖掘中的一个重要的内容,现阶段文本分类用到的主要算法有KNN,贝叶斯,神经网络等。KNN算法因为原理简单,分类效果较好,在文本分类中得到应用,但在数据量大时其运行效率上存在一定的局限性,本文提出一种基于中心抽样的KNN算法,并用20newsgroup数据集对其进行验证,在不影响准确率的情况下,提高了运行效率,取得了不错的效果。
|
本文献已被 CNKI 等数据库收录! |
|