基于矩阵奇异值分解的文本分类算法研究 |
| |
作者姓名: | 景永霞 王治和 苟和平 |
| |
作者单位: | 琼台师范学院信息技术系;西北师范大学计算机科学与工程学院 |
| |
摘 要: | 针对KNN文本分类算法在高维数据集上分类计算开销大、效率低的缺点,采用一种基于矩阵奇异值分解的文本特征向量降维方法实现向量降维的同时保留更多的分类信息.同时,采用信息增益的方式对原始文本特征词进行了初步筛选,过滤掉对分类系统几乎没有贡献的特征词,以克服文本特征维数增长所带来的奇异值分解计算开销过大的缺点.实验表明此方法能在保持分类精度的同时极大地降低分类计算开销.
|
本文献已被 CNKI 等数据库收录! |
|