首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于离散核支持向量机的文本自动分类
引用本文:傅鹏,张德运.基于离散核支持向量机的文本自动分类[J].清华大学学报(自然科学版),2005,45(9):1778-1782.
作者姓名:傅鹏  张德运
作者单位:西安交通大学,电子与信息工程学院,西安,710049;西安交通大学,电子与信息工程学院,西安,710049
基金项目:国家"八六三"高技术项目(2003AAl48010)
摘    要:传统基于向量空间模型的文本分类方法需要对文档进行预处理,同时也会损失很多有用的信息.该文提出一种基于离散核支持向量机的文本分类方法,直接根据文档的字符序列构造离散核,用于支持向量机分类算法,比较文档之间的相似性,从而改善文本分类的效果.证明了离散核支持向量机方法的时间复杂度与文本的长度成O(n)关系.在Reuters-21578文档集上将离散核方法与多项式核、高斯核方法进行比较,实验结果表明该文所提方法在简化分类方法的同时也可以提高分类的精度.

关 键 词:信息处理  支持向量机  离散核  文本分类  向量空间模型
文章编号:1000-0054(2005)S1-1778-05
修稿时间:2005年5月20日

Automatic text categorization with discrete kernel-based support vector machine
FU Peng,ZHANG Deyun.Automatic text categorization with discrete kernel-based support vector machine[J].Journal of Tsinghua University(Science and Technology),2005,45(9):1778-1782.
Authors:FU Peng  ZHANG Deyun
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号