基于知识融合的在线文本分类算法--语义SVM |
| |
引用本文: | 代六玲,李雪梅,黄河燕,陈肇雄.基于知识融合的在线文本分类算法--语义SVM[J].华南理工大学学报(自然科学版),2004,32(Z1):67-72. |
| |
作者姓名: | 代六玲 李雪梅 黄河燕 陈肇雄 |
| |
作者单位: | 1. 南京理工大学,计算机科学系,江苏,南京,210094 2. 北京电子科技学院,电子信息工程系,北京,100070 3. 中国科学院,计算机语言信息工程研究中心,北京,100083 |
| |
基金项目: | 国家自然科学基金资助项目(60272088) |
| |
摘 要: | 为使支持向量机(SVM)更加适用于在线文本分类应用,利用SVM在小训练样本集条件下仍有高泛化能力的特性,结合文本特征向量在特征空间中具有聚类性的特点,提出一种用语义中心集代替原训练样本集作为训练样本和支持向量的SVM语义SVM.文中给出了语义中心集的生成步骤、语义SVM的在线学习算法框架,以及基于SMO算法的在线学习算法的实现.实验结果表明,相对于标准SVM,语义SVM及其在线学习算法不仅在线学习速度和分类速度有数量级提高,而且在分类准确率方面具有一定优势.
|
关 键 词: | 文本分类 支持向量机 语义SVM 在线学习 |
文章编号: | 1000-565X(2004)S-0067-06 |
修稿时间: | 2004年8月29日 |
An On-line Text Categorization Algorithm Based on Information Fusion:Semantic SVM |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 万方数据 等数据库收录! |
|