基于多核支持向量机的句子分类算法 |
| |
引用本文: | 肖开研,廉洁.基于多核支持向量机的句子分类算法[J].华东师范大学学报(自然科学版),2023(6):85-94. |
| |
作者姓名: | 肖开研 廉洁 |
| |
作者单位: | 上海师范大学信息与机电工程学院 |
| |
基金项目: | 上海市自然科学基金(20ZR1440900); |
| |
摘 要: | 主流句子分类算法采用单一词向量表示模型获得文本表示,导致了对文本的映射能力不足.对此,通过融合多种词向量的文本表示以提高分类的准确率.针对多核学习在融合不同核函数时,常规的核函数系数寻优方法存在的训练时间长、难以求得局部最优解等问题,提出了一种新的核函数系数寻优方法,该方法基于参数空间分割与广度优先搜索不断逼近核系数的最优值.以支持向量机(support vector machine,SVM)为分类器,在7个文本数据集上进行了分类实验.实验结果表明,多核学习分类效果明显优于单核学习,并且所提出的寻优方法在训练次数少于常规方法时也能获得了好的分类效果.
|
关 键 词: | 自然语言处理 句子分类 多核学习 支持向量机 混合核 |
|
|