基于ESVM的科技政策文本标签分类研究 |
| |
引用本文: | 吴峰,李银生,聂永川,范通让,赵文彬,张博. 基于ESVM的科技政策文本标签分类研究[J]. 河北省科学院学报, 2018, 0(1): 1-10 |
| |
作者姓名: | 吴峰 李银生 聂永川 范通让 赵文彬 张博 |
| |
作者单位: | 河北省科学技术情报研究院河北省科技信息处理实验室;石家庄铁道大学信息科学与技术学院 |
| |
摘 要: | 文本标签作为一种文本关键词,能够简化科技政策中有效信息的挖掘。本文从科技政策类别角度,将标签类别分为科技投入、知识产权、农村科技和税收四类,针对传统SVM算法的缺点和标签数据不平衡的缺点,结合欧式距离思想,提出一种带有惩罚因子的ESVM科技政策文本标签分类方法。最后,对比SVM和ESVM两种分类方法,验证了本文方法在处理科技政策文本标签数据上的有效性。
|
关 键 词: | 文本标签分类 科技政策 SVM 不平衡数据 |
Research on text label classification of science and technology policy based on ESVM |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 CNKI 等数据库收录! |
|