首页 | 本学科首页   官方微博 | 高级检索  
     

国家社科基金学科类别自动判定模型构建研究
引用本文:沈思,翁小颖,孙豪,王东波. 国家社科基金学科类别自动判定模型构建研究[J]. 湖南大学学报(自然科学版), 2020, 47(4): 118-124. DOI: 10.16339/j.cnki.hdxbzkb.2020.04.015
作者姓名:沈思  翁小颖  孙豪  王东波
作者单位:南京理工大学 经济管理学院,南京 210094,南京理工大学 经济管理学院,南京 210094,南京理工大学 经济管理学院,南京 210094,南京农业大学信息科学学院,南京 210095
基金项目:江苏省自然科学基金;国家自然科学基金;国家社会科学基金
摘    要:在把所获取的国家社科基金项目标题按照词表示成训练和测试语料的基础上,基于条件随机场模型和双向长短时记忆模型对所构建的国家社科基金项目学科类别判定模型,进行了多个角度和层面的验证,并与支持向量机模型的实验结果进行对比.基于相应的模型性能评价指标,验证了传统机器学习模型在小规模语料上的整体性能,证明增加了人工特征模型后的条件随机场模型的整体性能并未突出,同时对条件随机场的性能进行个案分析.

关 键 词:机器学习  条件随机场模型  国家社科基金  文本挖掘

Research on Automatic Determination Model Construction ofSubject Classification of National Social Science Foundation
SHEN Si,WENG Xiaoying,SUN Hao,WANG Dongbo. Research on Automatic Determination Model Construction ofSubject Classification of National Social Science Foundation[J]. Journal of Hunan University(Naturnal Science), 2020, 47(4): 118-124. DOI: 10.16339/j.cnki.hdxbzkb.2020.04.015
Authors:SHEN Si  WENG Xiaoying  SUN Hao  WANG Dongbo
Abstract:The words of National Social Science Foundation (NSSF) titles are expressed into the train and test corpus. And then, the category determination model of the NSSF project by using the conditional random field model and the bidirectional short and long time memory model is verified from many angles and levels. The results are compared with the experimental results of the support vector machine model. Based on the corresponding model performance evaluation indexes, this paper not only verifies the overall performance of the traditional machine learning model on the small-scale corpus, but also proves that the overall performance of the conditional random field model with the artificial feature model is not certain to be outstanding, meanwhile, the performance of the conditional random field model is analyzed in a case.
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《湖南大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《湖南大学学报(自然科学版)》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号