基于因果岭回归的多数据源科研主题识别方法 |
| |
引用本文: | 何增颖,陈建锐,钟足峰.基于因果岭回归的多数据源科研主题识别方法[J].四川大学学报(自然科学版),2018,55(6):1204-1210. |
| |
作者姓名: | 何增颖 陈建锐 钟足峰 |
| |
作者单位: | 岭南师范学院网络与信息技术中心, 湛江 524048,岭南师范学院网络与信息技术中心, 湛江 524048,岭南师范学院商学院, 湛江 524048 |
| |
基金项目: | 广东省科技厅公益研究与能力建设专项资金项目(2015A020219013) |
| |
摘 要: | 为了有效解决多数据源科研主题的识别问题,基于因果岭回归建立了一种新的多数据源科研主题识别方法.该方法首先给出了多数据源科研主题识别关键参数(如主题词的引用权重、状态密度)的评价指标;同时根据科研主题形态特征建立了特征函数,并基于因果岭回归给出了具体识别方法;最后,通过仿真实验深入研究了影响该识别方法的关键因素.结果显示,与朴素贝叶斯、KNN算法和MGe-LDA算法相比较,该方法在价值引用量、引用权重和前沿主题相似度等方面具有较大优势.
|
关 键 词: | 多数据源 科研主题 识别方法 形态特征 因果岭回归 |
收稿时间: | 2017/11/24 0:00:00 |
修稿时间: | 2018/6/13 0:00:00 |
本文献已被 CNKI 等数据库收录! |
| 点击此处可从《四川大学学报(自然科学版)》浏览原始摘要信息 |
| 点击此处可从《四川大学学报(自然科学版)》下载免费的PDF全文 |
|