面向主题检索的科技政策扩散识别方法 |
| |
引用本文: | 曾立英,许乾坤,张丽颖,刘耀.面向主题检索的科技政策扩散识别方法[J].郑州大学学报(理学版),2022(5):82-89. |
| |
作者姓名: | 曾立英 许乾坤 张丽颖 刘耀 |
| |
作者单位: | 1. 中央民族大学国际教育学院;2. 中国科学技术信息研究所;3. 河北省工业和信息化厅 |
| |
基金项目: | 国家社会科学基金项目(21BTQ011);;国家重点研发计划项目(2018YFB143502); |
| |
摘 要: | 为满足用户对某一主题下科技政策扩散关系挖掘的分析需求,构建了科技政策扩散识别模型。通过从科技政策文本中提取组织结构相似性特征、语义结构相似性特征、关键词承继性特征及基于Doc2vec的文本相似性特征,实现多个特征的一体化处理;提出了基于识别模型评分的科技政策文本距离计算方法,根据政策间的文本距离与扩散概率的关系,寻找使扩散关系成立的最大文本距离,并将扩散经验值融入识别模型中,实现检索过程中科技政策扩散对和扩散集的自动计算和输出。实验结果表明,所构建的科技政策扩散识别框架能有效地提取出扩散集合。
|
关 键 词: | 科技政策 主题检索 政策扩散 文本挖掘 文本分析 扩散特征 |
|