首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于改进TextRank的铁路文献关键词抽取算法
引用本文:赵占芳,刘鹏鹏,李雪山.基于改进TextRank的铁路文献关键词抽取算法[J].北京交通大学学报(自然科学版),2021,45(2):80-86.
作者姓名:赵占芳  刘鹏鹏  李雪山
作者单位:河北地质大学信息工程学院,石家庄050031;河北省光电信息与地球探测技术重点实验室,石家庄050031;河北地质大学信息工程学院,石家庄050031;中国铁道科学研究院科学技术信息研究所,北京100081
摘    要:实现铁路行业海量的铁路科技信息资源有效地组织管理并提供智能化、专业化的检索和服务,已经成为科研人员迫切期望解决的问题.关键词自动抽取技术是实现信息的智能检索和标引分类的核心技术,本文提出了一种改进TextRank的关键词抽取算法应用于铁路文献关键词的抽取,该算法融合多个特征因素改进词汇节点的初始权重设置,并利用Word2Vec训练的词向量表征改进词节点间的转移概率.实验结果表明:本文所提出的关键词抽取算法相对于经典的TextRank和TF-IDF算法在准确率,召回率以及F值上都有较大的提升.与TextRank相比,F值提升了13.9%.

关 键 词:抽取  Word2Vec模型  TextRank算法

Keywords extraction algorithm of railway literature based on improved TextRank
ZHAO Zhanfang,LIU Pengpeng,LI Xueshan.Keywords extraction algorithm of railway literature based on improved TextRank[J].JOURNAL OF BEIJING JIAOTONG UNIVERSITY,2021,45(2):80-86.
Authors:ZHAO Zhanfang  LIU Pengpeng  LI Xueshan
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号