首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于MMR和WordNet的新闻文本摘要生成研究
引用本文:张琪,范永胜,金独亮.基于MMR和WordNet的新闻文本摘要生成研究[J].西南师范大学学报(自然科学版),2023(5):77-86.
作者姓名:张琪  范永胜  金独亮
作者单位:重庆师范大学计算机与信息科学学院
基金项目:教育部人文社会科学研究项目(18XJC880002);;重庆市教育委员会科技项目(KJQN201800539);
摘    要:针对新闻文本摘要提取过程中,传统抽取式算法存在对文本内容概括不全面、摘要内容冗余、关键词提取时未考虑异词同义等问题,提出了一种基于最大边界相关算法(MMR)和词汇语义网(WordNet)的新闻文本摘要生成算法——WMMR.该算法综合考虑文本相似度、关键词、句子位置信息、线索词等特征对句子权重的影响,从而优化MMR算法中的句子得分,并在计算关键词得分时引入WordNet合并同义词.在NLPCC2017公开数据集上验证本文算法的有效性,结果表明WMMR算法的ROUGE值相较于TextRank算法提升4个百分点,相较于MMR算法提升7个百分点.在神策杯2018与SogouCS公开数据集上验证本文算法的普适性,结果表明WMMR算法的ROUGE值相较于传统TextRank,MMR等算法均有提升,证明WMMR算法有效提升了生成摘要的质量.

关 键 词:新闻文本摘要  抽取式算法  最大边界相关算法  词汇语义网  异词同义
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号