基于MMR和WordNet的新闻文本摘要生成研究 |
| |
引用本文: | 张琪,范永胜,金独亮.基于MMR和WordNet的新闻文本摘要生成研究[J].西南师范大学学报(自然科学版),2023(5):77-86. |
| |
作者姓名: | 张琪 范永胜 金独亮 |
| |
作者单位: | 重庆师范大学计算机与信息科学学院 |
| |
基金项目: | 教育部人文社会科学研究项目(18XJC880002);;重庆市教育委员会科技项目(KJQN201800539); |
| |
摘 要: | 针对新闻文本摘要提取过程中,传统抽取式算法存在对文本内容概括不全面、摘要内容冗余、关键词提取时未考虑异词同义等问题,提出了一种基于最大边界相关算法(MMR)和词汇语义网(WordNet)的新闻文本摘要生成算法——WMMR.该算法综合考虑文本相似度、关键词、句子位置信息、线索词等特征对句子权重的影响,从而优化MMR算法中的句子得分,并在计算关键词得分时引入WordNet合并同义词.在NLPCC2017公开数据集上验证本文算法的有效性,结果表明WMMR算法的ROUGE值相较于TextRank算法提升4个百分点,相较于MMR算法提升7个百分点.在神策杯2018与SogouCS公开数据集上验证本文算法的普适性,结果表明WMMR算法的ROUGE值相较于传统TextRank,MMR等算法均有提升,证明WMMR算法有效提升了生成摘要的质量.
|
关 键 词: | 新闻文本摘要 抽取式算法 最大边界相关算法 词汇语义网 异词同义 |
|
|