集成显著性话语上下文窗口采样方法的长对话摘要生成模型 |
| |
作者姓名: | 吴杰 王鹏鸣 熊正坤 |
| |
作者单位: | 1.华东交通大学信息工程学院, 南昌 330013;2.温州理工学院数据科学与人工智能学院, 温州 325035 |
| |
基金项目: | 国家自然科学基金;国家自然科学基金;江西省重点研发计划 |
| |
摘 要: | 针对对话语料的特点,提出一种集成显著性话语上下文窗口采样方法的长对话摘要生成模型.该模型分为两个模块:1)显著性话语上下文窗口采样模块将对话话语进行显著性评估,以显著性话语作为采样锚点,然后设置采样窗口,将采样锚点左右相邻的话语一起提取为片段,提取出来的片段包含更丰富的话语关系;2)片段间信息融合摘要生成模块利用 Transformer 块,将相互独立的片段进行信息融合,加强片段之间的语义关系,并且为片段在生成摘要期间分配混合权重.利用一致性损失机制,鼓励显著性话语上下文窗口采样模块确定更佳的采样锚点.在基于查询的长对话摘要公开数据集 QMSum 上的实验结果表明,该模型在ROUGE 评估指标上的分数高于现有最好的模型.
|
关 键 词: | 长对话摘要 窗口采样 显著性话语 信息融合 生成模型 |
本文献已被 万方数据 等数据库收录! |
|