首页 | 本学科首页   官方微博 | 高级检索  
     

基于事件异构图表示的文本去重算法
引用本文:艾玮,许佳,谢灿豪,孟涛 ?. 基于事件异构图表示的文本去重算法[J]. 湖南大学学报(自然科学版), 2023, 0(2): 74-85
作者姓名:艾玮  许佳  谢灿豪  孟涛 ?
作者单位:(中南林业科技大学 计算机与信息工程学院,湖南 长沙 410018)
摘    要:基于图结构的文本表示方法在新闻文本去重中具有更好的效果.但是,目前该表示方法还不能完整地表示文本的全部信息,并且忽略了图的语义信息,降低了新闻文本的去重效果.为此,本研究提出基于事件异构图表示的文本去重算法,该算法首先通过事件异构图表示新闻文本的全局语义与结构信息,然后提出双标签图核算法表征事件异构图,实现深度表征图的结构及语义信息.实验结果表明,该研究提出的去重算法比现有的基于图结构的文本表示去重方法在F1-score指标上提升了10%.最后,该算法能提高新闻文本的去重效果.

关 键 词:图核算法;事件异构图;新闻文本;文本表示;文本去重

Text Deduplication Algorithm Based on Event Heterogeneous Graph Representation
AI Wei,XU Ji,XIE Canhao,MENG Tao?. Text Deduplication Algorithm Based on Event Heterogeneous Graph Representation[J]. Journal of Hunan University(Naturnal Science), 2023, 0(2): 74-85
Authors:AI Wei  XU Ji  XIE Canhao  MENG Tao?
Abstract:
Keywords:
点击此处可从《湖南大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《湖南大学学报(自然科学版)》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号