首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于词覆盖的新闻事件脉络链构建方法
作者姓名:付佳兵  董守斌
作者单位:华南理工大学广东省计算机网络重点实验室, 广州 510640
基金项目:广东省前沿与关键技术创新专项,广东省产学研省部合作专项资金
摘    要:针对目前构建新闻脉络链只关注新闻脉络链的主题相似性和文档重要性, 而忽略新闻脉络链逻辑连贯性和可解释性的不足, 以及新闻数据集合指数级增长带来的算法复杂度问题, 从词覆盖的角度提出一种新闻脉络链构建方法, 利用新闻的评论信息来定位新闻事件转折点, 用主题相似与稀疏差异的思想以及RPCA 方法对文档进行逻辑建模, 利用随机游走以及图遍历的方法, 量化并生成可解释且具有很好逻辑连贯性的脉络链。双盲实验表明, 与其他算法相比, 该方法取得较好的效果。

关 键 词:新闻脉络  词覆盖  可解释  健壮主成分分析  随机游走  
收稿时间:2015-06-19
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《北京大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《北京大学学报(自然科学版)》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号