基于词聚类的跨媒体突发事件检测方法 |
| |
引用本文: | 刘金龙,郭岩,余智华,刘悦,俞晓明,程学旗.基于词聚类的跨媒体突发事件检测方法[J].广西师范大学学报(自然科学版),2019,37(1). |
| |
作者姓名: | 刘金龙 郭岩 余智华 刘悦 俞晓明 程学旗 |
| |
作者单位: | 中国科学院计算技术研究所/中国科学院网络数据科学与技术重点实验室,北京 100190;中国科学院大学,北京 100049;中国科学院计算技术研究所/中国科学院网络数据科学与技术重点实验室,北京,100190 |
| |
基金项目: | 国家重点研发计划;国家重点研发计划;国家重点基础研究发展计划(973计划);国家重点基础研究发展计划(973计划);国家自然科学基金 |
| |
摘 要: | 本文提出一种基于突发词聚类的跨媒体突发事件检测方法。根据事件分析,发现微博具有文本丰富、用户活跃度高、在突发事件检测中具有速度快且高效的特点,但是由于微博文本长度较短,内容过于随意,使得事件发现的结果不够精确。新闻作为官方媒体,其真实性和权威性较高,内容比较规范,事件发现较为准确,但因为新闻数量较少,对于突发事件检测任务来说,时效性较低。现有的方法只针对一种媒体的数据进行挖掘,无法规避掉该媒体的数据所固有的缺点。本文提出一种方法,将微博和新闻2种媒体的数据进行融合,在满足突发事件检测的时效性的同时,提升了突发事件检测的准确率。
|
关 键 词: | 突发事件 检测 跨媒体 词聚类 |
本文献已被 CNKI 万方数据 等数据库收录! |
|