面向新闻领域的蒙古文新事件检测方法的研究 |
| |
引用本文: | 王士杰,飞龙,高光来.面向新闻领域的蒙古文新事件检测方法的研究[J].青海师范大学学报(自然科学版),2020,36(1). |
| |
作者姓名: | 王士杰 飞龙 高光来 |
| |
作者单位: | 内蒙古大学 计算机学院 ,内蒙古 呼和浩特市 010021;内蒙古大学 计算机学院 ,内蒙古 呼和浩特市 010021;内蒙古大学 计算机学院 ,内蒙古 呼和浩特市 010021 |
| |
摘 要: | 新事件检测的目标是从一个或多个新闻源中检测出报道一个新闻话题种子事件的第一个新闻.本文面向新闻领域,研究了蒙古文新事件检测的相关方法.提出结合新闻内容相似度与新闻要素相似度进行新事件检测的方法.在新闻内容表示上,针对新闻的特点以及不同类型新闻表达词汇对传统的TF-IDF方法进行了改进.其次,提取出新闻的主要要素,包括时间、地点、主体、客体和主客体动作,计算了两篇新闻文档之间新闻要素的相似度.最后将新闻内容相似度与新闻要素相似度进行融合后进行相似度比较.实验结果表明,本文改进方法明显,性能比传统新事件检测系统有显著提升.
|
关 键 词: | 新事件检测 蒙古文 新闻要素 相似度计算 |
本文献已被 CNKI 万方数据 等数据库收录! |
|