基于互信息的热点词发现和突发性话题检测研究 |
| |
引用本文: | 翟东海,;王佳君,;聂洪玉,;崔静静.基于互信息的热点词发现和突发性话题检测研究[J].西藏大学学报,2013(4). |
| |
作者姓名: | 翟东海 ;王佳君 ;聂洪玉 ;崔静静 |
| |
作者单位: | [1]西南交通大学信息科学与技术学院 四川成都610031; [2]西藏大学工学院 西藏拉萨850000 |
| |
基金项目: | 2012年度国家语委"十二五"科研规划项目"藏文网络舆情监测的研究",2012年度教育部科学技术研究重点项目"基于动态向量空间模型的藏语突发性热点话题检测与跟踪的研究",2012年度中央高校基本科研业务费专项资金科技创新项目"基于条件随机域的藏语网络敏感话题识别技术研究",2012年度国家级大学生创新创业训练计划项目资助课题"基于动态向量空间模型的热点话题检测系统的设计与实现" |
| |
摘 要: | 针对舆情监测中现存的热点词提取方法精度不高、速度不快的问题,文章采用互信息作为热点词突发性的度量手段,并使用类间离散度作为调节因子来构建热点词的突发性度量公式.在此基础上,构造了改进后的动态突发性向量空间模型,并用于网络中突发性热点话题的发现与追踪.实例验证结果表明,文章提出的改进方法能够获得很好的准确度P、召回率R和F度量.
|
关 键 词: | 互信息 突发性度量 类间离散度 |
Research on Bursty Topic Detection and Hot Word Extraction based on Mutual Information |
| |
Institution: | Zhai Dong-hai[1] Wang Jia-jun[2] Nie Hong-yu[1] Cui Jing-jin[1] |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 维普 等数据库收录! |
|