基于层次聚类的微博敏感话题检测算法研究 |
| |
作者姓名: | 潘大庆 |
| |
作者单位: | 柳州市委党校,广西柳州,545006 |
| |
基金项目: | 广西哲学社会科学课题“基于物联网技术的图书馆服务模式研究”(11BTQ001). |
| |
摘 要: | 针对微博对社会舆情影响力日趋增大,设计了基于层次聚类的微博敏感话题检测算法,通过对微博内容的自动抓取,利用层次聚类算法实现对微博内容的智能识别,并以敏感话题为单位对微博内容进行分类.重点对层次聚类算法的实现过程进行研究,引入了词频、词性等关键参数因子,提高层次聚类算法分类精度.通过测试表明,检测算法的检测分类精度为95.3%,话题误判率不超过6%.
|
关 键 词: | 敏感话题 层次聚类 检测 微博 词频 词性 |
本文献已被 维普 万方数据 等数据库收录! |
|