首页 | 本学科首页   官方微博 | 高级检索  
     

基于层次聚类的微博敏感话题检测算法研究
作者姓名:潘大庆
作者单位:柳州市委党校,广西柳州,545006
基金项目:广西哲学社会科学课题“基于物联网技术的图书馆服务模式研究”(11BTQ001).
摘    要:针对微博对社会舆情影响力日趋增大,设计了基于层次聚类的微博敏感话题检测算法,通过对微博内容的自动抓取,利用层次聚类算法实现对微博内容的智能识别,并以敏感话题为单位对微博内容进行分类.重点对层次聚类算法的实现过程进行研究,引入了词频、词性等关键参数因子,提高层次聚类算法分类精度.通过测试表明,检测算法的检测分类精度为95.3%,话题误判率不超过6%.

关 键 词:敏感话题  层次聚类  检测  微博  词频  词性
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号