首页 | 本学科首页   官方微博 | 高级检索  
     

基于LDA模型的高校论坛热点提取系统
作者单位:;1.北京邮电大学网络技术研究院信息网络中心;2.通信网信息传输与分发技术重点实验室
摘    要:针对论坛缺乏热点话题提取方法的现状,提出一种将LDA(潜在狄利克雷分配)模型引入高校论坛场景主题的提取方式.在主题建模过程中,以回帖数量作为帖子热门程度的判定参数,根据帖子热门程度在语料中设置不同权重,随后使用Gibbs采样法提取主题.在此基础上设计并实现了包含数据抓取、文本预处理、主题提取三个模块的完整系统.将LDA模型引入系统并进行提取效果分析,实验结果表明LDA模型可以准确地提取出论坛文本中讨论的实时热点话题.

关 键 词:机器学习  潜在狄利克雷分配  主题模型  网络舆情  数据挖掘  高校论坛

The hot topics extraction system of college forum based on LDA model
Abstract:
Keywords:
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号