基于LDA模型的高校论坛热点提取系统 |
| |
作者单位: | ;1.北京邮电大学网络技术研究院信息网络中心;2.通信网信息传输与分发技术重点实验室 |
| |
摘 要: | 针对论坛缺乏热点话题提取方法的现状,提出一种将LDA(潜在狄利克雷分配)模型引入高校论坛场景主题的提取方式.在主题建模过程中,以回帖数量作为帖子热门程度的判定参数,根据帖子热门程度在语料中设置不同权重,随后使用Gibbs采样法提取主题.在此基础上设计并实现了包含数据抓取、文本预处理、主题提取三个模块的完整系统.将LDA模型引入系统并进行提取效果分析,实验结果表明LDA模型可以准确地提取出论坛文本中讨论的实时热点话题.
|
关 键 词: | 机器学习 潜在狄利克雷分配 主题模型 网络舆情 数据挖掘 高校论坛 |
The hot topics extraction system of college forum based on LDA model |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 CNKI 等数据库收录! |
|