LDA和KNN相结合的帖子热度预测算法 |
| |
引用本文: | 王卫姣,陈黎,王亚强,聂恩伦,何建英,金晖,于中华.LDA和KNN相结合的帖子热度预测算法[J].四川大学学报(自然科学版),2014,51(3):467-473. |
| |
作者姓名: | 王卫姣 陈黎 王亚强 聂恩伦 何建英 金晖 于中华 |
| |
作者单位: | 四川大学计算机学院;四川大学计算机学院;四川大学计算机学院;四川大学计算机学院;四川大学计算机学院;四川省军区军训办公室;华西第二医院信息管理部 |
| |
基金项目: | 浙江省自然科学基金(LY12F02010); 四川大学青年基金(2011SCU11017) |
| |
摘 要: | 随着互联网的快速发展,网络舆情对社会的影响与日俱增.对互联网上网民产生的海量文本内容进行快速准确的分析,以及在此基础上捕捉网络舆情,并对其发展趋势进行预测,对社会经济发展无疑具有重要意义.为此,本文研究了论坛中帖子的热度预测问题,针对现有算法在度量帖子内容相似性时仅仅考虑字面上的相似性,未涉及语义层面,并且未考虑发帖人的特定喜好等不足,提出了LDA(潜在狄利克雷分配)与KNN(K近邻)相结合的热度预测算法,该算法利用LDA挖掘帖子表面文本隐藏的主题信息和用户感兴趣的主题信息,在概念层面上度量帖子之间的相似性,在此基础上基于KNN算法对帖子的热度进行预测.在两组数据集的实验结果表明,所提出的算法在预测准确率方面明显优于相关工作中的方法,平均准确率分别提高了4.34%和2.52%.
|
关 键 词: | 网络舆情 潜在狄利克雷分配 K近邻 帖子热度预测 相似性 |
收稿时间: | 2013/6/21 0:00:00 |
本文献已被 CNKI 等数据库收录! |
| 点击此处可从《四川大学学报(自然科学版)》浏览原始摘要信息 |
| 点击此处可从《四川大学学报(自然科学版)》下载免费的PDF全文 |
|