首页 | 本学科首页   官方微博 | 高级检索  
     检索      

LDA和KNN相结合的帖子热度预测算法
引用本文:王卫姣,陈黎,王亚强,聂恩伦,何建英,金晖,于中华.LDA和KNN相结合的帖子热度预测算法[J].四川大学学报(自然科学版),2014,51(3):467-473.
作者姓名:王卫姣  陈黎  王亚强  聂恩伦  何建英  金晖  于中华
作者单位:四川大学计算机学院;四川大学计算机学院;四川大学计算机学院;四川大学计算机学院;四川大学计算机学院;四川省军区军训办公室;华西第二医院信息管理部
基金项目:浙江省自然科学基金(LY12F02010); 四川大学青年基金(2011SCU11017)
摘    要:随着互联网的快速发展,网络舆情对社会的影响与日俱增.对互联网上网民产生的海量文本内容进行快速准确的分析,以及在此基础上捕捉网络舆情,并对其发展趋势进行预测,对社会经济发展无疑具有重要意义.为此,本文研究了论坛中帖子的热度预测问题,针对现有算法在度量帖子内容相似性时仅仅考虑字面上的相似性,未涉及语义层面,并且未考虑发帖人的特定喜好等不足,提出了LDA(潜在狄利克雷分配)与KNN(K近邻)相结合的热度预测算法,该算法利用LDA挖掘帖子表面文本隐藏的主题信息和用户感兴趣的主题信息,在概念层面上度量帖子之间的相似性,在此基础上基于KNN算法对帖子的热度进行预测.在两组数据集的实验结果表明,所提出的算法在预测准确率方面明显优于相关工作中的方法,平均准确率分别提高了4.34%和2.52%.

关 键 词:网络舆情  潜在狄利克雷分配  K近邻  帖子热度预测  相似性
收稿时间:2013/6/21 0:00:00
本文献已被 CNKI 等数据库收录!
点击此处可从《四川大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《四川大学学报(自然科学版)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号