首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于MapReduce架构的网络热点话题发现
引用本文:徐雅斌,李艳平,郑芬.基于MapReduce架构的网络热点话题发现[J].华中科技大学学报(自然科学版),2012(Z1):236-239.
作者姓名:徐雅斌  李艳平  郑芬
作者单位:北京信息科技大学计算机学院;北京信息科技大学网络文化与数字传播北京市重点实验室
基金项目:北京市教委科研资助项目(SQKM201211232012);网络文化与数字传播北京市重点实验室资助项目(ICDD201106)
摘    要:提出了一种基于开源云计算平台Hadoop的网络热点话题发现方案.该方案采用MapReduce分布式并行计算架构处理海量、复杂数据,通过将命名实体词作为文本的特征项,并采用标题和正文的双向量表示文本.实验结果表明:随着参与并行计算节点数的增加,话题聚类所有的时间显著下降,因而网络热点话题发现的速度得到明显提高.

关 键 词:网络舆情分析  网络热点话题发现  分布式并行计算  MapReduce架构  文本聚类

Internet hot topic founding based on MapReduce architecture
Xu Yabina,b Li Yanpinga,b Zheng Fen.Internet hot topic founding based on MapReduce architecture[J].JOURNAL OF HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY.NATURE SCIENCE,2012(Z1):236-239.
Authors:Xu Yabina  b Li Yanpinga  b Zheng Fen
Institution:a(a School of Computer;b Beijing Key Laboratory of Internet Culture and Digital Dissemination Research,Beijing Information Science and Technology University,Beijing 100101)
Abstract:
Keywords:
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号