首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于多策略的新浪微博大数据抓取及应用
引用本文:孙晓,叶嘉麒,唐陈意,任福继.基于多策略的新浪微博大数据抓取及应用[J].合肥工业大学学报(自然科学版),2014(10):1210-1215.
作者姓名:孙晓  叶嘉麒  唐陈意  任福继
作者单位:合肥工业大学 计算机与信息学院,安徽 合肥,230009
基金项目:国家自然科学基金资助项目(61203315);国家高技术研究发展计划(863计划)资助项目,安徽省科技攻关计划资助项目
摘    要:微博数据处理属于大数据范畴,其前提是获取大量的微博数据,而由于商业利益以及安全方面的考虑,获取微博数据的途径越来越少。同时随着新浪官方API的逐步更新,数据获取的限制也日益增加。文章尝试利用现有资源,基于多策略获取机制,设计出可稳定获得新浪微博数据的挖掘方案,并给出情感分析应用实例。实验表明,所设计的挖掘方案可以根据需要获取微博上的数据,并可以应用于微博情感分析中。

关 键 词:新浪微博API  大数据  数据挖掘  网络爬虫  多策略

Method of Sina microblogging big data grabbing based on multi-strategy and its application
SUN Xiao,YE Jia-qi,TANG Chen-yi,REN Fu-ji.Method of Sina microblogging big data grabbing based on multi-strategy and its application[J].Journal of Hefei University of Technology(Natural Science),2014(10):1210-1215.
Authors:SUN Xiao  YE Jia-qi  TANG Chen-yi  REN Fu-ji
Institution:SUN Xiao;YE Jia-qi;TANG Chen-yi;REN Fu-ji;School of Computer and Information,Hefei University of Technology;
Abstract:
Keywords:Sina microblogging API  big data  data mining  Web crawler  multi-strategy
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号