首页 | 本学科首页   官方微博 | 高级检索  
     

基于微博平台的用户评论数据采集
作者姓名:黄红桃  江盈锋
摘    要:微博的热点事件会产生大量评论数据,这些数据是进行舆情分析和网络水军识别等数据挖掘的基础.论文分析对比常用的网络爬虫技术和框架,分别使用Selenium框架和Json数据接口两种方法,采集新浪微博热点事件下的用户评论数据.一般网络爬虫技术多使用广度搜索,这里采用深度搜索,能够更精确地获得某个热点事件下的用户评论数据.

关 键 词:数据挖掘  微博  用户评论  网络爬虫  Selenium Json
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号