首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 437 毫秒
1.
研究的方向是让人们在看微博的同时,可以通过微博来实现监控指定地点。监控系统是以树莓派为核心,安装树莓派官方摄像头,通过调用新浪微博API,模拟登陆自己注册的微博帐号,将新浪微博作为客户端来实现监控,另外,还将该微博账号设计成微博机器人,实现自动回复评论,并能监控树莓派CPU温度以及网络连接情况,在指定时间发布微博。  相似文献   

2.
微博正逐步成为公共信息传播的主要媒体,高效地获取微博数据则显得至关重要,分析微博数据有助于研究者及时了解舆情信息.由于传统网页爬虫无法获取完整的微博信息,微博API又有诸多限制,因此针对新浪微博,设计了一种基于P2P技术的微博爬虫系统.该系统避免了新浪API的功能和连接限制,使用基于模拟登录的网页爬虫,根据用户的地理位置信息划分任务,实现连续高效的数据采集.通过与其他架构的试验比较,证明本系统具有良好的性能,能为舆情分析提供数据支持.  相似文献   

3.
微博数据处理属于大数据范畴,其前提是获取大量的微博数据,而由于商业利益以及安全方面的考虑,获取微博数据的途径越来越少。同时随着新浪官方API的逐步更新,数据获取的限制也日益增加。文章尝试利用现有资源,基于多策略获取机制,设计出可稳定获得新浪微博数据的挖掘方案,并给出情感分析应用实例。实验表明,所设计的挖掘方案可以根据需要获取微博上的数据,并可以应用于微博情感分析中。  相似文献   

4.
分析了微博短文本的专有特征,介绍了微博短文本的预处理流程.以新浪微博为网络舆情数据获取平台,简述了微博文本分类处理实现过程,基于Hadoop进行了网络舆情微博分类设计,为网络舆情监控任务的完成做数据依据.  相似文献   

5.
针对社交网络用户个人信息难以获取、公开信息不完整、不通用甚至内容虚假的问题,选择了普适性强,且能客观、真实反映用户行为习惯的位置数据作为相似性分析依据,对新浪微博、滴滴打车进行位置数据采集,形成两个高价值且具有国内网民特色的数据集作为实验对象.提出了一种基于时间滑动窗口模型的轨迹相似性匹配算法,通过调整时间窗口和位置距离优化算法F值,实现不同网络平台用户的相似性分析.以对新浪微博和滴滴打车的用户位置数据为例进行验证,实验结果证明了地理位置为虚拟身份相似性判断的正相关影响因子,且判断相似性的平均F值超过90%.   相似文献   

6.
微博正逐步成为公共信息传播的主要社交媒体,高效地获取微博数据对于网络舆情分析具有重要意义。以新浪微博为研究对象,研究了通过微博API、模拟登录和构造访客Cookie进行数据采集的3种方案,提出了一种多策略融合的微博数据采集方案。针对模拟登录的方案设计实现了自适应的并发采集算法,使数据采集较为稳定高效;针对构造访客Cookie的方案设计实现了高可用代理池模块,进一步提高了数据采集效率。实验结果表明,基于模拟登录的自适应并发采集策略和构造访客Cookie融合的方案能够高效、全面、稳定地获取微博数据。  相似文献   

7.
新浪微博数据挖掘方案   总被引:27,自引:0,他引:27  
随着新浪微博用户群体的增长,新浪微博的数据获取是微博研究首先需要解决的问题。该文提出了基于新浪微博API与基于页面解析的新浪微博数据获取方案。程序逻辑控制API调用方法与频率,获取JSON对象并解析实现高效数据获取。同时将传统的网络爬虫结合网页解析技术结合API同时使用,解决了因API接口开放不完善,且因在返回结果数量上限与调用频率方面的限制,导致不能有效实现新浪微博数据的全面获取的问题。经过实验测试,通过2套方案的结合可以实现新浪微博数据高效全面的获取。  相似文献   

8.
近日,新浪微博与中网(knet.cn)的“可信网站”验证合作正式上线。今后网站通过中网“可信网站”验证后.如果选择开通新浪官方微博,可以快速获得机构认证,实现一次认证跨平台应用。目前,新浪微博的注册用户已突破3亿。中网与新浪微博建立合作后.通过中网“可信网站”验证网站,在开通新浪官方微博的同时可以获得新浪微博机构认证实现了一次认证全网通用,  相似文献   

9.
2013年4月29日晚,阿里巴巴战略投资新浪微博一事正式宣布.阿里巴巴将以5.86亿美元占新浪微博稀释后股权的18%,以此计算,新浪微博估值达到32亿美元. 这是一个很老练的时间点,因为正好在美国周末闭市之后、周一开市之前,预计将会更好更稳地提升新浪股价.有分析师预计,新浪在此事之后的首个交易日会涨到62美元左右,结合目前其50美元的股价,上涨幅度约为20%.  相似文献   

10.
传统气象灾害观测数据存在数据稀疏、滞后以及高成本等特性,利用微博等社会感知数据的高分辨率特性,可以分析灾害性天气条件下群体公共行为与用户地理位置的相关性。该文利用自主设计的一种突发灾害天气微博数据采集系统,获取合肥市2016年1月19日到1月27日的寒潮天气下新浪微博数据,利用GIS空间分析等方法探索寒潮发生前、中、后的微博用户时空聚集特征。研究发现,在时间上,微博发布量的变化与寒潮发生存在一定的相关性,一天当中18时至24时是微博高发时段;在空间上,微博发布地主要集中在一环二环内的商业聚集区、交通集散地、旅游观光中心与高校园区等人流量密集区域。在寒潮词频统计方面,"雪""寒""冷"和"冻"等一系列与寒潮相关的热词,在寒潮期间出现频率有突升的趋势。该研究有助于气象灾害应急响应与决策。  相似文献   

11.
针对2013年CCF自然语言处理与中文计算会议(NLP&CC2013)中文微博实体链接的任务, 使用CCF提供的新浪微博数据作为训练和测试数据, 利用西南交通大学耶宝智慧中文分词平台作为自然语言预处理工具, 提出一种实体链接的方法。该方法应用改进的拼音编辑距离算法和后缀词表匹配法, 提出实体聚类消歧与基于百度百科词频的同类实体消歧相结合的消歧方法。在2013年CCF 中文微博实体链接评测任务中正确结果的准确率为0.8838, 在10 个参赛队伍中名列第3位。表明该方法有效并可以适应文本中的噪声。  相似文献   

12.
基于句法与主题扩展的中文微博情感倾向性分析模型   总被引:1,自引:0,他引:1  
微博数据具有微博文本长度不一,文本内容主题发散性,夹杂微博专用符号等特性,需要一种融合句法分析、领域知识、表情符号等多因素的综合建模方法对社会、娱乐、安全等多领域微博进行情感分析. 文章提出了一种面向主题的中文微博情感建模方法,该模型涵盖了数据预处理、句法分析、主题扩展、领域知识、情感词上下文极性调整、表情符号等内容,最后以新浪微博采集数据,选取3个领域主题进行了实验,在特定的实验环境下,得到了较高的分析准确率.   相似文献   

13.
以新浪个人微博用户为研究对象,建立了一个"关注"与"被关注"的有向网络.将节点度、紧密度、介数和K-壳4个社会网络指标应用到微博有向网络,研究了个人微博用户网络中节点的中心性,得到网络中重要性用户,分析了他们在信息传播中的作用和在网络中所表现出来的特性,体现出该用户的兴趣爱好.研究了社会网络指标与度之间的相关性,体现出网络各指标之间的关系.研究结果有助于识别个人微博用户网络的关键节点,进而分析信息在个人微博用户网络中的传播.  相似文献   

14.
运用网络调查和文献计量学方法,阐述了新浪平台认证的国内128家公共图书馆微博的应用现状,分析了国内公共图书馆微博内容的特征,提出了国内公共图书馆微博建设的规范化管理的建议。  相似文献   

15.
提出了一种基于关联规则的社交网络好友推荐算法,在进行好友推荐时,考虑现实社交活动中“志趣相投”的好友常常会关注相同的人和事,网络社交中的好友也常常会关注相同的“人”和“事”,将“关注”看成一条交易记录,把关注的用户看成交易项,所有交易项的集合看成交易数据库,生成二阶候选项集,并按支持数降序排序,推荐前犖个用户作为好友。以新浪微博993950条用户关注数据及552600条微博关注数据作为实验的对象,实验结果表明,算法具有良好的性能,可实现较高的召回率与准确率。  相似文献   

16.
17.
基于多视角特征融合的中文垃圾微博过滤   总被引:1,自引:0,他引:1  
微博中隐含着舆论热点等与特定话题相关的有价值的信息。因此,针对微博数据分析(如话题发现等)的工作成了当前的研究热点。由于微博内容和形式的高度自由,使得相关的研究工作面临着垃圾数据噪声大、有用数据提取难的问题。然而,目前针对非公共话题的中文垃圾微博过滤尚无有效方法。提出一种基于多视角特征融合的垃圾微博过滤方法。该方法首先从微博的结构和内容两个视角建立规则,再与微博文本分词结果进行融合构造复合特征,并以此对垃圾微博进行过滤。通过在真实数据集上的实验表明多视角融合的特征使得过滤效果有明显提升。  相似文献   

18.
 新型冠状病毒肺炎防疫工作进入关键时期,而期间大量滋生的伪科学网络谣言导致各地广泛出现盲目抢购、囤货等不良社会事件,严重影响疫情防控与社会正常秩序。以新冠肺炎疫情为例,在总结梳理国内外学者对伪科学、网络谣言等定义的基础上,给出适用本文的伪科学网络谣言的定义;选取本次疫情中影响较大的4个伪科学网络谣言,收集其在新浪微博传播过程中的数据,分析伪科学网络谣言在疫情中的传播特点;以SEIR模型为基础,综合考虑政府干预滞后性、个体信息接受从众效应、谣言传播特点等对模型进行合理改进,并通过数值实验对重大公共卫生事件中的伪科学网络谣言传播机制进一步研究;最后,基于前文分析从不同角度对重大公共卫生事件中伪科学网络谣言的传播治理提出针对性对策建议。  相似文献   

19.
为了有效地监管网络舆情,辅助管理人员进行决策,微博信息传播预测方法的研究具有重要应用价值。针对传统微博信息传播预测方法存在指标单一、预测效果较差问题,提出一种基于XGBoost模型的融合多特征微博信息传播预测方法。首先,分析微博传播网络和用户节点特性,提取出博主特征、微博内容特征、传播特征3类特征并构建数据集;接着,基于XGBoost方法分别构建微博累计转发量预测模型和微博最大转发深度预测模型;最后,通过模型在测试数据集上的平均绝对误差验证模型的预测效果。通过与线性回归等传统的预测方法比较分析可以看出,提出的预测方法能够取得良好的预测效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号