首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
微博,是当前重要的社会信息传播平台之一,具有易操作、传播快等特点,人们可以通过微博直接快速地表达对突发事件、公众人物、热门产品等的观点。为了利用海量微博信息,需要综合多种分析方法挖掘其潜在价值。综述了当前微博分析领域的研究现状,提出了自主研发的微博分析系统,探讨了未来微博分析的研究方向。首先,介绍了微博分析的主要技术方法,包括利用微博开放平台和利用网络爬虫技术。利用微博提供的开放接口,可以方便快捷地获取微博信息,如微博内容、用户评论、用户个人详情、粉丝数、关注数等。但也存在诸多限制,如每小时只能抓取有限次数、微博平台并不开放所有信息资源等。利用网络爬虫技术可以获取更多信息,如基于全网的网络爬虫的信息采集技术可以覆盖更广的范围,基于主题的网络爬虫的信息采集技术可以选择性爬取预先设定的主题等。其次,介绍了目前微博分析的热点问题,包括微博用户行为和微博内容两方面。微博用户行为分析包括:1)传播网络研究,利用Gephi等可视化工具,呈现出微博在传播过程中的传播路径、传播范围、关键转发节点等信息,可用于预测未来传播情况;2)传播因素研究,通过分析用户行为,揭示信息传播的可能原因;3)用户影响力分析,不同学者给出不同的度量方法,而要精准地评价用户影响力需要综合考虑多方面因素,如粉丝数、转发数、被提及数、回复、社会关系等。关于微博内容的分析包括:1)微博文本预处理,包括分词和去停用词2个步骤;2)微博热点话题发现,常用方法包括基于词频的统计方法和文本聚类方法,这两种方法都有利于提高发现热点话题的效果,但没有考虑到话题动态演变的特性;3)情感分析,也被称为观点挖掘,一直是微博研究领域的热点问题,可以利用微博表情图片抽取情感词,并结合构建语义词典和机器学习的方法对微博进行情感分类,最终判断微博情感极性,可用于舆情监控、商业预测和产品选择等方面。再次,提出了自主研发的微博分析系统——阅微,重点介绍了其情感分析、地域分布和传播图3个模块。情感分析模块,基于情感词典的方法对用户的评论内容进行情感分类;地域分布模块,提取参与用户的地理位置信息并加以统计分析,呈现出微博传播在全国范围内的分布情况;传播图模块,利用可视化手段展现微博信息的传播扩散情况,如转发关系、转发层级、转发范围等情况。最后,归纳全文,从技术和应用2个方面归纳微博分析的挑战问题:可从技术上突破微博接口资源限制,提高微博分析的效率和精准度;同时从微博应用方面发展事件监控、管理和商业方面的应用。  相似文献   

2.
微博类社交网络中信息传播的测量与分析   总被引:1,自引:0,他引:1  
为了更好地掌握在线社交网络中信息传播的特征规律和用户行为,以新浪微博为代表对社交网络中的信息传播进行了较大规模的测量、统计和分析,提出了一种三角和算法用于探测用户粉丝数阈值。该算法根据散点分布的统计规律来估计使微博热度达到某一值的粉丝数的临界值,发现为使微博热度大于10,用户粉丝数应大于150。其他测量分析结果表明:新浪微博具有很强的"名人效应",用户频繁地发帖并不能引起较大的关注,热门微博的热度几乎都以激增方式增长。这些结论对网络营销和网络监管具有参考价值。  相似文献   

3.
目前对微博情绪与金融预测之间关系的研究多数停留于诸如模式识别、语义分析、情感挖掘等文本挖掘技术,而较少研究微博情感传递过程。以金融微博文本情感挖掘和语义分析为基础,对相关的股票价格曲线进行拟合预测分析,包括对微博信息转播模型的研究和对微博情绪预测模型的研究。首先通过分析微博转播过程中的多个因素,包括转发情绪吸收、微博内容影响力、微博作者影响力、微博发布时间等,对模型自身进行拟合效果优化。其次,针对认证和非认证用户分类分析,并加入了转发次数的对其的再度影响,发现不同类型不同转发的用户对于股市曲线的影响滞后期不同。最后,在针对股市曲线变化的不同时期,对模型的拟合效果进行分析。给定金融市场某一特定关键词,采集了500,000多条金融微博及其相关用户信息。实验结果表明,新集成模型表现强于简单神经网络模型,而且是否为认证用户以及微博转发次数对微博滞后期的影响有所不同。此外,新模型的拟合效果,在股市上升期模型的拟合效果最好,下降期次之,平稳振荡期效果最差。  相似文献   

4.
当前互联网已成为公众获取信息、表达观点的重要平台,也带来社会舆情事件易发生的风险,通过对网络舆情走势的提前预测,能够准确判断热点事件的发展态势,为政府相关部门应对舆情危机提供参考.针对单一预测模型预测精度不高和社交媒体对舆情走势影响较大的问题,提出了融合微博热点分析和长短期记忆神经网络(LSTM)的舆情预测方法.利用网络爬虫和PyTorch机器学习平台构建了用于舆情时序数据分析的网络舆情预测系统;在此系统内,考虑微博的强时效性,采用网络热点分析技术计算微博热度分值;改进LSTM网络,设计由2个隐含层组成的MH-LSTM预测模型;将MH-LSTM模型用于舆情事件百度指数的定量预测中,通过试验验证了模型的正确性,证实了该预测模型拥有较好的预测效果.  相似文献   

5.
微博已经成为人们传播和获取信息的重要途径。突发事件相关微博的传播范围对事件的影响起着重要的作用,微博转发是扩大微博传播范围的一种重要方式。该文以城管与民众冲突事件(俗称"城管事件")为例,将BP(back propagation)神经网络应用到该类事件相关微博的转发行为研究中,以实现该类突发事件下微博转发行为的影响因素分析和转发量的预测。该文先从发帖人和微博内容2个角度分析了突发事件下微博转发行为的影响因素,结果表明:1)微博发帖人的活跃度、微博涉及主题标签、包含视频等可视化信息、提及其他用户及微博的发表时间段均对该微博的转发量有较大影响;2)与发帖人相比,微博内容对其转发量的影响更大。在影响因素分析的基础上,该文通过将预测问题转化为模式分类问题,基于BP(back propagation)神经网络对突发事件下的微博转发量进行了预测,并通过改变样本数对预测结果的稳定性进行了测试,得到了有一定参考价值的预测结果。  相似文献   

6.
为探究后疫情时代武汉城市圈各城市的吸引力,本文通过建立基于多源网络大数据的城市热度分析模型,获取多维网络大数据,包括微博搜索指数、百度迁徙指数和腾讯位置大数据,基于GIS空间分析方法,从不同角度测度武汉城市圈在2021年五一假期各城市的网络空间城市热度和实际空间城市热度。研究发现武汉市城市热度最高,其余各城市城市热度偏低。尤其是网络空间城市热度,其他八个城市与武汉差距更加悬殊。武汉城市圈一体化发展要重视提高非首位城市的网络吸引力。  相似文献   

7.
王阳 《创新科技》2016,(12):32-35
互联网的飞跃发展,既孕育着机遇,同时也带来了前所未有的挑战。网络舆情的特点使其成为一把双刃剑。为此,本文通过对微博文本的获取与处理,得到关于该微博热门话题的基于时间序列的离散数据序列,然后采用万有引力算法优化的RBF神经网络对微博舆情进行预测。通过微博舆情的时间序列进行实证研究,在预测性能上与现有的预测模型进行对比,证明该模型在该预测领域的可行性和有效性。  相似文献   

8.
学术动态     
《镇江高专学报》2013,(4):F0003-F0003
我校徐艟副教授编著的《微博广告研究》于2012年8月由安徽师范大学出版社出版。该书从微博广告的起源、现状、分类、管理、盈利模式等方面埘微博广告作了系统阐述。将目前微博领域的广告分为8类,即微博旗帜广告、微博按钮式厂“告、微博邮件列表广告、微博墙纸式广告、微博电子邮件式广告、竞赛和推广式广告、微博插页式广告、微博互动游戏式广告。  相似文献   

9.
情感表达抽取工作是细粒度情感挖掘的重要任务之一.中文微博中包含大量网络新词和不规范词,现有的方法在进行微博情感表达抽取任务时不能很好地处理上述情况.通过研究发现,微博中新词大量分布在文本的情感表达部分,于是提出了基于CRF的联合抽取模型,即将新词发现融入到情感表达抽取任务中,从而改进原有工作的不足.实验结果表明,新词探测对微博文本情感表达抽取有很好的指示作用,在电影领域和开放领域的微博数据集上分别进行实验,F1值均提高了2%以上.  相似文献   

10.
曾辉  淦修修  彭俊  袁伟民 《科学技术与工程》2020,20(26):10822-10828
随着如今微博平台的高速发展,微博转发行为预测已经成为舆情分析领域中一个热门的研究主题。针对该任务,提出一种添加多层间接粉丝用户权威度信息,基于双分支网络结构模型的微博转发行为预测算法。该方法通过对原始微博进行分析,运用LDA算法提取内容特征、构建用户关系网络提取间接关注用户权威度特征等多元特征,构建基于双分支结构神经网络模型预测微博传播行为。实验结果表明预测模型相比于其他算法在RMSE,MAE评估指标上都有较好的提高,验证了算法的有效性。  相似文献   

11.
转发行为是微博平台上信息传播的主要形式。目前已有的工作大多数聚焦在转发行为的分析和预测。针对给定的一条微博时如何找到其转发者这个问题并没有得到很好的解决。结合贝叶斯个性化排序优化标准(BPR-OPT)和分解机(FM),提出了一种通用的方法用于对微博转发者进行预测,并进一步对影响用户成为转发者的特征因素进行了细致分析,然后根据这些特征,在大规模真实数据集上对微博转发者进行了预测。实验证明该方法能够明显提高预测效果,同时也验证了基于pair-wise和特征相关的方法能更有效解决微博转发者预测问题。  相似文献   

12.
以新浪微博为研究对象,基于微博主题及用户特征,提出社交网络中的用户转发行为预测算法.首先,基于互信息理论,从已发生转发行为的用户的微博内容中提取特征,通过分析给定用户的微博内容与特征之间的相关程度,预测用户是否会对给定主题的微博发生转发行为;然后通过研究用户性别、粉丝数、关注数、微博数与用户转发行为的关系,选取合适的用户特征描述,并基于贝叶斯模型预测给定用户对微博的转发概率.最后,结合以上2种算法的预测结果,得到给定用户对某主题微博的转发行为预测.该预测算法对研究网络舆情传播及微博营销具有重要意义.  相似文献   

13.
崔海燕  李雅文  徐欣 《广西科学》2022,29(4):627-633
得益于深度学习的快速发展,大数据分析技术不仅在自然语言处理领域应用广泛,在数值预测领域也更加成熟。为了提高科技需求数据主题热度预测的准确率,本文提出一种基于时间卷积网络(Time Convolution Network, TCN)的科技需求主题热度预测方法(Subject Heat of Science and Technology Demand Prediction Based on Time Convolution Network, SHDP-TCN),该方法融入科技需求的主题特征,并基于TCN及自注意力机制进行时序预测。实验结果表明,在真实的科技需求数据集上,本算法对科技需求主题热度的预测准确率优于自回归积分滑动平均(Auto Regressive Integrated Moving Average, ARIMA)、长短时记忆(Long Short-Term Memory, LSTM)网络、卷积神经网络(Convolutional Neural Networks, CNN)和TCN等算法。  相似文献   

14.
以短文本内容发布为主要特点的微博,已经成为重要的信息传播媒介,预测微博流行度对舆情监测、企业营销、热点推送等都具有重要意义.当前对微博流行度预测的研究主要侧重于对所有用户的微博数据进行统一建模预测,鲜有研究考虑不同影响力用户之间的差异.而微博数据的分析显示标签、提及和微博长度等对微博流行度的影响会随发布者的影响力变化显示出明显差异,在流行度预测中充分考虑这些差异,有助于取得更好的预测结果.为此,在流行度预测中引入多任务学习(Multi-Task Learning,简称MTL),并结合SVM构建SVM+MTL模型,此模型通过同时考虑所有用户的共同特性和不同用户的具体特性来提高预测性能.此外,除了预测常用的用户属性和微博发布行为等特征外,还引入微博内容相似性这一新特征,该特征能明显提高预测准确率.基于微博数据的实验表明,SVM+MTL模型可以有效提高微博流行度预测性能.  相似文献   

15.
微博话语分析是近年来社会科学的研究热点之一。关于微博话语的研究有利于丰富社会语言学和话语分析的研究内容和领域。从社会语言学、系统功能语言学和语料库语言学的角度,对新浪微博话语从信息性、情感性和社会性三个维度所进行的研究结果表明微博话语具有独特的信息性、丰富的情感性和广泛的社会共鸣性等特点。  相似文献   

16.
国内外图书馆微博研究比较分析   总被引:1,自引:0,他引:1  
微博客准入门槛低、平台信息集中、对所有网民平等开放,在信息、传播、政界等各领域产生了方方面面的影响,成为各领域信息传播的新宠。对国内外图书馆微博研究文献分别进行了数量分析、期刊分析和主题分析,并对国内外有关图书馆微博的应用领域和应用范围研究进行了比较分析,总结了我国图书馆微博研究的不足及未来发展方向。  相似文献   

17.
应用信息可视化软件CiteSpace V及其辅助工具VOSviewer对分子筛领域的27519篇SCI英文文献进行分析,结合Web of Science(WOS)核心集中的SCI-E,SSCI,CPCI-S数据源,时间跨度为2000—2019年,研究了全球范围内相应文献的时空分布。基于文献计量和统计分析,生成了相应的期刊共被引知识图谱、作者合作知识图谱、作者共被引知识图谱、关键词共现知识图谱以及参考文献共被引知识图谱,分析并得出分子筛领域的研究现状与新兴趋势。结果表明:在世界范围内,该领域近9 a来的研究热度逐年攀升,高产期刊和高被引期刊均为Microporous and Mesoporous Materials,中美2国是开展分子筛研究的主要国家,分子筛领域的高产研究机构为中国科学院。同时,还总结了分子筛领域的主要研究团队和高影响力学者。通过对近10 a文献关键词的共现分析和参考文献的共被引分析,结果发现:纳米微孔沸石的催化机理与应用和分子筛对气体吸附分离性能的分析是当今国际上该领域的研究热点,分子筛金属骨架的改性对催化性能的影响和分子筛在生物质研究领域中的应用是目前国际研究的新兴趋势。  相似文献   

18.
本研究以中国知网(CNKI)为数据源,利用VOSviewer软件构建我国抗生素滥用研究的知识图谱以呈现其研究现状与热点。研究发现我国抗生素研究经历了四个不同的发展期:初始期、缓慢发展期、快速发展期与疲软期。目前该领域严重缺乏长期研究者,且参与发文者间及团体间合作关系差。抗生素滥用研究热度的下降,可能与研究主题缺乏有关,需要研究者开创新的研究方向。目前除需关注抗生素滥用导致耐药原理、危害及预防之外,如何合理监管也显得非常重要。此外还需特别注意抗生素滥用给儿童带来的巨大危害,而健康教育是有效的预防抗生素滥用的方法。  相似文献   

19.
基于多视角特征融合的中文垃圾微博过滤   总被引:1,自引:0,他引:1  
微博中隐含着舆论热点等与特定话题相关的有价值的信息。因此,针对微博数据分析(如话题发现等)的工作成了当前的研究热点。由于微博内容和形式的高度自由,使得相关的研究工作面临着垃圾数据噪声大、有用数据提取难的问题。然而,目前针对非公共话题的中文垃圾微博过滤尚无有效方法。提出一种基于多视角特征融合的垃圾微博过滤方法。该方法首先从微博的结构和内容两个视角建立规则,再与微博文本分词结果进行融合构造复合特征,并以此对垃圾微博进行过滤。通过在真实数据集上的实验表明多视角融合的特征使得过滤效果有明显提升。  相似文献   

20.
综述了结合机器学习策略的演化动态优化研究,从数据、预测最优解位置、改进演化算法搜索等方面讨论分析了该领域的研究现状和关键技术,并总结了该领域目前存在问题和挑战。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号