首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 390 毫秒
1.
以新浪微博为研究对象,基于微博主题及用户特征,提出社交网络中的用户转发行为预测算法.首先,基于互信息理论,从已发生转发行为的用户的微博内容中提取特征,通过分析给定用户的微博内容与特征之间的相关程度,预测用户是否会对给定主题的微博发生转发行为;然后通过研究用户性别、粉丝数、关注数、微博数与用户转发行为的关系,选取合适的用户特征描述,并基于贝叶斯模型预测给定用户对微博的转发概率.最后,结合以上2种算法的预测结果,得到给定用户对某主题微博的转发行为预测.该预测算法对研究网络舆情传播及微博营销具有重要意义.  相似文献   

2.
文章提出了一种基于多度量融合的微博转发行为预测方法(MRBP-MMF),该方法提取用户微博特征,设计了转发行为习惯度、历史微博认同度、微博内容相似度和转发行为相似度计算方法,并综合多种度量标准预测用户转发行为。在实际微博数据集上实验发现,MRBP-MMF方法对用户转发行为的预测灵敏度比融合前平均高出12%,分别比预测模型3:基于情感主题模型(The Third Prediction Model-Emotion topic based Model,PM3)和多异质扩散关系网络转发行为(Retweeting Behavior on Multiple Heterogeneous Diffusion Relation Networks,RBMHDRN)平均高出4%和0.7%,在训练数据较少的情况下,MRBP-MMF方法更具优越性。实验结果表明,MRBPMMF方法预测灵敏度高于基于微博正文或用户情感的转发行为预测方法。  相似文献   

3.
为了有效地监管网络舆情,辅助管理人员进行决策,微博信息传播预测方法的研究具有重要应用价值。针对传统微博信息传播预测方法存在指标单一、预测效果较差问题,提出一种基于XGBoost模型的融合多特征微博信息传播预测方法。首先,分析微博传播网络和用户节点特性,提取出博主特征、微博内容特征、传播特征3类特征并构建数据集;接着,基于XGBoost方法分别构建微博累计转发量预测模型和微博最大转发深度预测模型;最后,通过模型在测试数据集上的平均绝对误差验证模型的预测效果。通过与线性回归等传统的预测方法比较分析可以看出,提出的预测方法能够取得良好的预测效果。  相似文献   

4.
曾辉  淦修修  彭俊  袁伟民 《科学技术与工程》2020,20(26):10822-10828
随着如今微博平台的高速发展,微博转发行为预测已经成为舆情分析领域中一个热门的研究主题。针对该任务,提出一种添加多层间接粉丝用户权威度信息,基于双分支网络结构模型的微博转发行为预测算法。该方法通过对原始微博进行分析,运用LDA算法提取内容特征、构建用户关系网络提取间接关注用户权威度特征等多元特征,构建基于双分支结构神经网络模型预测微博传播行为。实验结果表明预测模型相比于其他算法在RMSE,MAE评估指标上都有较好的提高,验证了算法的有效性。  相似文献   

5.
微博转发是微博信息传播的重要途经.影响微博转发的因素主要是用户属性、微博内容、用户社交和用户兴趣.已有的微博转发预测模型仅考虑部分因素,实际上4个因素对用户转发行为都有影响,此外也应该关注预测模型的计算时间.基于此,提出一种基于混合特征和XGBoost算法的微博转发预测模型.首先根据4个因素分别提取用户特征、微博特征、社交特征以及兴趣特征;然后基于PageRank算法计算用户影响力,基于隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型和KL距离计算兴趣相似度,定义用户转发活跃度和用户交互影响力的计算公式;最后利用XGBoost算法构建预测模型,对转发预测进行分析.实验结果表明,新的预测方法在准确率和时间等评价指标上有较好的表现,同时也验证了综合考虑4个因素的重要性和有效性.  相似文献   

6.
转发行为是微博平台上信息传播的主要形式。目前已有的工作大多数聚焦在转发行为的分析和预测。针对给定的一条微博时如何找到其转发者这个问题并没有得到很好的解决。结合贝叶斯个性化排序优化标准(BPR-OPT)和分解机(FM),提出了一种通用的方法用于对微博转发者进行预测,并进一步对影响用户成为转发者的特征因素进行了细致分析,然后根据这些特征,在大规模真实数据集上对微博转发者进行了预测。实验证明该方法能够明显提高预测效果,同时也验证了基于pair-wise和特征相关的方法能更有效解决微博转发者预测问题。  相似文献   

7.
用户发布的微博内容能够体现用户兴趣,微博中用户的转发、评论、回复、他人评论等微博行为对用户兴趣具有很强的指导作用。为了有效利用用户微博行为,提出了一种基于有指导LDA(latent dirichlet allocation)的微博内容用户兴趣建模方法。首先通过分析对微博的转发、评论、回复、他人评论这4个因素对用户微博兴趣主题的影响,定义了4种约束关系;然后基于用户微博内容,将4种约束关系融合到LDA 模型中构建有指导的LDA微博主题生成模型,最后得到用户的微博主题分布,从而获得用户兴趣模型。实验结果表明,相比LDA模型,该方法的准确率有很大提高,引入4种信息对微博用户兴趣发现有非常重要的指导作用。  相似文献   

8.
微博已经成为人们传播和获取信息的重要途径。突发事件相关微博的传播范围对事件的影响起着重要的作用,微博转发是扩大微博传播范围的一种重要方式。该文以城管与民众冲突事件(俗称"城管事件")为例,将BP(back propagation)神经网络应用到该类事件相关微博的转发行为研究中,以实现该类突发事件下微博转发行为的影响因素分析和转发量的预测。该文先从发帖人和微博内容2个角度分析了突发事件下微博转发行为的影响因素,结果表明:1)微博发帖人的活跃度、微博涉及主题标签、包含视频等可视化信息、提及其他用户及微博的发表时间段均对该微博的转发量有较大影响;2)与发帖人相比,微博内容对其转发量的影响更大。在影响因素分析的基础上,该文通过将预测问题转化为模式分类问题,基于BP(back propagation)神经网络对突发事件下的微博转发量进行了预测,并通过改变样本数对预测结果的稳定性进行了测试,得到了有一定参考价值的预测结果。  相似文献   

9.
自动摘要是自然语言处理中研究文本主题提取的重要课题.传统的摘要研究侧重于新闻、Web网页和博客等长文本的主题提取.本文关注以微博为代表的短文本的主题摘要,提出基于图结构的微博主题区域划分方法,并采用LDA方法提取微博热点事件的主题信息.最后,通过可视化方式展现主题内容在微博转发中的变化.  相似文献   

10.
自动摘要是自然语言处理中研究文本主题提取的重要课题.传统的摘要研究侧重于新闻、Web网页和博客等长文本的主题提取.本文关注以微博为代表的短文本的主题摘要,提出基于图结构的微博主题区域划分方法,并采用LDA方法提取微博热点事件的主题信息.最后,通过可视化方式展现主题内容在微博转发中的变化.  相似文献   

11.
微博,是当前重要的社会信息传播平台之一,具有易操作、传播快等特点,人们可以通过微博直接快速地表达对突发事件、公众人物、热门产品等的观点。为了利用海量微博信息,需要综合多种分析方法挖掘其潜在价值。综述了当前微博分析领域的研究现状,提出了自主研发的微博分析系统,探讨了未来微博分析的研究方向。首先,介绍了微博分析的主要技术方法,包括利用微博开放平台和利用网络爬虫技术。利用微博提供的开放接口,可以方便快捷地获取微博信息,如微博内容、用户评论、用户个人详情、粉丝数、关注数等。但也存在诸多限制,如每小时只能抓取有限次数、微博平台并不开放所有信息资源等。利用网络爬虫技术可以获取更多信息,如基于全网的网络爬虫的信息采集技术可以覆盖更广的范围,基于主题的网络爬虫的信息采集技术可以选择性爬取预先设定的主题等。其次,介绍了目前微博分析的热点问题,包括微博用户行为和微博内容两方面。微博用户行为分析包括:1)传播网络研究,利用Gephi等可视化工具,呈现出微博在传播过程中的传播路径、传播范围、关键转发节点等信息,可用于预测未来传播情况;2)传播因素研究,通过分析用户行为,揭示信息传播的可能原因;3)用户影响力分析,不同学者给出不同的度量方法,而要精准地评价用户影响力需要综合考虑多方面因素,如粉丝数、转发数、被提及数、回复、社会关系等。关于微博内容的分析包括:1)微博文本预处理,包括分词和去停用词2个步骤;2)微博热点话题发现,常用方法包括基于词频的统计方法和文本聚类方法,这两种方法都有利于提高发现热点话题的效果,但没有考虑到话题动态演变的特性;3)情感分析,也被称为观点挖掘,一直是微博研究领域的热点问题,可以利用微博表情图片抽取情感词,并结合构建语义词典和机器学习的方法对微博进行情感分类,最终判断微博情感极性,可用于舆情监控、商业预测和产品选择等方面。再次,提出了自主研发的微博分析系统——阅微,重点介绍了其情感分析、地域分布和传播图3个模块。情感分析模块,基于情感词典的方法对用户的评论内容进行情感分类;地域分布模块,提取参与用户的地理位置信息并加以统计分析,呈现出微博传播在全国范围内的分布情况;传播图模块,利用可视化手段展现微博信息的传播扩散情况,如转发关系、转发层级、转发范围等情况。最后,归纳全文,从技术和应用2个方面归纳微博分析的挑战问题:可从技术上突破微博接口资源限制,提高微博分析的效率和精准度;同时从微博应用方面发展事件监控、管理和商业方面的应用。  相似文献   

12.
以短文本内容发布为主要特点的微博,已经成为重要的信息传播媒介,预测微博流行度对舆情监测、企业营销、热点推送等都具有重要意义.当前对微博流行度预测的研究主要侧重于对所有用户的微博数据进行统一建模预测,鲜有研究考虑不同影响力用户之间的差异.而微博数据的分析显示标签、提及和微博长度等对微博流行度的影响会随发布者的影响力变化显示出明显差异,在流行度预测中充分考虑这些差异,有助于取得更好的预测结果.为此,在流行度预测中引入多任务学习(Multi-Task Learning,简称MTL),并结合SVM构建SVM+MTL模型,此模型通过同时考虑所有用户的共同特性和不同用户的具体特性来提高预测性能.此外,除了预测常用的用户属性和微博发布行为等特征外,还引入微博内容相似性这一新特征,该特征能明显提高预测准确率.基于微博数据的实验表明,SVM+MTL模型可以有效提高微博流行度预测性能.  相似文献   

13.
目前对微博情绪与金融预测之间关系的研究多数停留于诸如模式识别、语义分析、情感挖掘等文本挖掘技术,而较少研究微博情感传递过程。以金融微博文本情感挖掘和语义分析为基础,对相关的股票价格曲线进行拟合预测分析,包括对微博信息转播模型的研究和对微博情绪预测模型的研究。首先通过分析微博转播过程中的多个因素,包括转发情绪吸收、微博内容影响力、微博作者影响力、微博发布时间等,对模型自身进行拟合效果优化。其次,针对认证和非认证用户分类分析,并加入了转发次数的对其的再度影响,发现不同类型不同转发的用户对于股市曲线的影响滞后期不同。最后,在针对股市曲线变化的不同时期,对模型的拟合效果进行分析。给定金融市场某一特定关键词,采集了500,000多条金融微博及其相关用户信息。实验结果表明,新集成模型表现强于简单神经网络模型,而且是否为认证用户以及微博转发次数对微博滞后期的影响有所不同。此外,新模型的拟合效果,在股市上升期模型的拟合效果最好,下降期次之,平稳振荡期效果最差。  相似文献   

14.
为了提高微博用户转发行为预测的精度,提出一种有效的基于集成学习的微博用户转发行为预测算法.首先,对影响用户转发的各种特征进行综合分析,提取出用户属性、社交关系、微博内容等影响用户转发行为的特征;然后,采用Logistic回归、支持向量机与BP(BackPropagation)神经网络等机器学习算法对用户转发行为进行预测;最后,利用"加权投票法"的集成学习方法对多个预测结果进行融合.实验结果表明,相对于BP神经网络算法,在综合评价性能的F1度量值上,集成学习算法有1.5%的性能提升.  相似文献   

15.
微博转发预测有助于热点话题检测、个性化微博推荐等,近些年引起了学术界和工业界的广泛关注。然而,现有的关于微博转发预测的研究工作没有充分利用用户之间的多重信任关系的影响。该文提出联合概率模型,把用户之间的多重信任关系融入传统的Bayesian Poisson因子分解(Bayesian Poisson factorization,BPF)模型,从而预测转发行为。该模型命名为TrustBPF,可以灵活地捕获用户之间的各种社交影响。该文进一步把用户之间的信任强度整合到一个框架中。在新浪微博数据集上验证结果表明:在NDCG@3和Precision@3指标上,TrustBPF模型比原始的BPF模型分别提升了90.91%和88.37%。  相似文献   

16.
随着新浪微博用户的不断增长,微博网站成为很多人获取信息的平台.但是微博是一种特殊的文本,其字数受到严格限制,传统的主题模型并不能很好地分析微博的内容.本文提出了一个基于LDA的微博生成模型RT-LDA来解决微博字数受限的问题.模型采用吉布斯抽样法来推导,不仅能准确地挖掘每条微博的主题,还能归纳出用户关注的主题分布情况.在真实数据集上的实验表明,RT-LDA模型能很好地对微博进行主题挖掘.  相似文献   

17.
该文针对企业微博的口碑传播,基于口碑营销理论和产品类型研究,对企业微博转发数的影响因素进行研究,建立了企业微博的口碑传播模型。企业微博的转发数受到粉丝数和产品类型的影响。通过抓取新浪企业微博的实际运营数据,运用面板数据模型对模型的系数进行了估计。研究结果表明:企业微博的转发数受到粉丝数和新增粉丝数的影响;并存在正的自相关,即前一天的转发数会正向影响后一天的转发数;产品类型对企业微博的转发数有显著的影响,提供体验型产品的企业转发数高于提供搜索型产品企业的转发数。  相似文献   

18.
微博信息具有传播速度快、数据量大、噪声大的特点,因而难以有效监测与控制.针对这些问题,提出了基于信息功率谱的微博热点挖掘模型,给出了该模型的框架结构、运作流程以及关键子算法.该模型根据微博信息流的功率谱密度变化趋势动态调整信息采集窗口,通过对信息功率谱计算对微博中的热点进行挖掘和预测,并抽取微博中的相关描述特征.仿真实验证明,该模型具有较高的预测准确度和特征覆盖度,且占用系统资源较少.  相似文献   

19.
微博作为电子口碑的重要载体,极大影响了消费者的购买决策和商家的产品销售.为此,以新浪微博为平台,研究从微博中挖掘情感信息并利用这些信息对产品销售进行预测的方法.分析影响微博评论的因素,基于已构建的情感本体,建立微博中情感计算方法.然后在传统自回归模型的基础上融入情感因素,提出自回归情感预测模型用于产品销量的预测.对电影数据集进行了广泛地实验,分析参数选择,并与其它预测模型进行比较,实验证实我们提出的方法的有效性.  相似文献   

20.
通过研究对比不同网络爬虫策略的优缺点,提出了基于微博信息的关键词库爬虫策略,利用微博的特性以及数据挖掘算法的优势,生成关键词库指导爬虫模型进行微博信息的获取,解决了主题爬虫模型在数据获取时存在的时序性、正确性以及高效性的问题,提高了微博事件信息的覆盖率和准确率,最后通过设计实验系统Keys Crawler,验证了本文提出的策略的优越性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号