首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
微博转发预测有助于热点话题检测、个性化微博推荐等,近些年引起了学术界和工业界的广泛关注。然而,现有的关于微博转发预测的研究工作没有充分利用用户之间的多重信任关系的影响。该文提出联合概率模型,把用户之间的多重信任关系融入传统的Bayesian Poisson因子分解(Bayesian Poisson factorization,BPF)模型,从而预测转发行为。该模型命名为TrustBPF,可以灵活地捕获用户之间的各种社交影响。该文进一步把用户之间的信任强度整合到一个框架中。在新浪微博数据集上验证结果表明:在NDCG@3和Precision@3指标上,TrustBPF模型比原始的BPF模型分别提升了90.91%和88.37%。  相似文献   

2.
用户发布的微博内容能够体现用户兴趣,微博中用户的转发、评论、回复、他人评论等微博行为对用户兴趣具有很强的指导作用。为了有效利用用户微博行为,提出了一种基于有指导LDA(latent dirichlet allocation)的微博内容用户兴趣建模方法。首先通过分析对微博的转发、评论、回复、他人评论这4个因素对用户微博兴趣主题的影响,定义了4种约束关系;然后基于用户微博内容,将4种约束关系融合到LDA 模型中构建有指导的LDA微博主题生成模型,最后得到用户的微博主题分布,从而获得用户兴趣模型。实验结果表明,相比LDA模型,该方法的准确率有很大提高,引入4种信息对微博用户兴趣发现有非常重要的指导作用。  相似文献   

3.
微博转发是微博信息传播的重要途经.影响微博转发的因素主要是用户属性、微博内容、用户社交和用户兴趣.已有的微博转发预测模型仅考虑部分因素,实际上4个因素对用户转发行为都有影响,此外也应该关注预测模型的计算时间.基于此,提出一种基于混合特征和XGBoost算法的微博转发预测模型.首先根据4个因素分别提取用户特征、微博特征、社交特征以及兴趣特征;然后基于PageRank算法计算用户影响力,基于隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型和KL距离计算兴趣相似度,定义用户转发活跃度和用户交互影响力的计算公式;最后利用XGBoost算法构建预测模型,对转发预测进行分析.实验结果表明,新的预测方法在准确率和时间等评价指标上有较好的表现,同时也验证了综合考虑4个因素的重要性和有效性.  相似文献   

4.
以新浪微博为研究对象,基于微博主题及用户特征,提出社交网络中的用户转发行为预测算法.首先,基于互信息理论,从已发生转发行为的用户的微博内容中提取特征,通过分析给定用户的微博内容与特征之间的相关程度,预测用户是否会对给定主题的微博发生转发行为;然后通过研究用户性别、粉丝数、关注数、微博数与用户转发行为的关系,选取合适的用户特征描述,并基于贝叶斯模型预测给定用户对微博的转发概率.最后,结合以上2种算法的预测结果,得到给定用户对某主题微博的转发行为预测.该预测算法对研究网络舆情传播及微博营销具有重要意义.  相似文献   

5.
微博已经成为人们传播和获取信息的重要途径。突发事件相关微博的传播范围对事件的影响起着重要的作用,微博转发是扩大微博传播范围的一种重要方式。该文以城管与民众冲突事件(俗称"城管事件")为例,将BP(back propagation)神经网络应用到该类事件相关微博的转发行为研究中,以实现该类突发事件下微博转发行为的影响因素分析和转发量的预测。该文先从发帖人和微博内容2个角度分析了突发事件下微博转发行为的影响因素,结果表明:1)微博发帖人的活跃度、微博涉及主题标签、包含视频等可视化信息、提及其他用户及微博的发表时间段均对该微博的转发量有较大影响;2)与发帖人相比,微博内容对其转发量的影响更大。在影响因素分析的基础上,该文通过将预测问题转化为模式分类问题,基于BP(back propagation)神经网络对突发事件下的微博转发量进行了预测,并通过改变样本数对预测结果的稳定性进行了测试,得到了有一定参考价值的预测结果。  相似文献   

6.
文章提出了一种基于多度量融合的微博转发行为预测方法(MRBP-MMF),该方法提取用户微博特征,设计了转发行为习惯度、历史微博认同度、微博内容相似度和转发行为相似度计算方法,并综合多种度量标准预测用户转发行为。在实际微博数据集上实验发现,MRBP-MMF方法对用户转发行为的预测灵敏度比融合前平均高出12%,分别比预测模型3:基于情感主题模型(The Third Prediction Model-Emotion topic based Model,PM3)和多异质扩散关系网络转发行为(Retweeting Behavior on Multiple Heterogeneous Diffusion Relation Networks,RBMHDRN)平均高出4%和0.7%,在训练数据较少的情况下,MRBP-MMF方法更具优越性。实验结果表明,MRBPMMF方法预测灵敏度高于基于微博正文或用户情感的转发行为预测方法。  相似文献   

7.
曾辉  淦修修  彭俊  袁伟民 《科学技术与工程》2020,20(26):10822-10828
随着如今微博平台的高速发展,微博转发行为预测已经成为舆情分析领域中一个热门的研究主题。针对该任务,提出一种添加多层间接粉丝用户权威度信息,基于双分支网络结构模型的微博转发行为预测算法。该方法通过对原始微博进行分析,运用LDA算法提取内容特征、构建用户关系网络提取间接关注用户权威度特征等多元特征,构建基于双分支结构神经网络模型预测微博传播行为。实验结果表明预测模型相比于其他算法在RMSE,MAE评估指标上都有较好的提高,验证了算法的有效性。  相似文献   

8.
以微博为代表的在线社交媒体在预警信息的传播中发挥着越来越重要的作用。该文以灾害应急预警信息为例,从用户的角度出发,分别从利益相关、理性思考和用户兴趣3个方面分析微博用户传播应急预警信息的动机。基于分析结果,提出以地域指数(突发事件是否和用户所在地域相关)和兴趣指数(用户平时转发微博的内容)作为特征变量对用户的预警转发行为进行预测。该预测模型预测正确率达到同类型研究水平,且具有可解释性。研究结果可以对用户转发行为进行快速预测和识别,有利于进行应急预警信息的定向投送,进一步扩大传播范围。  相似文献   

9.
研究微博用户转发行为,预测微博转发概率,确定影响微博转发概率的因素,在热点挖掘、产品营销、舆情监控、谣言控制等方面有重要的现实意义.本文介绍了影响微博转发的用户特征,其中比较典型的有用户影响力、粉丝平均标签数、粉丝活跃度等特征.通过粉丝数-关注数算法、用户标签数算法、粉丝活跃度算法等分析了它们与微博转发之间的关联关系,并确定各个属性的阈值,这些阈值对微博转发预测起到了至关重要的作用.  相似文献   

10.
转发行为是微博平台上信息传播的主要形式。目前已有的工作大多数聚焦在转发行为的分析和预测。针对给定的一条微博时如何找到其转发者这个问题并没有得到很好的解决。结合贝叶斯个性化排序优化标准(BPR-OPT)和分解机(FM),提出了一种通用的方法用于对微博转发者进行预测,并进一步对影响用户成为转发者的特征因素进行了细致分析,然后根据这些特征,在大规模真实数据集上对微博转发者进行了预测。实验证明该方法能够明显提高预测效果,同时也验证了基于pair-wise和特征相关的方法能更有效解决微博转发者预测问题。  相似文献   

11.
社交网络的流行对用户的隐私保护提出了新的挑战。该文通过使用人类动力学和统计物理的方法,研究用户的网络行为与用户隐私量值的关系。以当前国内流行的社交网络——人人网和新浪微博——为研究对象,获取用户的真实数据,提出隐私量化模型。研究结果表明:用户的网络行为对隐私量值具有重要的影响,如在人人网中用户的地理位置分享行为对隐私量值影响较大,而在新浪微博中发私信行为对隐私量值的影响最大。研究的结果对社交网络隐私关注下的用户行为规律探讨具有理论与实际意义。  相似文献   

12.
该文针对企业微博的口碑传播,基于口碑营销理论和产品类型研究,对企业微博转发数的影响因素进行研究,建立了企业微博的口碑传播模型。企业微博的转发数受到粉丝数和产品类型的影响。通过抓取新浪企业微博的实际运营数据,运用面板数据模型对模型的系数进行了估计。研究结果表明:企业微博的转发数受到粉丝数和新增粉丝数的影响;并存在正的自相关,即前一天的转发数会正向影响后一天的转发数;产品类型对企业微博的转发数有显著的影响,提供体验型产品的企业转发数高于提供搜索型产品企业的转发数。  相似文献   

13.
目前对微博情绪与金融预测之间关系的研究多数停留于诸如模式识别、语义分析、情感挖掘等文本挖掘技术,而较少研究微博情感传递过程。以金融微博文本情感挖掘和语义分析为基础,对相关的股票价格曲线进行拟合预测分析,包括对微博信息转播模型的研究和对微博情绪预测模型的研究。首先通过分析微博转播过程中的多个因素,包括转发情绪吸收、微博内容影响力、微博作者影响力、微博发布时间等,对模型自身进行拟合效果优化。其次,针对认证和非认证用户分类分析,并加入了转发次数的对其的再度影响,发现不同类型不同转发的用户对于股市曲线的影响滞后期不同。最后,在针对股市曲线变化的不同时期,对模型的拟合效果进行分析。给定金融市场某一特定关键词,采集了500,000多条金融微博及其相关用户信息。实验结果表明,新集成模型表现强于简单神经网络模型,而且是否为认证用户以及微博转发次数对微博滞后期的影响有所不同。此外,新模型的拟合效果,在股市上升期模型的拟合效果最好,下降期次之,平稳振荡期效果最差。  相似文献   

14.
为了提高微博用户转发行为预测的精度,提出一种有效的基于集成学习的微博用户转发行为预测算法.首先,对影响用户转发的各种特征进行综合分析,提取出用户属性、社交关系、微博内容等影响用户转发行为的特征;然后,采用Logistic回归、支持向量机与BP(BackPropagation)神经网络等机器学习算法对用户转发行为进行预测;最后,利用"加权投票法"的集成学习方法对多个预测结果进行融合.实验结果表明,相对于BP神经网络算法,在综合评价性能的F1度量值上,集成学习算法有1.5%的性能提升.  相似文献   

15.
近些年,微博、博客、人人网、豆瓣等各种社交网络的发展,引发了学术界对社会网络、虚拟社区的关注.本论文提出了一种基于用户转发的User-Behavior Rank(UBR)算法,力求在推荐过程执行之前,预先选出微博社区中具有权威性的博主,提高推荐新颖性.文中的基于转发行为的User-Behavior Rank是对传统的Page Rank(PR)的改进,以博主之间的关注关系为边,基于其发微博的行为以及其粉丝对微博的转发,计算各自的UBR值,取UBR值较大的博主作为推荐集合.与Page Rank相比,UBR能够选出更加符合社会实际的有影响力的用户集.  相似文献   

16.
微博,是当前重要的社会信息传播平台之一,具有易操作、传播快等特点,人们可以通过微博直接快速地表达对突发事件、公众人物、热门产品等的观点。为了利用海量微博信息,需要综合多种分析方法挖掘其潜在价值。综述了当前微博分析领域的研究现状,提出了自主研发的微博分析系统,探讨了未来微博分析的研究方向。首先,介绍了微博分析的主要技术方法,包括利用微博开放平台和利用网络爬虫技术。利用微博提供的开放接口,可以方便快捷地获取微博信息,如微博内容、用户评论、用户个人详情、粉丝数、关注数等。但也存在诸多限制,如每小时只能抓取有限次数、微博平台并不开放所有信息资源等。利用网络爬虫技术可以获取更多信息,如基于全网的网络爬虫的信息采集技术可以覆盖更广的范围,基于主题的网络爬虫的信息采集技术可以选择性爬取预先设定的主题等。其次,介绍了目前微博分析的热点问题,包括微博用户行为和微博内容两方面。微博用户行为分析包括:1)传播网络研究,利用Gephi等可视化工具,呈现出微博在传播过程中的传播路径、传播范围、关键转发节点等信息,可用于预测未来传播情况;2)传播因素研究,通过分析用户行为,揭示信息传播的可能原因;3)用户影响力分析,不同学者给出不同的度量方法,而要精准地评价用户影响力需要综合考虑多方面因素,如粉丝数、转发数、被提及数、回复、社会关系等。关于微博内容的分析包括:1)微博文本预处理,包括分词和去停用词2个步骤;2)微博热点话题发现,常用方法包括基于词频的统计方法和文本聚类方法,这两种方法都有利于提高发现热点话题的效果,但没有考虑到话题动态演变的特性;3)情感分析,也被称为观点挖掘,一直是微博研究领域的热点问题,可以利用微博表情图片抽取情感词,并结合构建语义词典和机器学习的方法对微博进行情感分类,最终判断微博情感极性,可用于舆情监控、商业预测和产品选择等方面。再次,提出了自主研发的微博分析系统——阅微,重点介绍了其情感分析、地域分布和传播图3个模块。情感分析模块,基于情感词典的方法对用户的评论内容进行情感分类;地域分布模块,提取参与用户的地理位置信息并加以统计分析,呈现出微博传播在全国范围内的分布情况;传播图模块,利用可视化手段展现微博信息的传播扩散情况,如转发关系、转发层级、转发范围等情况。最后,归纳全文,从技术和应用2个方面归纳微博分析的挑战问题:可从技术上突破微博接口资源限制,提高微博分析的效率和精准度;同时从微博应用方面发展事件监控、管理和商业方面的应用。  相似文献   

17.
针对目前话题传播扩散模型研究工作的不足,采用了一个基于交叉社团网络的离散话题传播模型,引入了话题转发概率参数和邻域好友关系因素,揭示了多社团网络对话题传播扩散的影响.研究结果表明:转发概率和交叉结点数量均对话题传播产生了重要影响,与Oversim构建的实验平台相比,该模型能够准确描述话题的实际传播行为.该研究成果为舆情监测领域提供了研究基础.  相似文献   

18.
通过对社交网络新浪微博的数据的统计分析,得知微博数据具有高度的聚集性,即一个流行微博的只被转发一次的转发数占总转发数量的50%以上.因此,提出了对信息级联分层的STIC模型,该模型的第一层级联和第二层级联分别使用SVM分类算法和基于主题的信息级联模型对话题传播进行预测.实验结果表明,STIC模型的预测结果优于基于主题的信息级联模型.  相似文献   

19.
在线社交网络的飞速发展对社交网络用户的隐私保护提出了新的挑战.通过使用社会网络分析、决策分析理论和实证研究的方法,建立了一种用户隐私向量模型,从而实现对社交网络中用户隐私保护状况的量化分析.并在此基础上以新浪微博为研究对象,通过微博用户的真实数据进行实证分析.研究结果表明:用户隐私量值对用户的行为有重要影响,真实社交网络中大部分用户的隐私关注程度较低,高隐私关注群体和低隐私关注群体的比例较小,用户的私信和地理位置信息的分享行为受用户的隐私关注情况影响大.研究结果对社交网络用户的隐私保护、社交网络中用户行为规律的研究具有参考意义.  相似文献   

20.
针对当前微博影响力度量算法中多集中于用户行为属性,忽略博文、结点本身价值的问题,从微博用户信息出发,以线性加权模型为基础,综合分析用户的行为属性、博文相似度、节点相似度,创建影响力评价指标体系。利用Page Rank算法思想,提出了基于用户行为和博文内容的用户影响度量模型(user influence measurement rank,UMR)。通过采用新浪微博真实数据集测试,计算用户的影响力,验证了UMR算法在博文内容的基础上,能客观地反映用户的交互行为,消除僵尸用户对排序的影响,因而更科学、更合理。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号