首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 187 毫秒
1.
曾辉  淦修修  彭俊  袁伟民 《科学技术与工程》2020,20(26):10822-10828
随着如今微博平台的高速发展,微博转发行为预测已经成为舆情分析领域中一个热门的研究主题。针对该任务,提出一种添加多层间接粉丝用户权威度信息,基于双分支网络结构模型的微博转发行为预测算法。该方法通过对原始微博进行分析,运用LDA算法提取内容特征、构建用户关系网络提取间接关注用户权威度特征等多元特征,构建基于双分支结构神经网络模型预测微博传播行为。实验结果表明预测模型相比于其他算法在RMSE,MAE评估指标上都有较好的提高,验证了算法的有效性。  相似文献   

2.
研究微博用户转发行为,预测微博转发概率,确定影响微博转发概率的因素,在热点挖掘、产品营销、舆情监控、谣言控制等方面有重要的现实意义.本文介绍了影响微博转发的用户特征,其中比较典型的有用户影响力、粉丝平均标签数、粉丝活跃度等特征.通过粉丝数-关注数算法、用户标签数算法、粉丝活跃度算法等分析了它们与微博转发之间的关联关系,并确定各个属性的阈值,这些阈值对微博转发预测起到了至关重要的作用.  相似文献   

3.
为了提高微博用户转发行为预测的精度,提出一种有效的基于集成学习的微博用户转发行为预测算法.首先,对影响用户转发的各种特征进行综合分析,提取出用户属性、社交关系、微博内容等影响用户转发行为的特征;然后,采用Logistic回归、支持向量机与BP(BackPropagation)神经网络等机器学习算法对用户转发行为进行预测;最后,利用"加权投票法"的集成学习方法对多个预测结果进行融合.实验结果表明,相对于BP神经网络算法,在综合评价性能的F1度量值上,集成学习算法有1.5%的性能提升.  相似文献   

4.
文章提出了一种基于多度量融合的微博转发行为预测方法(MRBP-MMF),该方法提取用户微博特征,设计了转发行为习惯度、历史微博认同度、微博内容相似度和转发行为相似度计算方法,并综合多种度量标准预测用户转发行为。在实际微博数据集上实验发现,MRBP-MMF方法对用户转发行为的预测灵敏度比融合前平均高出12%,分别比预测模型3:基于情感主题模型(The Third Prediction Model-Emotion topic based Model,PM3)和多异质扩散关系网络转发行为(Retweeting Behavior on Multiple Heterogeneous Diffusion Relation Networks,RBMHDRN)平均高出4%和0.7%,在训练数据较少的情况下,MRBP-MMF方法更具优越性。实验结果表明,MRBPMMF方法预测灵敏度高于基于微博正文或用户情感的转发行为预测方法。  相似文献   

5.
微博转发是微博信息传播的重要途经.影响微博转发的因素主要是用户属性、微博内容、用户社交和用户兴趣.已有的微博转发预测模型仅考虑部分因素,实际上4个因素对用户转发行为都有影响,此外也应该关注预测模型的计算时间.基于此,提出一种基于混合特征和XGBoost算法的微博转发预测模型.首先根据4个因素分别提取用户特征、微博特征、社交特征以及兴趣特征;然后基于PageRank算法计算用户影响力,基于隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型和KL距离计算兴趣相似度,定义用户转发活跃度和用户交互影响力的计算公式;最后利用XGBoost算法构建预测模型,对转发预测进行分析.实验结果表明,新的预测方法在准确率和时间等评价指标上有较好的表现,同时也验证了综合考虑4个因素的重要性和有效性.  相似文献   

6.
通过对社交网络新浪微博的数据的统计分析,得知微博数据具有高度的聚集性,即一个流行微博的只被转发一次的转发数占总转发数量的50%以上.因此,提出了对信息级联分层的STIC模型,该模型的第一层级联和第二层级联分别使用SVM分类算法和基于主题的信息级联模型对话题传播进行预测.实验结果表明,STIC模型的预测结果优于基于主题的信息级联模型.  相似文献   

7.
转发行为是微博平台上信息传播的主要形式。目前已有的工作大多数聚焦在转发行为的分析和预测。针对给定的一条微博时如何找到其转发者这个问题并没有得到很好的解决。结合贝叶斯个性化排序优化标准(BPR-OPT)和分解机(FM),提出了一种通用的方法用于对微博转发者进行预测,并进一步对影响用户成为转发者的特征因素进行了细致分析,然后根据这些特征,在大规模真实数据集上对微博转发者进行了预测。实验证明该方法能够明显提高预测效果,同时也验证了基于pair-wise和特征相关的方法能更有效解决微博转发者预测问题。  相似文献   

8.
为了有效地监管网络舆情,辅助管理人员进行决策,微博信息传播预测方法的研究具有重要应用价值。针对传统微博信息传播预测方法存在指标单一、预测效果较差问题,提出一种基于XGBoost模型的融合多特征微博信息传播预测方法。首先,分析微博传播网络和用户节点特性,提取出博主特征、微博内容特征、传播特征3类特征并构建数据集;接着,基于XGBoost方法分别构建微博累计转发量预测模型和微博最大转发深度预测模型;最后,通过模型在测试数据集上的平均绝对误差验证模型的预测效果。通过与线性回归等传统的预测方法比较分析可以看出,提出的预测方法能够取得良好的预测效果。  相似文献   

9.
微博,是当前重要的社会信息传播平台之一,具有易操作、传播快等特点,人们可以通过微博直接快速地表达对突发事件、公众人物、热门产品等的观点。为了利用海量微博信息,需要综合多种分析方法挖掘其潜在价值。综述了当前微博分析领域的研究现状,提出了自主研发的微博分析系统,探讨了未来微博分析的研究方向。首先,介绍了微博分析的主要技术方法,包括利用微博开放平台和利用网络爬虫技术。利用微博提供的开放接口,可以方便快捷地获取微博信息,如微博内容、用户评论、用户个人详情、粉丝数、关注数等。但也存在诸多限制,如每小时只能抓取有限次数、微博平台并不开放所有信息资源等。利用网络爬虫技术可以获取更多信息,如基于全网的网络爬虫的信息采集技术可以覆盖更广的范围,基于主题的网络爬虫的信息采集技术可以选择性爬取预先设定的主题等。其次,介绍了目前微博分析的热点问题,包括微博用户行为和微博内容两方面。微博用户行为分析包括:1)传播网络研究,利用Gephi等可视化工具,呈现出微博在传播过程中的传播路径、传播范围、关键转发节点等信息,可用于预测未来传播情况;2)传播因素研究,通过分析用户行为,揭示信息传播的可能原因;3)用户影响力分析,不同学者给出不同的度量方法,而要精准地评价用户影响力需要综合考虑多方面因素,如粉丝数、转发数、被提及数、回复、社会关系等。关于微博内容的分析包括:1)微博文本预处理,包括分词和去停用词2个步骤;2)微博热点话题发现,常用方法包括基于词频的统计方法和文本聚类方法,这两种方法都有利于提高发现热点话题的效果,但没有考虑到话题动态演变的特性;3)情感分析,也被称为观点挖掘,一直是微博研究领域的热点问题,可以利用微博表情图片抽取情感词,并结合构建语义词典和机器学习的方法对微博进行情感分类,最终判断微博情感极性,可用于舆情监控、商业预测和产品选择等方面。再次,提出了自主研发的微博分析系统——阅微,重点介绍了其情感分析、地域分布和传播图3个模块。情感分析模块,基于情感词典的方法对用户的评论内容进行情感分类;地域分布模块,提取参与用户的地理位置信息并加以统计分析,呈现出微博传播在全国范围内的分布情况;传播图模块,利用可视化手段展现微博信息的传播扩散情况,如转发关系、转发层级、转发范围等情况。最后,归纳全文,从技术和应用2个方面归纳微博分析的挑战问题:可从技术上突破微博接口资源限制,提高微博分析的效率和精准度;同时从微博应用方面发展事件监控、管理和商业方面的应用。  相似文献   

10.
用户发布的微博内容能够体现用户兴趣,微博中用户的转发、评论、回复、他人评论等微博行为对用户兴趣具有很强的指导作用。为了有效利用用户微博行为,提出了一种基于有指导LDA(latent dirichlet allocation)的微博内容用户兴趣建模方法。首先通过分析对微博的转发、评论、回复、他人评论这4个因素对用户微博兴趣主题的影响,定义了4种约束关系;然后基于用户微博内容,将4种约束关系融合到LDA 模型中构建有指导的LDA微博主题生成模型,最后得到用户的微博主题分布,从而获得用户兴趣模型。实验结果表明,相比LDA模型,该方法的准确率有很大提高,引入4种信息对微博用户兴趣发现有非常重要的指导作用。  相似文献   

11.
针对目前语义搜索过程中存在效率低、 用户推荐误差大等问题, 提出一种基于抽取规则和本体映射的语义搜索算法. 首先根据用户语义搜索要求抽取语义中的元素和属性, 解决数据利用率低的缺陷; 然后建立语义模型, 构建本体之间的元素及属性之间的映射, 消除用户需求和计算机之间的语义偏差; 最后将语义搜索算法应用于用户个性化推荐系统. 实验结果表明, 该语义搜索算法有效提高了搜索效率, 降低了用户个性化推荐误差.  相似文献   

12.
针对社交网络用户人格预测问题, 提出一种结合信息增益与语义特征提炼用户文本信息, 并采用多标签分类算法进行综合预测的方法. 先基于信息增益提取文本词特征, 包括情感词、 词性和时态等, 进行特征选择与加权; 对于语义特征, 将文本内容映射为本体概念并计算语义相关度; 然后以基于词的特征和语义特征的共同
影响为依据, 运用多标签分类算法执行人格预测过程, 从不同角度处理文本信息, 并充分考虑了类标签间的相关性. 实验结果验证了该方法的有效性.  相似文献   

13.
User interest is not static and changes dynamically. In the scenario of a search engine, this paper presents a personalized adaptive user interest prediction framework. It represents user interest as a topic distribution, captures every change of user interest in the history, and uses the changes to predict future individual user interest dynamically. More specifically, it first uses a personalized user interest representation model to infer user interest from queries in the user’s history data using a topic model; then it presents a personalized user interest prediction model to capture the dynamic changes of user interest and to predict future user interest by leveraging the query submission time in the history data. Compared with the Interest Degree Multi-Stage Quantization Model, experiment results on an AOL Search Query Log query log show that our framework is more stable and effective in user interest prediction.  相似文献   

14.
RNA二级结构预测是生物信息学的重要研究内容。本文提出了一个新的启发式算法进行带假节的RNA结构预测。本文首先通过对RNA序列的若干特征和RNA二级结构进行相关性分析,从中选择跟RNA结构有较大相关性的特征,然后依据遗传算法、综合自由能、被选择茎区的条数以及被选择茎区的平均长度等特征来构造打分函数预测RNA的结构。本文对该方法进行了测试,结果表明本文所采用的从特征分析中得出的打分函数以及通过启发式算法来叠加茎的方法是有效的,在对tRNA以及5SrRNA等序列的预测上相比单纯的自由能最小方法有更高的准确性。并且该方法进一步推广到预测含假结的RNA的二级结构时也有较好的结果。  相似文献   

15.
《清华大学学报》2020,25(2):227-238
Dynamic Quality of Service(QoS) prediction for services is currently a hot topic and a challenge for research in the fields of service recommendation and composition.Our paper addresses the problem with a Time-aWare service Quality Prediction method(named TWQP),a two-phase approach with one phase based on historical time slices and one on the current time slice.In the first phase,if the user had invoked the service in a previous time slice,the QoS value for the user calling the service on the next time slice is predicted on the basis of the historical QoS data;if the user had not invoked the service in a previous time slice,then the Covering Algorithm(CA) is applied to predict the missing values.In the second phase,we predict the missing values for the current time slice according to the results of the previous phase.A large number of experiments on a real-world dataset,WS-Dream,show that,when compared with the classical QoS prediction algorithms,our proposed method greatly improves the prediction accuracy.  相似文献   

16.
基于用户移动行为相似性聚类的Markov位置预测   总被引:1,自引:0,他引:1  
由于采集点丢失或出现新用户等原因,GPS轨迹数据往往具有稀疏性,使得基于单个用户数据的位置预测准确率较低.针对这种情况,提出了基于移动行为相似性和用户聚类的Markov位置预测方法.首先,基于Voronoi图和原始GPS轨迹进行区域划分,位置预测基于区域轨迹进行;其次,提出了同时考虑用户转移特性和用户区域特性的移动行为相似性计算方法;再次,根据移动行为相似性对用户进行聚类,并在聚类的用户组上采用一阶Markov模型进行位置预测,提高了位置预测的准确性.真实GPS轨迹数据上的实验表明了所提出方法的有效性.  相似文献   

17.
针对基于音乐作品信息的音乐作品个性化推荐及协同过滤方法的不足,通过分析音乐作品需求者的音乐试听数据及下载数据,并结合LDA(latent Dirichlet allocation)主题挖掘模型,提出一种基于LDA-MURE模型的推荐算法.实验结果表明,与基于音乐作品需求者的协同过滤算法和基于音乐属性项目的协同过滤算法相比,LDA-MURE算法可更高效地向音乐作品需求者推荐感兴趣的音乐作品.  相似文献   

18.
点击率预测可以提高用户对所展示互联网广告的满意度,支持广告的有效投放,是针对用户进行广告的个性化推荐的重要依据.对于没有历史点击记录的用户,仍需对其推荐广告,预测所推荐广告的点击率.针对这类用户,以贝叶斯网这一重要的概率图模型,作为不同用户之间广告搜索行为的相似性及其不确定性的表示和推理框架,通过对用户搜索广告的历史记录进行统计计算,构建反映用户间相似关系的贝叶斯网,进而基于概率推理机制,定量度量没有历史点击记录的用户与存在历史点击记录的用户之间的相似性,从而预测没有历史点击记录的用户对广告的点击率,为广告推荐提供依据.通过建立在KDD Cup 2012-Track 2的Tencent CA训练数据集上的实验,测试了方法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号