首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 531 毫秒
1.
针对协同过滤推荐算法中存在的冷启动问题,文章提出一种融合人工蜂群的微博话题推荐算法。通过微博话题热度、用户特征、用户偏好和起始时间构建适应度函数,然后求解适应度值,最后根据适应度值对用户进行微博话题推荐。与CF、ACO-CF和PSO-CF三种算法相比,该算法降低了MAE值,说明它能够有效解决协同过滤推荐算法中的冷启动问题,并能提高推荐的准确性。  相似文献   

2.
基于改进PageRank算法的微博用户影响力评估   总被引:1,自引:0,他引:1  
为筛选微博网络和消息传播中的意见领袖,综合分析微博用户属性、行为和微博消息的传播特性,把用户的影响力因素分为:用户潜在影响力和微博传播影响力,据此构建用户影响力评估指标.进而提出基于改进RankPage算法的微博用户影响力评估算法.通过采集新浪微博某一话题下的数据计算用户的影响力,验证了方法的有效性和合理性.  相似文献   

3.
社交网络服务每天产生大量涉及众多话题的信息,并在影响力各异的用户群体推动下广泛传播。在IP(influence passivity)算法的基础上,提出了一种综合话题相似性与信息时效性的影响力用户发现算法EIP(extended influence-passivity)。该算法在转发网络上考虑用户间话题的相似性以及博文信息时效性,更加精准地建模和计算用户的影响力和消极性。基于新浪微博上爬取的约10万用户数据集上的实验验证,EIP影响力度量算法优于IP和TwitterRank等现有方法。  相似文献   

4.
考虑到微博数据存在时序性特征以及包含用户的社交网络行为特征,提出一种动量信号增强模型算法来有效地检测微博突发话题.由于传统模型未考虑微博数据变化以及用户社交行为的影响,为此首次提出影响力因子以及热度因子,用以修正动量模型.为获取影响力因子,将计算出当前时点前给定周期内的数据对当前数据的变化差值的指数累计影响作为影响力的衡量标准,以体现词频在该区间段的重要性.影响力因子将用于修正词频序列,以获取MACD值指标.由于用户的社交行为对话题产生影响巨大,进而提出热度因子用以修正MACD值指标.当模型满足指标阈值时,特征词则列为突发特征词.最后,通过K-means聚类算法将特征词进行归类合并,以获取突发话题.实验结果表明,模型精度能达到81.82%,表现良好.  相似文献   

5.
有效挖掘微博空间中的话题意见领袖成为亟待解决的热点问题.针对这一问题,提出了基于LDA语义信息和HowNet知识库的短文本子话题分类算法.对分类后的微博从显式、隐式及用户等方面综合衡量微博的影响力,并根据层次分析法对多个因素进行科学地权值分配.实验结果表明,提出的方法较基于支持向量机的方法具有更好的效果,同时提出的影响力度量模型可以有效地挖掘出微博中的话题意见领袖.  相似文献   

6.
微博转发是微博信息传播的重要途经.影响微博转发的因素主要是用户属性、微博内容、用户社交和用户兴趣.已有的微博转发预测模型仅考虑部分因素,实际上4个因素对用户转发行为都有影响,此外也应该关注预测模型的计算时间.基于此,提出一种基于混合特征和XGBoost算法的微博转发预测模型.首先根据4个因素分别提取用户特征、微博特征、社交特征以及兴趣特征;然后基于PageRank算法计算用户影响力,基于隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型和KL距离计算兴趣相似度,定义用户转发活跃度和用户交互影响力的计算公式;最后利用XGBoost算法构建预测模型,对转发预测进行分析.实验结果表明,新的预测方法在准确率和时间等评价指标上有较好的表现,同时也验证了综合考虑4个因素的重要性和有效性.  相似文献   

7.
微博话题推荐算法的作用是当用户面临微博信息过载时,结合用户的基本信息,帮助用户找到对自己有价值的微博话题。微博推荐算法的核心任务是以用户信息为基础,分析用户的偏好,并推荐给其他信息相似的用户。本文提出的基于用户聚类的微博推荐算法包括三个层次,即用户微博话题特征提取、用户聚类、微博话题推荐。实验表明该系统的准确率达到50.2%,可准确地为用户进行微博话题推荐,并提高了用户浏览微博的效率。  相似文献   

8.
微博的使用人群数量基数大,状态信息更新频繁并且信息传播迅速,因此对微博平台上信息的挖掘具有重要意义,但是由于微博数据的海量性、突发性以及微博格式的不规则性,加大了采集数据的技术难度.在分析对比了基于Cookie爬虫微博数据采集方法和基于API接口微博数据采集方法的基础上,提出了一种基于用户影响力的微博用户信息采集方案.将每一个API调用封装成一个Task类嵌入到具有模拟登陆功能的爬虫程序中,通过贝叶斯-Pagerank算法量化微博用户之间的关注关系得到用户的影响力值,依据用户影响力值决定爬取顺序,可以在有限的时间内采集到更多有价值的节点信息.实验结果表明该方案在微博数据采集的效率与性能上都有较大提高.  相似文献   

9.
聚类分析算法作为一种主要的Web使用挖掘技术,在个性化推荐系统中得到了广泛应用,然而面对Web动态性所引起的网页的更新以及用户行为方式的改变,已有的聚类算法并不能很好地解决这一问题。针对这一问题,本文以一种无向图的形式表示用户对网站的访问,提出一种可实时反映网站及用户行为变化情况的增量式页面聚类算法,并在页面聚类的基础上提出相应的推荐决策算法动态生成页面推荐。  相似文献   

10.
随着互联网的发展,网络信息正飞速增长.社交网络如Facebook,Twitter,微博等相继出现,用户通过虚拟平台可以获得自己感兴趣的信息,找到爱好相投者.面对海量的内容信息,如何选择各自所需成了当下研究的话题,因此推荐系统应运而生.进一步地,如何更加个性化推荐信息也成为探讨热点.本文以微博社区为平台提出了一种基于微博的个性化社区推荐算法,通过对传统的Jaccrad相似度方法改进,从用户所关注博主以及所参与社区或话题两方面考虑用户之间相似性.继而通过改进的Page Rank算法筛选出具有影响力的对象作为待推荐集.与传统Jaccard和Page Rank算法相比,本算法在平均准确率的平均值MAP上分别提高了42.6%和34.3%.  相似文献   

11.
针对传统的PageRank算法中存在主题漂移和偏重旧网页的弊端,提出了一种基于改进PageRank算法的微博用户影响力排序方法——TSPR算法.该算法将时间因素作为横向标度,采用TF-IDF方法计算网页间的相似度,并具体分析某个时间段用户搜索主题相似度的变化.通过计算网页PR值的大小,从而对微博用户影响力进行排序.仿真实验结果表明,该算法改善了微博用户影响力排序效果,与此同时,提高了搜索质量和准确率.  相似文献   

12.
追踪事件微博报道:一种流的动态话题模型   总被引:1,自引:0,他引:1  
为了解决微博中存在的话题漂移和大量噪声问题,提出了基于动态话题模型和微博信息熵相结合的流的动态话题模型。首先利用动态话题模型在整个追踪过程,从正反两个方面增强对追踪话题的描述,进一步克服了话题漂移问题。但由于微博中存在大量中间类微博,所以定义并使用微博信息熵来衡量一条微博对于话题报道的重要性,并将其扩展到动态话题模型中,用于区分新闻类和中间类微博。在超过17万用户的1 200万条微博上进行了话题追踪,实验结果表明,本文算法较之传统的动态话题模型更有效,追踪结果包含更少噪声。  相似文献   

13.
研究微博用户转发行为,预测微博转发概率,确定影响微博转发概率的因素,在热点挖掘、产品营销、舆情监控、谣言控制等方面有重要的现实意义.本文介绍了影响微博转发的用户特征,其中比较典型的有用户影响力、粉丝平均标签数、粉丝活跃度等特征.通过粉丝数-关注数算法、用户标签数算法、粉丝活跃度算法等分析了它们与微博转发之间的关联关系,并确定各个属性的阈值,这些阈值对微博转发预测起到了至关重要的作用.  相似文献   

14.
以新浪微博为研究对象,基于微博主题及用户特征,提出社交网络中的用户转发行为预测算法.首先,基于互信息理论,从已发生转发行为的用户的微博内容中提取特征,通过分析给定用户的微博内容与特征之间的相关程度,预测用户是否会对给定主题的微博发生转发行为;然后通过研究用户性别、粉丝数、关注数、微博数与用户转发行为的关系,选取合适的用户特征描述,并基于贝叶斯模型预测给定用户对微博的转发概率.最后,结合以上2种算法的预测结果,得到给定用户对某主题微博的转发行为预测.该预测算法对研究网络舆情传播及微博营销具有重要意义.  相似文献   

15.
传统热点检测算法仅从单一的某个维度衡量话题的热度,导致热点话题检测精度低,在对突发性热点话题进行检测时尤为明显。针对此问题,提出一种多维度热点话题度量模型。该模型对话题进行筛选,得到一个热点话题初始集,再融入话题热度的影响力因子,计算各个话题的综合权值,将话题的综合权值按照一定的权重与多维度热点话题度量模型进行有效融合,得到一种基于微博多维度及综合权值的热点话题检测模型。通过使用真实的微博数据进行实验对比分析,实验结果表明,提出的多维度热点话题度量模型在对突发性热点话题的检测中,其准确率(Precision)、召回率(Recall rate)和F1值(F-measure)3个评估指标相比传统算法有了较大提高;利用该模型对突发性热点话题进行跟踪,通过与官方指数进行对比,该模型能有效跟踪其发展趋势。  相似文献   

16.
立场检测任务的目的是通过分析用户对特定话题发表的评论以判断其对该话题是支持还是反对的,该任务的关键是捕捉文本信息与其对应话题的相关特征。针对目前已有的微博立场检测模型存在仅考虑文本特征,而未结合话题特征,以及忽略了情感信息对微博立场检测的影响而导致分类效果差的问题,文章提出基于卷积注意力的情感增强微博立场检测模型。该模型通过卷积注意力对文本信息和其对应的话题信息提取特征,同时捕捉其相关特征,然后通过情感增强中词语级情感增强获得带有情感信息的词向量表示,将其与相关特征点相乘得到针对话题的情感增强句向量,其次通过拼接句子级情感增强特征以丰富最终的语义表示,最后对该语义表示进行分类。该模型在NLPCC-2016数据集中取得了较好的结果,相对于目前最优模型在五个话题上分别提高了7.9%、5.8%、5.3%、1.3%和5.2%。  相似文献   

17.
为适应微博数据的短文本、低词频、缺乏语义表达等特殊性,提高话题发现的准确性,利于用户从大量微博数据中获取有用信息,本文提出一种基于BTM和加权K-Means方法实现微博话题发现。首先,针对微博数据稀疏性的问题,采用BTM模型对微博中的短文本进行建模,获得话题词;然后针对传统K-Means算法本身的缺陷,提出加权K-Means算法实现微博话题发现;最后实验验证本文的方法,实验结果表明,BTM和加权K-Means方法解决了微博数据高维度和稀疏性的问题,提高了热点话题发现的准确性和有效性。  相似文献   

18.
针对当前微博影响力度量算法中多集中于用户行为属性,忽略博文、结点本身价值的问题,从微博用户信息出发,以线性加权模型为基础,综合分析用户的行为属性、博文相似度、节点相似度,创建影响力评价指标体系。利用Page Rank算法思想,提出了基于用户行为和博文内容的用户影响度量模型(user influence measurement rank,UMR)。通过采用新浪微博真实数据集测试,计算用户的影响力,验证了UMR算法在博文内容的基础上,能客观地反映用户的交互行为,消除僵尸用户对排序的影响,因而更科学、更合理。  相似文献   

19.
随着社交网络的快速发展,人们可利用微博平台发表、分享自己的观点以及抒发某种情绪,进而产生了大量针对不同话题的博文和情绪信息,但传统的文本挖掘算法在处理这些短小且具富含个性化情感信息的微博文本方面有所欠缺。在此提出一种基于微博文本的特征权重计算方法,可据此得到博主在不同时间段的关注点,通过情绪分类,分析用户在不同时间段内的情绪变迁情况。实验结果证明此方法具有一定的可行性。  相似文献   

20.
以短文本内容发布为主要特点的微博,已经成为重要的信息传播媒介,预测微博流行度对舆情监测、企业营销、热点推送等都具有重要意义.当前对微博流行度预测的研究主要侧重于对所有用户的微博数据进行统一建模预测,鲜有研究考虑不同影响力用户之间的差异.而微博数据的分析显示标签、提及和微博长度等对微博流行度的影响会随发布者的影响力变化显示出明显差异,在流行度预测中充分考虑这些差异,有助于取得更好的预测结果.为此,在流行度预测中引入多任务学习(Multi-Task Learning,简称MTL),并结合SVM构建SVM+MTL模型,此模型通过同时考虑所有用户的共同特性和不同用户的具体特性来提高预测性能.此外,除了预测常用的用户属性和微博发布行为等特征外,还引入微博内容相似性这一新特征,该特征能明显提高预测准确率.基于微博数据的实验表明,SVM+MTL模型可以有效提高微博流行度预测性能.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号