首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 859 毫秒
1.
食品安全是广受民众关注的热点话题,而微博已经成为食品安全事件曝光的主要媒体平台.以微博语料作为数据源,同时使用微博内容和用户的社交网络行为特征,提出了基于动量模型的食品安全事件发现方法.该方法以事件发现作为描述食品安全事件的基本模型,以检测出微博信息流中与食品安全相关的候选特征词,然后采用动量模型实现候选特征词的动量建模和重复特征词的有效过滤.最后,通过K-means聚类将有效的特征词进行归类合并,以实现食品安全事件的发现.试验结果表明:该方法能够有效发现在微博中传播的食品安全事件,并能过滤掉微博中无关的话题.  相似文献   

2.
基于改进PageRank算法的微博用户影响力评估   总被引:1,自引:0,他引:1  
为筛选微博网络和消息传播中的意见领袖,综合分析微博用户属性、行为和微博消息的传播特性,把用户的影响力因素分为:用户潜在影响力和微博传播影响力,据此构建用户影响力评估指标.进而提出基于改进RankPage算法的微博用户影响力评估算法.通过采集新浪微博某一话题下的数据计算用户的影响力,验证了方法的有效性和合理性.  相似文献   

3.
利用微博数据检测突发事件具有重要意义.针对以往检测方法特征不够丰富、准确率不高等问题,提出了一种基于多种特征融合的微博突发事件检测方法.该方法根据情感符号构建情感特征模型,对微博数据进行情感分类,并采用Kleinberg算法对情感特征进行突发期检测;在突发期内根据词频特征、词频增长特征和话题标签特征融合加权提取突发词,...  相似文献   

4.
微博转发是微博信息传播的重要途经.影响微博转发的因素主要是用户属性、微博内容、用户社交和用户兴趣.已有的微博转发预测模型仅考虑部分因素,实际上4个因素对用户转发行为都有影响,此外也应该关注预测模型的计算时间.基于此,提出一种基于混合特征和XGBoost算法的微博转发预测模型.首先根据4个因素分别提取用户特征、微博特征、社交特征以及兴趣特征;然后基于PageRank算法计算用户影响力,基于隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型和KL距离计算兴趣相似度,定义用户转发活跃度和用户交互影响力的计算公式;最后利用XGBoost算法构建预测模型,对转发预测进行分析.实验结果表明,新的预测方法在准确率和时间等评价指标上有较好的表现,同时也验证了综合考虑4个因素的重要性和有效性.  相似文献   

5.
社交网络服务每天产生大量涉及众多话题的信息,并在影响力各异的用户群体推动下广泛传播。在IP(influence passivity)算法的基础上,提出了一种综合话题相似性与信息时效性的影响力用户发现算法EIP(extended influence-passivity)。该算法在转发网络上考虑用户间话题的相似性以及博文信息时效性,更加精准地建模和计算用户的影响力和消极性。基于新浪微博上爬取的约10万用户数据集上的实验验证,EIP影响力度量算法优于IP和TwitterRank等现有方法。  相似文献   

6.
为适应微博数据的短文本、低词频、缺乏语义表达等特殊性,提高话题发现的准确性,利于用户从大量微博数据中获取有用信息,本文提出一种基于BTM和加权K-Means方法实现微博话题发现。首先,针对微博数据稀疏性的问题,采用BTM模型对微博中的短文本进行建模,获得话题词;然后针对传统K-Means算法本身的缺陷,提出加权K-Means算法实现微博话题发现;最后实验验证本文的方法,实验结果表明,BTM和加权K-Means方法解决了微博数据高维度和稀疏性的问题,提高了热点话题发现的准确性和有效性。  相似文献   

7.
传统热点检测算法仅从单一的某个维度衡量话题的热度,导致热点话题检测精度低,在对突发性热点话题进行检测时尤为明显。针对此问题,提出一种多维度热点话题度量模型。该模型对话题进行筛选,得到一个热点话题初始集,再融入话题热度的影响力因子,计算各个话题的综合权值,将话题的综合权值按照一定的权重与多维度热点话题度量模型进行有效融合,得到一种基于微博多维度及综合权值的热点话题检测模型。通过使用真实的微博数据进行实验对比分析,实验结果表明,提出的多维度热点话题度量模型在对突发性热点话题的检测中,其准确率(Precision)、召回率(Recall rate)和F1值(F-measure)3个评估指标相比传统算法有了较大提高;利用该模型对突发性热点话题进行跟踪,通过与官方指数进行对比,该模型能有效跟踪其发展趋势。  相似文献   

8.
微博类社交网络中信息传播的测量与分析   总被引:1,自引:0,他引:1  
为了更好地掌握在线社交网络中信息传播的特征规律和用户行为,以新浪微博为代表对社交网络中的信息传播进行了较大规模的测量、统计和分析,提出了一种三角和算法用于探测用户粉丝数阈值。该算法根据散点分布的统计规律来估计使微博热度达到某一值的粉丝数的临界值,发现为使微博热度大于10,用户粉丝数应大于150。其他测量分析结果表明:新浪微博具有很强的"名人效应",用户频繁地发帖并不能引起较大的关注,热门微博的热度几乎都以激增方式增长。这些结论对网络营销和网络监管具有参考价值。  相似文献   

9.
以网络爬虫方式获取新浪微博用户属性信息及微博内容数据,利用数据挖掘技术从中发现微博用户间的多种显式和隐式关系.在此基础上,提出一种基于半监督学习的用户兴趣匹配预测算法,参照仓室模型的传播个体状态划分方法,基于传播个体间的兴趣匹配度界定各状态之间的转移过程和转移概率,进而构建基于用户兴趣匹配的网络舆情传播模型.研究结果表明,该模型能够较好地描述社交网络中的舆情传播规律,重现网络舆情在社交网络中的真实传播过程链.  相似文献   

10.
针对当前微博影响力度量算法中多集中于用户行为属性,忽略博文、结点本身价值的问题,从微博用户信息出发,以线性加权模型为基础,综合分析用户的行为属性、博文相似度、节点相似度,创建影响力评价指标体系。利用Page Rank算法思想,提出了基于用户行为和博文内容的用户影响度量模型(user influence measurement rank,UMR)。通过采用新浪微博真实数据集测试,计算用户的影响力,验证了UMR算法在博文内容的基础上,能客观地反映用户的交互行为,消除僵尸用户对排序的影响,因而更科学、更合理。  相似文献   

11.
文章提出一种能在实时场景下有效度量微博话题中用户影响力的算法。首先从用户文本的话题相关度以及传播网络转评关系出发构建用户特征向量,然后对生成的用户向量使用聚类的方法得到一批高影响力用户,再对这部分用户进行排序最终得到高影响力用户排序列表。同时,算法构造了少量但有效的用户特征以及特征的增量式更新公式,可以在实时环境下增量式运行,适用于捕捉微博中频繁的动态变化。在已有的3个话题数据集上的实验结果表明,文章所提算法的MAP值为0.903。  相似文献   

12.
以新浪微博为研究对象,基于微博主题及用户特征,提出社交网络中的用户转发行为预测算法.首先,基于互信息理论,从已发生转发行为的用户的微博内容中提取特征,通过分析给定用户的微博内容与特征之间的相关程度,预测用户是否会对给定主题的微博发生转发行为;然后通过研究用户性别、粉丝数、关注数、微博数与用户转发行为的关系,选取合适的用户特征描述,并基于贝叶斯模型预测给定用户对微博的转发概率.最后,结合以上2种算法的预测结果,得到给定用户对某主题微博的转发行为预测.该预测算法对研究网络舆情传播及微博营销具有重要意义.  相似文献   

13.
有效挖掘微博空间中的话题意见领袖成为亟待解决的热点问题.针对这一问题,提出了基于LDA语义信息和HowNet知识库的短文本子话题分类算法.对分类后的微博从显式、隐式及用户等方面综合衡量微博的影响力,并根据层次分析法对多个因素进行科学地权值分配.实验结果表明,提出的方法较基于支持向量机的方法具有更好的效果,同时提出的影响力度量模型可以有效地挖掘出微博中的话题意见领袖.  相似文献   

14.
社交网络的流行对用户的隐私保护提出了新的挑战。该文通过使用人类动力学和统计物理的方法,研究用户的网络行为与用户隐私量值的关系。以当前国内流行的社交网络——人人网和新浪微博——为研究对象,获取用户的真实数据,提出隐私量化模型。研究结果表明:用户的网络行为对隐私量值具有重要的影响,如在人人网中用户的地理位置分享行为对隐私量值影响较大,而在新浪微博中发私信行为对隐私量值的影响最大。研究的结果对社交网络隐私关注下的用户行为规律探讨具有理论与实际意义。  相似文献   

15.
随着互联网的发展,网络信息正飞速增长.社交网络如Facebook,Twitter,微博等相继出现,用户通过虚拟平台可以获得自己感兴趣的信息,找到爱好相投者.面对海量的内容信息,如何选择各自所需成了当下研究的话题,因此推荐系统应运而生.进一步地,如何更加个性化推荐信息也成为探讨热点.本文以微博社区为平台提出了一种基于微博的个性化社区推荐算法,通过对传统的Jaccrad相似度方法改进,从用户所关注博主以及所参与社区或话题两方面考虑用户之间相似性.继而通过改进的Page Rank算法筛选出具有影响力的对象作为待推荐集.与传统Jaccard和Page Rank算法相比,本算法在平均准确率的平均值MAP上分别提高了42.6%和34.3%.  相似文献   

16.
社交媒体的出现推动了对用户在线行为规律的研究。该文探讨微博中用户的转发行为规律。对这一问题的回答能够帮助人们更好地理解影响用户行为的因素,并且对用户转发行为的准确描述有利于对信息传播施加干预和控制。该文参考一个兴趣驱动的人类行为动力学模型,在分析其用户行为时长的基础上,针对差异化的用户行为时长和昼夜作息因素,提出了一个改进模型用以描述微博用户的转发行为。实际数据中用户相邻转发行为时间间隔呈现重尾分布,仿真结果与之相符,证明了该模型的有效性和灵活性。  相似文献   

17.
社交网络中的用户领导者挖掘是用户影响力分析的重要问题.提出一种基于用户影响力评估的社交网络用户领导者挖掘算法.首先,描述问题模型以及模型相关定义;其次,提出了基于用户影响力和用户活跃度计算的用户领导力评估方法;最后,依据用户领导力和用户中心度计算实现用户领导者的挖掘.实验印证了该方法对于社交网络挖掘用户领导者的可行性和有效性.  相似文献   

18.
GitHub社交平台是代码托管领域的主流平台,拥有超过7300万开发人员.评估GitHub社交网络中用户的影响力对开源成果的学习和应用有重要意义.针对PageRank算法及其改进方法在评估用户影响力时对用户交互行为与用户自身因素分析不全面的局限性,提出了一种引入用户行为权值分配策略的影响力计算方法CUIE(Comprehensive User Influence Evaluation)算法,将用户行为对其他用户影响力的贡献比例作为权值计算用户的CUIE值.基于真实数据的实验结果表明:将用户交互行为作为评价用户影响力分析的因素之一,能使模型获得更好的结果,与传统算法进行对比,在Top-500及以上的情况下,CUIE算法均取得最优的准确率和召回率.此方法能有效发现被传统方法忽略的部分核心用户,可作为传统方法的补充,在舆情分析与引导中也具有一定实用价值.  相似文献   

19.
针对协同过滤推荐算法中存在的冷启动问题,文章提出一种融合人工蜂群的微博话题推荐算法。通过微博话题热度、用户特征、用户偏好和起始时间构建适应度函数,然后求解适应度值,最后根据适应度值对用户进行微博话题推荐。与CF、ACO-CF和PSO-CF三种算法相比,该算法降低了MAE值,说明它能够有效解决协同过滤推荐算法中的冷启动问题,并能提高推荐的准确性。  相似文献   

20.
针对社交网络用户个人信息难以获取、公开信息不完整、不通用甚至内容虚假的问题,选择了普适性强,且能客观、真实反映用户行为习惯的位置数据作为相似性分析依据,对新浪微博、滴滴打车进行位置数据采集,形成两个高价值且具有国内网民特色的数据集作为实验对象.提出了一种基于时间滑动窗口模型的轨迹相似性匹配算法,通过调整时间窗口和位置距离优化算法F值,实现不同网络平台用户的相似性分析.以对新浪微博和滴滴打车的用户位置数据为例进行验证,实验结果证明了地理位置为虚拟身份相似性判断的正相关影响因子,且判断相似性的平均F值超过90%.   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号