共查询到20条相似文献,搜索用时 109 毫秒
1.
基于改进PageRank算法的微博用户影响力评估 总被引:1,自引:0,他引:1
为筛选微博网络和消息传播中的意见领袖,综合分析微博用户属性、行为和微博消息的传播特性,把用户的影响力因素分为:用户潜在影响力和微博传播影响力,据此构建用户影响力评估指标.进而提出基于改进RankPage算法的微博用户影响力评估算法.通过采集新浪微博某一话题下的数据计算用户的影响力,验证了方法的有效性和合理性. 相似文献
2.
GitHub社交平台是代码托管领域的主流平台,拥有超过7300万开发人员.评估GitHub社交网络中用户的影响力对开源成果的学习和应用有重要意义.针对PageRank算法及其改进方法在评估用户影响力时对用户交互行为与用户自身因素分析不全面的局限性,提出了一种引入用户行为权值分配策略的影响力计算方法CUIE(Comprehensive User Influence Evaluation)算法,将用户行为对其他用户影响力的贡献比例作为权值计算用户的CUIE值.基于真实数据的实验结果表明:将用户交互行为作为评价用户影响力分析的因素之一,能使模型获得更好的结果,与传统算法进行对比,在Top-500及以上的情况下,CUIE算法均取得最优的准确率和召回率.此方法能有效发现被传统方法忽略的部分核心用户,可作为传统方法的补充,在舆情分析与引导中也具有一定实用价值. 相似文献
3.
张芳 《南阳理工学院学报》2015,(2):35-37,50
为了提高网页排序算法的准确率,从网络用户对网页的浏览、回复、转载等行为引入用户行为因子,从网页结构关系的角度解决网页的权威性需求。结合用户行为和网页结构分析提出一种改进的PageRank算法BPR(PageRank based on User-behavior)。实验表明,该算法能够有效地解决PageRank排序算法中关于新网页排名过低和网页权威值均分的问题,提高了网页排序的精确性。 相似文献
4.
为了从团伙犯罪中锁定核心犯罪嫌疑人,提高侦破案件的效率,本文提出了一种改进的PageRank算法分析团伙犯罪中各犯罪嫌疑人的嫌疑度值,通过主题相关性度量分析了嫌疑人与案件的关系,通过嫌疑人的重要性度量分析了嫌疑人在团伙犯罪中的地位。改进的算法可以有效协助侦查人员分析一个犯罪网络中各成员的关系,通过嫌疑度排序找出团伙中的核心人员和涉案人员,从而排除非涉案人员。通过一个案件实例验证了该算法的有效性,节省了办案人员的时间精力,提高办案效率。 相似文献
5.
微博作为近年来用户数量较多的社交应用,其用户的信息压力也相对较大,推荐技术对于微博用户的体验和推广有很明显的帮助.本文将针对微博平台的好友推荐进行研究,分别采用基于社交网络分析和基于协同过滤技术的推荐算法.经过两种算法的实验对比得出结论:基于协同过滤的好友推荐算法具有较好的性能,在推荐好友数量较多的情况下依然具有较高的综合评价指标,提高了好友推荐的质量. 相似文献
6.
在基于链接分析的排序算法PageRank分析基础上,提出了一种基于主题相关性和链接权重的Page-Rank改进算法.该方法首先随机选取任一链出页面,通过主题相关性评价算法获得改进的PageRank值,并重新排序.实验结果显示该算法提高了查询速度、查询准确率,并且算法具有良好的稳定性和可扩展性. 相似文献
7.
微博的热点事件会产生大量评论数据,这些数据是进行舆情分析和网络水军识别等数据挖掘的基础.论文分析对比常用的网络爬虫技术和框架,分别使用Selenium框架和Json数据接口两种方法,采集新浪微博热点事件下的用户评论数据.一般网络爬虫技术多使用广度搜索,这里采用深度搜索,能够更精确地获得某个热点事件下的用户评论数据. 相似文献
8.
社交网络,如Twitter,Facebook,逐渐成为人们交流信息的主要平台.挖掘社交网络中有影响力的用户也成为一个新的研究热点.本文利用一种普遍存在于社交网络中的结构,本文称为共同主题群(common-topic group),提取出某个特定主题的用户及其相关信息.然后将获取数据抽象成三层网络结构:联系层(relation-layer),发帖层(post-layer)和回复层(comment-layer).基于三层结构,本文提出PostRank算法分别计算三层得分,最后综合得出用户最终影响力得分.实验表明,本文的算法可以根据具体应用调整参数,并且综合了In-degree算法和原始PageRank算法所考虑的因素. 相似文献
9.
现有的微博好友推荐算法没有充分考虑网络关系结构,导致发现的邻居群合理性较差。针对这个问题,围绕微博用户群聚规律和社交网络特点展开研究,提出一种基于核心用户对发现的微博好友推荐算法;该算法首先将任意两个具有相互关注关系的用户封装成用户对的形式并计算各用户对之间的交互行为相似度,然后通过密度和距离两个参数发现核心用户对以及划分合理的邻居类簇,最后根据制定的推荐规则向用户进行好友推荐。结果表明,相比传统的协同过滤方法,该算法明显提高了微博好友推荐的精度,核心用户对发现、类簇的合理划分以及推荐规则的制定能够缓解数据稀疏和冷启动带来的问题。 相似文献
10.
近些年,微博、博客、人人网、豆瓣等各种社交网络的发展,引发了学术界对社会网络、虚拟社区的关注.本论文提出了一种基于用户转发的User-Behavior Rank(UBR)算法,力求在推荐过程执行之前,预先选出微博社区中具有权威性的博主,提高推荐新颖性.文中的基于转发行为的User-Behavior Rank是对传统的Page Rank(PR)的改进,以博主之间的关注关系为边,基于其发微博的行为以及其粉丝对微博的转发,计算各自的UBR值,取UBR值较大的博主作为推荐集合.与Page Rank相比,UBR能够选出更加符合社会实际的有影响力的用户集. 相似文献
11.
目前的社交网络用户推荐算法针对性较弱,用户兴趣不明显.针对这些问题,设计一种基于兴趣的潜在用户推荐算法.抽取用户的Tag标签,计算标签间的语义相似度,通过用户与其关注者之间的关系和兴趣程度对关注者进行打分,根据打分结果进行潜在用户的推荐.实验结果表明,基于兴趣的用户推荐算法对潜在用户的预测和推荐准确度有所提高. 相似文献
12.
信息传播和用户影响力度量是目前微博研究的基础和热点方向。为了定量地研究用户影响力,提出基于用户消息传播范围的用户影响力量化定义,并给出用户影响力的计算方法。在真实数据集上对算法的验证结果显示,与其他用户影响力度量方法相比,本文提出的方法计算复杂性低、指标稳定性高,尤其适合于需要限定数据集、限定时间段的具体应用场景。 相似文献
13.
张恺 《佛山科学技术学院学报(自然科学版)》2015,(2):66-70
PageRank算法是最为经典的Web结构挖掘算法,但是其存在主题漂移的问题,使得搜索结果中存在大量与查询主题无关的网页。在分析Page Rank算法的基础上,提出利用欧式距离计算主题相似度并融入传统的PageRank算法中,形成一个改进的网页排序算法,并把此算法应用到云计算环境中,研究MapReduce编程模型上的PageRank算法流程。 相似文献
14.
微博,是当前重要的社会信息传播平台之一,具有易操作、传播快等特点,人们可以通过微博直接快速地表达对突发事件、公众人物、热门产品等的观点。为了利用海量微博信息,需要综合多种分析方法挖掘其潜在价值。综述了当前微博分析领域的研究现状,提出了自主研发的微博分析系统,探讨了未来微博分析的研究方向。首先,介绍了微博分析的主要技术方法,包括利用微博开放平台和利用网络爬虫技术。利用微博提供的开放接口,可以方便快捷地获取微博信息,如微博内容、用户评论、用户个人详情、粉丝数、关注数等。但也存在诸多限制,如每小时只能抓取有限次数、微博平台并不开放所有信息资源等。利用网络爬虫技术可以获取更多信息,如基于全网的网络爬虫的信息采集技术可以覆盖更广的范围,基于主题的网络爬虫的信息采集技术可以选择性爬取预先设定的主题等。其次,介绍了目前微博分析的热点问题,包括微博用户行为和微博内容两方面。微博用户行为分析包括:1)传播网络研究,利用Gephi等可视化工具,呈现出微博在传播过程中的传播路径、传播范围、关键转发节点等信息,可用于预测未来传播情况;2)传播因素研究,通过分析用户行为,揭示信息传播的可能原因;3)用户影响力分析,不同学者给出不同的度量方法,而要精准地评价用户影响力需要综合考虑多方面因素,如粉丝数、转发数、被提及数、回复、社会关系等。关于微博内容的分析包括:1)微博文本预处理,包括分词和去停用词2个步骤;2)微博热点话题发现,常用方法包括基于词频的统计方法和文本聚类方法,这两种方法都有利于提高发现热点话题的效果,但没有考虑到话题动态演变的特性;3)情感分析,也被称为观点挖掘,一直是微博研究领域的热点问题,可以利用微博表情图片抽取情感词,并结合构建语义词典和机器学习的方法对微博进行情感分类,最终判断微博情感极性,可用于舆情监控、商业预测和产品选择等方面。再次,提出了自主研发的微博分析系统——阅微,重点介绍了其情感分析、地域分布和传播图3个模块。情感分析模块,基于情感词典的方法对用户的评论内容进行情感分类;地域分布模块,提取参与用户的地理位置信息并加以统计分析,呈现出微博传播在全国范围内的分布情况;传播图模块,利用可视化手段展现微博信息的传播扩散情况,如转发关系、转发层级、转发范围等情况。最后,归纳全文,从技术和应用2个方面归纳微博分析的挑战问题:可从技术上突破微博接口资源限制,提高微博分析的效率和精准度;同时从微博应用方面发展事件监控、管理和商业方面的应用。 相似文献
15.
针对传统网页排序算法PageRank和HITS中存在的主题漂移、检索效率低等不足,本文提出了一种改进算法PHIA(PageRank and HITS Improved Algorithm)。该算法继承了HITS算法获取根集和基本集的方法,并且使用根集中所有网页的PageRank值作为Hub和Authority初始迭代值,最后根据马尔可夫链求随机矩阵的特征向量的方式来获取网页排名的静态分布。基于随机关键词的检索结果可知,相比于传统的PageRank和HITS算法,改进PHIA算法具有更快的收敛速度,并且在一定程度上提高了网页排序的准确度。 相似文献
16.
基于关系代数的关联规则挖掘算法 总被引:3,自引:0,他引:3
目的提出基于关系代数理论的关联规则挖掘算法。方法利用数据预处理方法,剔除无关属性、获得相应的目标特征子集。结果基于目标特征子集,利用关系矩阵及相关运算给出了搜索大项集的基于关系代数理论的优化的关联规则挖掘算法,该算法只需扫描数据库一次。结论克服了经典的Apriori算法需要多次扫描数据库的缺点,同时算法具有良好的并行性和可伸缩性。 相似文献
17.
文章提出在传统页面权重(PageRank)的基础上,通过用户兴趣和在线相关反馈技术来改进PageR-ank的计算方法,从而提高对特定用户的搜索准确性,并给出了计算公式。 相似文献
18.
目前互联网技术的研究热点是智能化的、个性化的服务,而传统的Web搜索排序算法和已有的个性化排序已经不能满足政府、企业等用户的信息查询需要.本文将研究核心定位到充分理解用户查询偏好上,提出了基于用户偏好的PageRank算法.文中利用用户互反馈技术修正查询关键词,利用语义相关性技术分析用户查询意图,理解用户偏好.改进的算法完善了搜索查询的可靠性依据,能够较好地挖掘用户的偏好主题,贴近用户的查询目的,提高搜索查询效率和用户满意度. 相似文献
19.
数据库是信息系统的核心,是最吸引攻击者的目标,其用户行为记录是一种特定的类型,有相对固定的成份。FP-Growth算法在规则挖掘时会产生一些冗余的、无意义的规则。本文首先给出数据库用户行为的定义,将数据库的用户行为属性按重要性阈值排序,并从中选取关键属性或属性组,在FP-Growth算法的基础上提出一种基于用户行为分析的BFP-Growth算法,避免产生无意义的规则,节省了存储空间和时间,提高了挖掘效率。 相似文献
20.
本文提出了一种基于图论聚类算法和PageRank原理的领域后控词表自动构建方法,并以图书馆情报档案领域部分文献为实验数据,验证了运用该方法自动构建领域后控词表的可行性. 相似文献