首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
科技文献检索时以专业角度给出合理的相关度排序是一项非常重要工作,传统PageRank算法采用了平均分配相似性权重的方式,但其会产生文献排序结果不合理的问题。为此,提出一种将深度学习方法与PageRank相结合的算法,提高文献相关度排序的可靠性。首先,使用具有注意力池化的孪生BERT(Bidirectional Encoder Representation from Transformers)深度学习网络计算文献与引文的相似度;然后,对文献与其所包含引文间的相似度进行规范化处理;最后,将标准化后的相似度作为分配权重对引文网络计算排序。实验结果表明,相较于传统的PageRank算法,该方法检索结果的相关度提升6%以上,因此更适合应用于科技文献的引文网络分析。  相似文献   

2.
为了提高网页排序算法的准确率,从网络用户对网页的浏览、回复、转载等行为引入用户行为因子,从网页结构关系的角度解决网页的权威性需求。结合用户行为和网页结构分析提出一种改进的PageRank算法BPR(PageRank based on User-behavior)。实验表明,该算法能够有效地解决PageRank排序算法中关于新网页排名过低和网页权威值均分的问题,提高了网页排序的精确性。  相似文献   

3.
针对传统PageRank算法平均分配PageRank值给每个超链接网页这一缺陷,提出了改进的PageRank算法,并证明如果Web网的邻接矩阵P包含至少2个不可约闭子集,则非周期不可约矩阵的次特征值为d且至少2重.为了降低解PageRank近似解的误差和提高幂法的收敛速度,用lingo算得d取0.71,且知若采用改进的...  相似文献   

4.
搜索引擎查询的结果按照一定的规则排序供用户查看,这种规则就是搜索引擎排序算法。目前大多数搜索引擎仍然是通过对搜索引擎的链接关系进行分析,找到相对比较重要的网页。这些算法大多是以PageRanks等经典算法为基础,进行改良,加入各自偏重的参数形成综合的排序模型。  相似文献   

5.
提出了求解PageRank高阶导向量的两种新算法.讨论了PageRank问题系数矩阵的一些数学性质,并从理论上分析了两个公式求解PageRank高阶导向量的优劣.数值实验表明了新算法的数值性态.  相似文献   

6.
基于链接分析的科学文献个性化排序算法   总被引:2,自引:0,他引:2  
 首先分析CiteSeer引文网络的结构特征,然后深入讨论PageRank算法的本质,并在此基础上给出一种科学文献个性化排序算法;最后将该算法应用于CiteSeer引文网络,并对实验结果进行分析。个性化向量的计算是实现个性化排序的关键,本文给出等概率、伪被引次数和带时间约束的伪被引次数3种计算方法。  相似文献   

7.
一个基于PageRank的科技文献质量评价算法   总被引:2,自引:0,他引:2  
针对引文分析中单纯根据文献的被引次数多少来评价文献质量优劣的缺点,提出了一个基于Page-Rank算法思想的文献质量评价算法.该算法综合考虑了文献发表机构、作者的权威性、被引次数及发表时间因素.实验证实可以弥补传统引文分析中计量方法的不足.  相似文献   

8.
针对传统网页排序算法PageRank和HITS中存在的主题漂移、检索效率低等不足,本文提出了一种改进算法PHIA(PageRank and HITS Improved Algorithm)。该算法继承了HITS算法获取根集和基本集的方法,并且使用根集中所有网页的PageRank值作为Hub和Authority初始迭代值,最后根据马尔可夫链求随机矩阵的特征向量的方式来获取网页排名的静态分布。基于随机关键词的检索结果可知,相比于传统的PageRank和HITS算法,改进PHIA算法具有更快的收敛速度,并且在一定程度上提高了网页排序的准确度。  相似文献   

9.
深入剖析了全文检索引擎Lucene的排序算法,针对Lucene排序算法中只考虑了网页自身的内容,没有考虑网页间的关系的现状,提出了一个基于链接分析的Lucene排序算法。我们在Lucene的排序算法的基础上加入PageRank算法,算法中考虑网页点击信息和时间反馈因素,实现网页根据浏览点击率和网页文档的新旧程度,其PR值也随之上下浮动,并采用Sei-del迭代算法加速算法迭代收敛过程。实验结果表明,新的排序算法可以有效地提高Lucene全文检索应用的查准率和Ranking指标。  相似文献   

10.
在银行零售业务交易系统中,如何在大量客户数据交易网络中挖掘出影响力高,潜在价值高的重要发展客户,从而制定相应的业务营销计划,对银行来说是一件至关重要的事情.本文提出一种基于PageRank的改进算法——IER(Improved Enhanced-RatioRank)算法,该算法以客户作为节点,以主动交易金额构成出链权重因子作为有向边,构成一个客户交易网络有向图,通过添加交易次数活跃因子和时间有效性因子等重要因素,从多维角度可以精准有效地挖掘出重要发展客户.最后,利用RFM(Recency, Frequency, Monetary)模型来验证实验结果.实验结果表明,所提算法在银行零售业务交易系统中挖掘重要发展客户有良好的效果.  相似文献   

11.
王福海 《科技信息》2011,(15):J0077-J0077,J0227
对通用搜索引擎中的PageRank排序算法进行分析,针对原PageRank算法中主题漂移问题,提出一种与主题相关的改进算法,改进的PageRank值由链接重要性和内容重要性共同确定。  相似文献   

12.
对网页PageRank算法的改进   总被引:19,自引:0,他引:19  
分析了著名搜索引擎Google采用的PageRank算法,指出其偏重旧网页,忽视专业站点以及对网页中的超链接评估不恰当等不足之处。改进算法考察了网页日期这一重要因素,并重新计算网页中超链接对网页的影响。网页结构中蕴涵着丰富的信息,在href,title等标记中文字对网页主题有重要作用,利用结构标记可以辅助判断网页的主题内容。试验结果表明,采用改进的算法可以提高判断网页重要性的准确度。  相似文献   

13.
PageRank算法是目前被广泛应用的一种度量网页重要性的方法,它根据网页之间的链接结构来给每个网页打分。从数学的角度来解释,PageRank可以被看作是一个马尔可夫随机游走模型,依据网页下一步的链出信息计算网页的转移概率。受计算机象棋算法设计中一个很成功的策略:“多看几步”的启发,改进和推广了经典PageRank算法,提出了更为一般的N-stepPageRank算法,它在计算网页的转移概率时利用了网页N步的链接信息。经典PageRank算法是N-stepPageRank算法N=1时的特殊情形。TREC标准数据集上的试验表明,N-stepPageRank算法能够有效地提高网页搜索的精确度,MAP指标比经典的PageRank的提高超过15%。  相似文献   

14.
为改善影响因子在期刊评价中的不足,基于PageRank算法给出一种期刊影响因子的修正方法.首先,建立期刊之间的互引网络矩阵计算PageRank值(简称PR值),并在期刊互引网络中利用各期刊载文当年的影响因子对被引次数进行加权以反映期刊质量,然后修正期刊自引数量,在此基础上构建基于PageRank算法的影响因子(简称WIF_PR因子),并以图书情报领域中43种期刊为实证对象,利用WIF_PR因子进行期刊评价.结果发现:WIF_PR因子能科学地考虑期刊自引数量、区分不同期刊被引质量,与影响因子、h指数相比,新评价方法评价效果更可靠.  相似文献   

15.
PageRank算法是最为经典的Web结构挖掘算法,但是其存在主题漂移的问题,使得搜索结果中存在大量与查询主题无关的网页。在分析Page Rank算法的基础上,提出利用欧式距离计算主题相似度并融入传统的PageRank算法中,形成一个改进的网页排序算法,并把此算法应用到云计算环境中,研究MapReduce编程模型上的PageRank算法流程。  相似文献   

16.
为了从团伙犯罪中锁定核心犯罪嫌疑人,提高侦破案件的效率,本文提出了一种改进的PageRank算法分析团伙犯罪中各犯罪嫌疑人的嫌疑度值,通过主题相关性度量分析了嫌疑人与案件的关系,通过嫌疑人的重要性度量分析了嫌疑人在团伙犯罪中的地位。改进的算法可以有效协助侦查人员分析一个犯罪网络中各成员的关系,通过嫌疑度排序找出团伙中的核心人员和涉案人员,从而排除非涉案人员。通过一个案件实例验证了该算法的有效性,节省了办案人员的时间精力,提高办案效率。  相似文献   

17.
文章提出了一种基于用户兴趣的网页预分类的PageRank算法,改进后的算法是根据用户对某一类别网页的兴趣,将网页进行预分类.经验证,改进后的算法可以提高搜索引擎的查准率.  相似文献   

18.
在基于链接分析的排序算法PageRank分析基础上,提出了一种基于主题相关性和链接权重的Page-Rank改进算法.该方法首先随机选取任一链出页面,通过主题相关性评价算法获得改进的PageRank值,并重新排序.实验结果显示该算法提高了查询速度、查询准确率,并且算法具有良好的稳定性和可扩展性.  相似文献   

19.
20.
基于超链接分析搜索引擎页面排序算法的剖析   总被引:1,自引:0,他引:1  
对搜索结果的排序是搜索引擎中至关重要的一项技术,算法的好坏直接关系到用户输的搜索引擎页面排序算法。对两种最基本的页面排序算法PageR ank和H ITS的算法思想和实现原理进行详细阐述。通过分析对比,总结出它们各自存在的优点和不足进而指出适合其应用的条件领域。最后指出搜素引擎应用超链接分析时应注意的一些影响因素。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号