首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 46 毫秒
1.
搜索引擎已经成为当前检索信息的重要工具.为了提高网站在搜索引擎中的排名,必须对网站进行优化。文章针对目前流行的Google搜索引擎,集中研究了网站结构对基于PageRank算法的网站搜索引擎排名产生的影响,并分析该算法在独立网站下的效果,提出了相应的优化策略,总结了PageRank算法存在的不足,这对促进网络信息获取技术向高精度、智能化方向发展提供了很大的参考价值。  相似文献   

2.
文章提出了一种基于用户兴趣的网页预分类的PageRank算法,改进后的算法是根据用户对某一类别网页的兴趣,将网页进行预分类.经验证,改进后的算法可以提高搜索引擎的查准率.  相似文献   

3.
在基于链接分析的排序算法PageRank分析基础上,提出了一种基于主题相关性和链接权重的Page-Rank改进算法.该方法首先随机选取任一链出页面,通过主题相关性评价算法获得改进的PageRank值,并重新排序.实验结果显示该算法提高了查询速度、查询准确率,并且算法具有良好的稳定性和可扩展性.  相似文献   

4.
科技文献检索时以专业角度给出合理的相关度排序是一项非常重要工作,传统PageRank算法采用了平均分配相似性权重的方式,但其会产生文献排序结果不合理的问题。为此,提出一种将深度学习方法与PageRank相结合的算法,提高文献相关度排序的可靠性。首先,使用具有注意力池化的孪生BERT(Bidirectional Encoder Representation from Transformers)深度学习网络计算文献与引文的相似度;然后,对文献与其所包含引文间的相似度进行规范化处理;最后,将标准化后的相似度作为分配权重对引文网络计算排序。实验结果表明,相较于传统的PageRank算法,该方法检索结果的相关度提升6%以上,因此更适合应用于科技文献的引文网络分析。  相似文献   

5.
互联网上信息是海量的,并且还在快速的发展.面向主题的Web信息检索已成为当前研究的热点之一.将语义网技术同传统的信息检索技术相结合,给出一个利用本体判断主题相关度的判断算法,通过实验验证了算法的有效性.  相似文献   

6.
针对传统网页排序算法PageRank和HITS中存在的主题漂移、检索效率低等不足,本文提出了一种改进算法PHIA(PageRank and HITS Improved Algorithm)。该算法继承了HITS算法获取根集和基本集的方法,并且使用根集中所有网页的PageRank值作为Hub和Authority初始迭代值,最后根据马尔可夫链求随机矩阵的特征向量的方式来获取网页排名的静态分布。基于随机关键词的检索结果可知,相比于传统的PageRank和HITS算法,改进PHIA算法具有更快的收敛速度,并且在一定程度上提高了网页排序的准确度。  相似文献   

7.
PageRank算法是目前被广泛应用的一种度量网页重要性的方法,它根据网页之间的链接结构来给每个网页打分。从数学的角度来解释,PageRank可以被看作是一个马尔可夫随机游走模型,依据网页下一步的链出信息计算网页的转移概率。受计算机象棋算法设计中一个很成功的策略:“多看几步”的启发,改进和推广了经典PageRank算法,提出了更为一般的N-stepPageRank算法,它在计算网页的转移概率时利用了网页N步的链接信息。经典PageRank算法是N-stepPageRank算法N=1时的特殊情形。TREC标准数据集上的试验表明,N-stepPageRank算法能够有效地提高网页搜索的精确度,MAP指标比经典的PageRank的提高超过15%。  相似文献   

8.
基于链接分析的科学文献个性化排序算法   总被引:2,自引:0,他引:2  
 首先分析CiteSeer引文网络的结构特征,然后深入讨论PageRank算法的本质,并在此基础上给出一种科学文献个性化排序算法;最后将该算法应用于CiteSeer引文网络,并对实验结果进行分析。个性化向量的计算是实现个性化排序的关键,本文给出等概率、伪被引次数和带时间约束的伪被引次数3种计算方法。  相似文献   

9.
PageRank算法是目前一种基于网络链接的比较成功的网页排序算法.首先对PageRank算法做了简单介绍,然后从数学的角度分析,PageRank可以被看作是一个马尔可夫随机游走模型,基于此模型对经典PageRank算法中的转移概率做了改进,根据网页的原PageRank值在链入网页的所有链出网页PageRank值总和所占比例定义转移概率.实验表明,改进后的算法在计算出网页的PageRank值,更具合理性.  相似文献   

10.
针对传统PageRank算法平均分配PageRank值给每个超链接网页这一缺陷,提出了改进的PageRank算法,并证明如果Web网的邻接矩阵P包含至少2个不可约闭子集,则非周期不可约矩阵的次特征值为d且至少2重.为了降低解PageRank近似解的误差和提高幂法的收敛速度,用lingo算得d取0.71,且知若采用改进的...  相似文献   

11.
根据校园网的网络结构和资源分布特点,针对经典PageRank算法采用的平分页面自身PageRank值的策略,提出了基于关键词集的网页关联权重分配PageRank值的改进算法.权值由页面问的关联程度和用户的搜索关键词确定,从而提高了校园网搜索引擎的搜索匹配程度和结果页面的排序质量.  相似文献   

12.
PageRank算法是最为经典的Web结构挖掘算法,但是其存在主题漂移的问题,使得搜索结果中存在大量与查询主题无关的网页。在分析Page Rank算法的基础上,提出利用欧式距离计算主题相似度并融入传统的PageRank算法中,形成一个改进的网页排序算法,并把此算法应用到云计算环境中,研究MapReduce编程模型上的PageRank算法流程。  相似文献   

13.
提出了一种基于改进的PageRank的网页信息可信度评估方法,该方法既考虑了网页间的交互结构,也考虑了网页信息主题间的语义关系.由于网页信息内容具有不同的发布时间,在进行可信度评估过程中,还引人了时间衰减函数,从而反映时间这一要素的影响.实验结果表明,所提出的可信度评估方法是有效的,可以为用户提供可信度较高的网页.  相似文献   

14.
搜索引擎PageRank算法的改进   总被引:2,自引:0,他引:2  
在研究搜索引擎关键技术和的基础上,剖析了PageRank算法,并针对PageRank算法的缺陷提出了改进方案.  相似文献   

15.
微博作为最流行的网络社交媒体之一,其用户之间的相关性分析,是社交网络应用中社区发现、影响传播和行为建模等问题的重要基础.以静电场理论和PageRank算法为基础,利用其简单可靠、基础坚实的良好性质,提出了微博用户重要程度、用户行为距离的概念,并结合微博文本词汇相似度,给出了微博用户相关性的度量方法.实验结果表明,提出的微博用户相关性分析方法具有高效性和准确性.  相似文献   

16.
为了在单一Web服务无法满足问题求解需求时可以自动地组合多个Web服务以解决复杂问题,利用服务本体描述语言OWL-S对常规Web服务进行语义封装,并选用层级任务网络(HTN)规划作为技术手段.在分析了OWL-S与HTN的相似性后,对HTN的操作算子(operator)和方法(method)定义进行改写,并对常规HTN规划算法进行扩展,使之成为具有领域知识的HTN规划,更适用于解决领域相关的服务组合问题.最后提出了一种基于改进HTN规划的服务自动组合规划器框架并搭建了试验系统.案例研究结果表明,这种改进的HTN规划算法在领域本体的配合下可以有效支持Web服务的自动组合.  相似文献   

17.
This paper describes the theory, implementation, and experimental evaluation of an Aggregation Cache Replacement ( ACR ) algorithm. By considering application background, carefully choosing weight values, using a special formula to calculate the similarity, and clustering ontologies by similarity for getting more embedded deep relations, ACR combines the ontology similarity with the value of object and decides which object is to be replaced. We demonstrate the usefulness of ACR through experiments. (a) It is found that the aggregation tree is created wholly differently according to the application cases. Therefore, clustering can direct the content adaptation more accurately according to the user perception and can satisfy the user with different preferences. (b) After comparing this new method with widely-used algorithm Last-Recently-Used (LRU) and First-in-First-out (FIFO) method, it is found that ACR outperforms the later two in accuracy and usability. (c) It has a better semantic explanation and makes adaptation more personalized and more precise.  相似文献   

18.
对网页PageRank算法的改进   总被引:19,自引:0,他引:19  
分析了著名搜索引擎Google采用的PageRank算法,指出其偏重旧网页,忽视专业站点以及对网页中的超链接评估不恰当等不足之处。改进算法考察了网页日期这一重要因素,并重新计算网页中超链接对网页的影响。网页结构中蕴涵着丰富的信息,在href,title等标记中文字对网页主题有重要作用,利用结构标记可以辅助判断网页的主题内容。试验结果表明,采用改进的算法可以提高判断网页重要性的准确度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号