首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 250 毫秒
1.
一种元搜索引擎的查询结果处理模型   总被引:5,自引:0,他引:5  
为克服元搜索引擎查询速度慢、独立性差的缺点,设计了一个元搜索引擎的结果处理模型.在该模型中引入了一种4级结果集的结构,从而提高了元搜索引擎结果处理的效率.在结果提取部分提出了根据反馈信息自动调整权重的算法(FBWM),从而能够在没有人工干预的情况下自动监视各独立搜索引擎的性能变化,并随之动态调整其权重.在结果排序部分提出了改进的位置/全文排序法(IPFTS),在算法中引入了词条匹配等级的概念,提高了搜索结果和查询串的相关度的精度,保证了排名在前的搜索结果中链接地址的有效性.  相似文献   

2.
设计了一种基于元搜索的事件发现与关联算法.首先利用元搜索引擎获取事件数据的外围信息,通过事件发现算法,实现事件的重排序,再以重排序结果为基础,识别其中出现的事件元素,进而实现事件在多维元素上的关联.实验证明该算法能够取得较好的效果.  相似文献   

3.
搜索引擎查询的结果按照一定的规则排序供用户查看,这种规则就是搜索引擎排序算法。目前大多数搜索引擎仍然是通过对搜索引擎的链接关系进行分析,找到相对比较重要的网页。这些算法大多是以PageRanks等经典算法为基础,进行改良,加入各自偏重的参数形成综合的排序模型。  相似文献   

4.
林强 《咸宁学院学报》2012,32(2):154-156
介绍了笔者所设计的一个校园网搜索引擎(SzCompass)中的网页排序算法。首先详细分析了通用搜索引擎常用的PageRank和HITS网页排序算法;通过比较在校园网和Internet上搜索的主要区别,设计了一种适合校园网的多参数加权的网页排序算法,并对利用该算法实现的搜索引擎的检索效率进行了实验分析。  相似文献   

5.
元搜索引擎的个性化   总被引:1,自引:0,他引:1  
提出一种通过产生用户动态偏好来达到个性化搜索的方法.利用RDF的语义表达能力存储和优化基于访问记录的用户偏好,并采用聚类方法划分用户群,实现对用户偏好的有效管理。给出了元搜索引擎选择算法和搜索结果排序算法,实现了一个个性化的元搜索引擎,实验表明,该搜索引擎提高了查询准确率和使用效率,并能够根据用户及其所在群的历史偏好信息重新组织搜索结果.  相似文献   

6.
搜索结果的合成是元搜索引擎系统中一个重要的技术问题。为了提高元搜索引擎的查询精度,提出了一种改进的元搜索结果合成算法。通过分析搜索结果列表中包含的文本信息,综合考虑搜索结果与查询的匹配完全程度和相关程度给出了文本分析的规范化方法,并结合搜索结果的排序信息计算文档的相关分值,据此实现对局部相似度的调整。利用成员搜索引擎的性能评价,提出了改进的影子文档方法估算非相关文档的相关分值。然后,采用基于群决策的合成方法对搜索结果进行一致性排序。在实际Web环境中进行了测试,实验结果表明采用本算法,搜索结果的相关性比Round-robin、CombSum和CombMNZ三种合成算法有较大提高。  相似文献   

7.
个性化搜索引擎研究的目的是使搜索结果尽可能满足不同用户的信息需求,而排序算法在搜索引擎技术中占有着核心的地位.提出了一种基于改进的DBSCAN聚类的个性化排序算法,在全文搜索包Lucene与开源搜索引擎Nutch的基础上,实验证明该方法提高了用户搜索的准确率和召回率.  相似文献   

8.
信息检索中基于链接的网页排序算法   总被引:5,自引:0,他引:5  
介绍超链接环境下基于链接的网页排序算法,比较和分析了PageRank算法和HITS算法,指出了PageRank算法更适合于搜索引擎的服务器端,而HITS算法更适合于搜索引擎的客户端,还构造并初步实现了在信息检索中,应用超链接环境下网页排序算法的综合模型。  相似文献   

9.
为有效解决元搜索引擎结果排序的问题,提出了一种基于样本加权的位置文本排序算法。分析了现有基础算法,并在充分考虑结构信息的基础上将记录的PageRank值转化为权值。结合文本信息及其在结果列表中的位置信息实现局部相似度的调整,对排序位置的相关分值进行了规范化处理。对摘要排序算法进行了改进,提出了查询词条匹配度和词条间关联度的概念。最后将各相关分值进行合并得到搜索结果的最终相关度。实验结果表明该方法的可行性和有效性。  相似文献   

10.
分析了元搜索引擎的发展状况,通过对国内外元搜索引擎性能的比较,指出了中文元搜索引擎的查询请求提交机制、检索结果显示机制以及检索结果排序方式等方面的不足,分析了目前中文元搜索引擎发展的局限性,对未来的研究方向进行了展望,认为未来的中文元搜索引擎应朝着个性化、专业化、智能化方向发展。  相似文献   

11.
基于超链接分析搜索引擎页面排序算法的剖析   总被引:1,自引:0,他引:1  
对搜索结果的排序是搜索引擎中至关重要的一项技术,算法的好坏直接关系到用户输的搜索引擎页面排序算法。对两种最基本的页面排序算法PageR ank和H ITS的算法思想和实现原理进行详细阐述。通过分析对比,总结出它们各自存在的优点和不足进而指出适合其应用的条件领域。最后指出搜素引擎应用超链接分析时应注意的一些影响因素。  相似文献   

12.
相关排序技术是搜索引擎结果处理的一个核心技术,其排序算法的优劣直接影响查准率.笔者阐述了现有排序算法的优缺点,分析了不同排序算法对查准率的影响,从根集的质量、噪音链接、查询分类几方面进行了优化并考虑了综合因素,提出了一种切实可行的相关排序实现方案.  相似文献   

13.
大数据时代,从海量的数据中发现对用户有用的知识成为研究领域重要的问题.通过集成多个搜索引擎的查询结果,实现食品安全领域中搜索信息的集成和个性化自适应排序.本文设计基于元搜索技术、知识本体和自适应的排序学习技术,实现多个搜索引擎相关查询结果集成,在对用户点击的标注和知识本体的基础上,利用基于监督学习的排序技术,实现对食品安全领域信息的个性化自适应排序.系统实现了集成多个搜索引擎的食品安全相关知识的提取和相关结果的重新排序.本研究不仅实现了多个搜索引擎食品安全信息查询相关的结果集成,而且能够根据用户的偏好实现结果的自适应排序.  相似文献   

14.
顾珺 《科技资讯》2009,(15):20-20,22
Nutch是一个开放源代码的Web搜索引擎,由于不夫杂商业利益,它对搜索结果的排序算法较为透明公平。未来的搜索引擎的发展趋势之一是个性化和智能化,本文在研究开泺Nutch的基础上设计实现了一个具有关联用户搜索行为的搜索引擎。  相似文献   

15.
面向行业主题的搜索在特定主题信息覆盖方面与通用搜索引擎有着截然不同的要求,为解决行业信息搜索的问题对基于向量空间算法的化工相关度计算以及对经典的Page-Rank页面排序算法做了研究与改进并且在Nutch搜索引擎架构基础上,搭建了一个面向化工行业信息资源的垂直搜索引擎。相对于通用搜索引擎来说剔除掉了不必要的搜索结果信息量,提升了系统速度,提高了行业信息搜索的准确度。  相似文献   

16.
对传统搜索引擎使用的排序算法进行分析,将概率意义引入对象级搜索,提出一种在对象级搜索中合并多个查询结果的算法.通过归一化以及考虑概率意义与查询规模间的关系,该算法独立于生成结果列表使用的排序算法.实验结果证明该算法提高了查询结果的质量.  相似文献   

17.
分析了现有元搜索引擎的功能,指出其不足并提出一种智能型的元搜索引擎模型.通过建立本地数据库,自动提供用户需求的扩展、分发和对搜索结果的过滤、排序,提高网络信息搜索的查全率和查准率.  相似文献   

18.
Web页面相关度算法   总被引:1,自引:0,他引:1  
元搜索引擎是建立在独立搜索引擎之上的搜索技术,而Web页面相关度算法是元搜索引擎的核心技术之一.文中在文档价值预测模型(DVPM)的基础上,将Web页面分解为不同的属性,通过属性值的计算来预测Web页面的相关度,给出了相关度的计算公式与评价,进行了相关度算法的实验研究.结果表明,该算法提高了Web页面的准确度.  相似文献   

19.
对链接算法在搜索引擎检索结果排序中的应用进行研究,提出基于Page Rank和锚文本对检索结果进行二次排序,合理评价网页重要程度.实验结果表明,该方法在一定程度上能提高检索效果.  相似文献   

20.
网页排序技术是搜索引擎的核心技术之一. 校园网搜索引擎是指以一个校园网内的Web网页为搜索内容的搜索引擎. 由于校园网相对于互联网和内联网的特殊性,各种启发式条件对校园网网页排序优化的影响及排序融合技术在校园网搜索引擎的作用是研究的重点. 实验结果表明各个启发式条件的影响和实验数据集有关,而不同启发式条件组合经过排序融合后所获得的查全率差别很大(2%~48%). 查全率大于35%的启发式条件组合至少包含4个启发式条件,即校园网搜索引擎的排序需要依据数据集综合考虑多个启发式条件的排序结果. 排序融合技术是校园网搜索引擎具有良好的查全率的必要技术之一. 基于排序融合技术的网页排序模块已经应用于清华大学校园网搜索引擎中.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号