首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
刘红梅 《科技信息》2013,(24):252-253
主题爬虫是垂直搜索引擎的关键构建,其搜索算法的优劣直接影响到搜索引擎的查全率和查准率。本文简要介绍了垂直搜索引擎中主题爬虫的工作原理;归纳了常见的几种搜索策略算法;分析了主题爬虫的搜索策略的特点,并比较了几种搜索策略的优缺点;总结了提高主题爬虫搜索效率的关键因素及发展趋势;为后期的学习和研究打下基础。  相似文献   

2.
研究了普通搜索引擎技术特点和实现过程,系统地分析比较研究基于主题改进爬虫程序算法,设计实现一个能更好地满足用户不同搜索需求的主题搜索引擎,该搜索引擎具有科学性、高效性、实用性、易操作性等优点.使用本搜索引擎,对多个大型网站进行查询搜索,通过实验数据对比,结果表明,该引擎的数据查全率和查准率都高于普通搜索引擎,具有较高的...  相似文献   

3.
基于语义的旅游信息搜索引擎   总被引:1,自引:1,他引:1  
在分析传统检索技术存在的问题基础上,采用Ontology技术结合传统搜索技术构建了一个基于语义的旅游信息搜索引擎,提出新的本体构建方法,给出了构建旅游信息领域本体的过程.根据用户的搜索需求定制规则,使用Jena的推理机制,通过规则对旅游信息本体进行语义访问与逻辑推理,提供更为灵活、有效的检索方案,向用户提供智能化、知识化服务,提高了搜索引擎的查准率和查全率.  相似文献   

4.
在校园网已经成为Internet一部分的今天,构建和谐校园网,不仅需要对校园网内部进行有效的管理,同时还需要动态掌握Internet上的信息,避免不良信息入侵校园为校园管理带来安全隐患.研究了如何通过主题网络爬虫技术实现高校网络信息动态搜索和监控,方便网络管理者及时、有针对性地获取互联网上的相关信息.  相似文献   

5.
主题爬虫搜索策略的研究   总被引:1,自引:0,他引:1  
由于信息多元化的发展,通用的搜索引擎无法满足专业化用户的需求,分类细致、精确、更新及时的面向特定主题的垂直搜索引擎便应运而生了。主题网络爬虫是垂直搜索引擎获取数据的自动化程序。以何种策略有效地访问网络资源是主题爬虫研究的主要问题。本文重点对主题爬虫的搜索策略进行研究,并对各种搜索策略进行了比较。  相似文献   

6.
金鹏 《科技信息》2010,(20):222-223
由于民用搜索引擎无法在军队中使用,随着部队人员对提供的各项信息服务的要求越来越高、越来越细,基于整个Web的信息采集越来越力不从心.同时它也无法迅速地搜集到足够的最新的网络信息,也不能满足人们日益增长的个性化需求.本文希望通过开发一个军事教育类主题方面的爬虫以满足用户专门检索军事教育类信息的要求.  相似文献   

7.
主题爬虫是垂直搜索引擎的核心组成部分,它为面向主题的用户查询准备数据资源;提出了一种基于HMM的主题爬虫方法,方法不仅分析网页内容,而且还考虑网页的上下文链接结构,首先将当前网页的聚类结果作为观察状态、将当前网页到目标网页的链接距离作为隐含状态,然后通过HMM模型学习用户的主题浏览模式并利用它采集更多的主题网页;实验结果表明:方法能采集大量与指定主题相关的高质量网页,主题爬行效率优于Best-First主题爬虫。  相似文献   

8.
基于概念分析的主题爬虫设计   总被引:1,自引:0,他引:1  
研究改进主题爬虫设计的方法,用高效的主题爬虫取代传统搜索引擎中的普通爬虫,以更高的精度完成定向信息采集.在成功实现基于关键词的主题爬虫的基础上,提出了基于概念的主题相关度分析算法,给出了基于概念分析的主题爬虫的实现方案.比较两种主题爬虫工作的实验结果,显示爬虫的性能得到了提高,论证了该设计的可行性与可操作性,为实现准确的定向信息采集奠定了良好的基础.  相似文献   

9.
分析了最好优先搜索策略中遇到的隧道问题,设计并实现了一种基于本体的主题爬虫系统。  相似文献   

10.
李豫山 《科技信息》2014,(12):10-11
如何从存有海量数据的万维网上以最快的速度找到所需要的信息,成为我们所要研究的问题。对于这种主题信息获取的需求,传统的通用搜索引擎显然达不到这样的要求,为了克服通用搜索引擎这种缺陷,提出了主题搜素引擎的概念,也就是聚焦搜索引擎。而对于网站站长,如何让用户更快找到自己的网站信息,如何提高搜索引擎优化策略,也是他们所要解决的问题。本文基于这两个问题,阐述了聚焦爬虫原理,结合聚焦搜索引擎的工作原理提出了提高搜索引擎优化策略。  相似文献   

11.
阐述了生活搜索引擎的发展现状,对生活搜索引擎及其功能做了一个基本的调查和研究,运用实例详细介绍了生活搜索引擎的检索过程以及存在的问题,对搜索引擎的发展进行了展望。  相似文献   

12.
传统专业搜索引擎采用贪婪的链接选择策略,导致整体回报率较低.本文提出了一种非贪婪的链接选择策略,进而提出了一种基于非贪婪策略的启发式搜索算法.针对国外四所著名大学计算机系网站中论文资源的搜索实验表明,新的算法可以有效提高搜索效率.  相似文献   

13.
根据搜索引擎中的快速搜索方法,设计逻辑符号检索词组或短语的内容检索等7大类搜索方法,并用Java语言实现了其中的部分功能。  相似文献   

14.
网格中有许多可利用的资源,网格系统的可用性依赖于搜索引擎的搜索能力。首先介绍了网格资源管理和传统的搜索引擎技术,然后在P2P搜索引擎技术的基础上,提出了一种更加有效的网格搜索引擎技术——网格对等搜索。  相似文献   

15.
搜索引擎的类型及应用   总被引:1,自引:0,他引:1  
对网络搜索引擎的类型进行了分析,并就网络用户在搜索信息时使用搜索引擎应注意的问题进行了说明。  相似文献   

16.
针对手机等移动设备具有小屏幕、操作不方便和具有惟一标识的特点,提出了适用于移动环境下搜索引擎的个性化搜索的新方法.首先用户的查询历史可以通过惟一的手机号自动记录下来;其次利用用户的查询历史,建立用户描述文件以及基于关键词空间的用户兴趣模型;最后根据用户兴趣模型,采用关键词扩充算法优化用户查询.此方法能够较好地实现移动环境下的个性化搜索,提高检索效率.  相似文献   

17.
随着互联网竞争日趋激烈,垂直搜索引擎技术日渐发展。本文从军事工程兵的角度出发,对垂直搜索引擎进行系统研究,研究表明垂直搜索引擎具有很强针对性、智能性和实时性,其应用价值更为突出。  相似文献   

18.
随着Internet上的信息量爆炸式地增长,当前的搜索引擎面临着许多巨大的挑战,该文针对现有搜索引擎中存在的问题提出了带参数的搜索引擎,并给出了参数策略和基于扩展的向量空间模型的识别器的设计。  相似文献   

19.
主要分布式搜索引擎技术的研究   总被引:2,自引:0,他引:2  
讨论了当前搜索引擎的主要技术以及这些技术的原理。介绍了基于P2P的搜索技术,以及JAXT搜索框架的基本原理,重点给出了基于Map/Reduce技术分布式搜索引擎的实现。对今后搜索引擎的发展也作出了相应的探讨。  相似文献   

20.
搜索引擎已经形成了一个链型产业。介绍了搜索引擎技术,论述了有效使用搜索引擎的意义,指出了搜索引擎产业链中的营销和推广。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号