首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
在校园网已经成为Internet一部分的今天,构建和谐校园网,不仅需要对校园网内部进行有效的管理,同时还需要动态掌握Internet上的信息,避免不良信息入侵校园为校园管理带来安全隐患.研究了如何通过主题网络爬虫技术实现高校网络信息动态搜索和监控,方便网络管理者及时、有针对性地获取互联网上的相关信息.  相似文献   

2.
主题爬虫搜索策略的研究   总被引:1,自引:0,他引:1  
由于信息多元化的发展,通用的搜索引擎无法满足专业化用户的需求,分类细致、精确、更新及时的面向特定主题的垂直搜索引擎便应运而生了。主题网络爬虫是垂直搜索引擎获取数据的自动化程序。以何种策略有效地访问网络资源是主题爬虫研究的主要问题。本文重点对主题爬虫的搜索策略进行研究,并对各种搜索策略进行了比较。  相似文献   

3.
刘红梅 《科技信息》2013,(24):252-253
主题爬虫是垂直搜索引擎的关键构建,其搜索算法的优劣直接影响到搜索引擎的查全率和查准率。本文简要介绍了垂直搜索引擎中主题爬虫的工作原理;归纳了常见的几种搜索策略算法;分析了主题爬虫的搜索策略的特点,并比较了几种搜索策略的优缺点;总结了提高主题爬虫搜索效率的关键因素及发展趋势;为后期的学习和研究打下基础。  相似文献   

4.
在互联网高速发展的今天,搜索引擎逐渐成为用户在Web上获取信息的主要工具。传统的通用搜索引擎利用一个Crawler程序面向整个Web进行信息采集,它的缺点是采集无针对性、页面失效率高、不能满足特定专业人群的需要。针对这种情况,需要一个分类细致精确、数据全面深入、更新及时的面向主题的搜索引擎。  相似文献   

5.
本文阐述了搜索引擎和主题网着的工作原理,并对这两种搜索方式进行了比较分析。  相似文献   

6.
由于通用搜索引擎具有搜索信息量大、查询不准确、深度不够等缺点,本文在通用搜索引擎技术的基础上,依据专业领域搜索策略,设计并实现了一个面向教育主题的垂直搜索引擎系统,着重研究了专业网络蜘蛛定制、基于VSM的主题相关度算法和倒排索引建立等关键技术及其实现细节。实验结果表明,该系统能够快速地响应用户的查询请求,并且返回结果具有较高的准确性。实现了教育资源的共享,具有较高的应用价值。  相似文献   

7.
由于通用搜索引擎具有搜索信息量大、查询不准确、深度不够等缺点,本文在通用搜索引擎技术的基础上,依据专业领域搜索策略,设计并实现了一个面向教育主题的垂直搜索引擎系统,着重研究了专业网络蜘蛛定制、基于VSM的主题相关度算法和倒排索引建立等关键技术及其实现细节.实验结果表明,该系统能够快速地响应用户的查询请求,并且返回结果具有较高的准确性.实现了教育资源的共享,具有较高的应用价值.  相似文献   

8.
金鹏 《科技信息》2010,(20):222-223
由于民用搜索引擎无法在军队中使用,随着部队人员对提供的各项信息服务的要求越来越高、越来越细,基于整个Web的信息采集越来越力不从心.同时它也无法迅速地搜集到足够的最新的网络信息,也不能满足人们日益增长的个性化需求.本文希望通过开发一个军事教育类主题方面的爬虫以满足用户专门检索军事教育类信息的要求.  相似文献   

9.
面向主题的网页搜索系统   总被引:13,自引:0,他引:13  
论述了一个面向主题的网页搜索系统(SATWP),该系统与智能代理的辅助下具有搜索,导航,以及信息反馈等功能。在判断网页与查询主题的相关度时改变了单纯的从网页内容上考虑的方法,即从网页自身的URL,网页间的关系以及网页的内容来判断。SATWP采用在客户端的智能代理记录用户的浏览行为,并把有关信息反馈给服务器,服务器根据这些信息随时调整数据库中相关网页的重要性顺序,增加了自身的学习功能,试验结果表明,该系统具有较高的准确度。  相似文献   

10.
智能主题搜索算法研究   总被引:1,自引:0,他引:1  
分析了4种智能主题搜索算法,对基本遗传算法进行了改进,并将改进的遗传算法应用到主题搜索中,通过改进遗传算子来提高搜索的主题相关度和爬行的准确率.  相似文献   

11.
李海 《信息化建设》2011,(11):44-46
近年来,党中央制定了"千人计划",大力引进海外高层次人才。但由于渠道单一,专业性强,收集海外高层次人才时信息量较小,无法满足国内用人单位对紧缺型人才的渴求。借助互联网搜索引擎的查询手段,则由于用人单位需要全方面了解被查询人的信息  相似文献   

12.
查找和利用网络资源在实施素质教育中起着越来越重要的作用。搜索引擎是目前最常用的网络信息检索工具,我根据检索体会对一些常用的检索策略和搜索技巧进行了总结,希望能为广大中学师生的利用提供一条捷径。  相似文献   

13.
王福海 《科技信息》2011,(15):J0077-J0077,J0227
对通用搜索引擎中的PageRank排序算法进行分析,针对原PageRank算法中主题漂移问题,提出一种与主题相关的改进算法,改进的PageRank值由链接重要性和内容重要性共同确定。  相似文献   

14.
互联网是知识和信息的海洋,但许多朋友甚至许多经常使用网络的朋友,都不知该如何快速而准确地利用搜索引擎来获取网络上的信息。本文试从搜索引擎的基础知识,使用方法,高效使用及特殊使用方法等几方面,对如何利用搜索引擎获取网络信息做了阐述。  相似文献   

15.
随着互联网的信息以指数级增长,用户希望搜索引擎能够提供面向专业的更准确智能搜索服务,主题搜索引擎的研究显得越来越有意义。本文对基于本体语义主题搜索引擎系统的关键技术进行研究。首先建立主题搜索引擎系统流程,对主题网络爬虫,网页主题相关度、网页主题分类进行了算法研究。最后以服装纺织领域的主题搜索实现为例,说明主题搜索引擎系统能更准确快速实现专业搜索服务。  相似文献   

16.
为提高大数据环境下主题信息搜索的准确率和查全率,提出了将贝叶斯推理与遗传算法相结合的搜索策略.利用贝叶斯推理对文档的主题相关度进行了计算,并结合遗传算法对搜索过程进行启发式引导,同时引入差异度参数,在Heritrix框架基础上,利用集成开发环境Eclipse 3.3实现了相应功能.实验结果表明:搜索策略改进后的系统抓取主题页面所占比例与原系统相比有较大提高.  相似文献   

17.
为了使信息技术得到很好的开发和利用,更好的解决实际应用中的问题,本文基于粗糙集理论智能数据分析方法的实例,通过对目标数据集中数据性质一系列的分析,结合试验的测试结果,可以发现该数据集中潜在的数据模式和内在联系,概括了数学在智能数据分析中应用的模型,促进了数学在信息技术中的应用探索.  相似文献   

18.
人类发明计算机以来就一直利用它进行数据相关性分析,从这个意义上来说现在的所谓“大数据分析”和之前的数据分析是一样的,只是原来的算法对处理上千个维度这样复杂数据模型时显得力不从心。从2006年以来,随着算法上的一系列突破再加上廉价计算能力的普及,人们终于有能力分析这些复杂的数据模型,于是大数据这个概念就诞生了。该文主要对通过对数据分析和大数据进行论述,探究大数据下的智能数据分析技术。  相似文献   

19.
兰蔚巍  李海生 《科技信息》2010,(28):256-256
本文介绍了搜索引擎的类型、现状及存在问题,探讨了新一代搜索引擎——智能搜索引擎的关键技术、实现方法和发展趋势。  相似文献   

20.
中文农业主题搜索引擎的设计与实现   总被引:2,自引:1,他引:1  
用户对农业信息的需求越来越多,农业搜索引擎的开发变得十分必要.从农业搜索引擎发展状况出发,在分析研究通用搜索引擎工作原理、系统架构的基础上,设计并实现了中文农业主题搜索引擎,给出了开发过程中采用的关键技术.结果表明,能满足用户实际需求.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号