首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 921 毫秒
1.
徐斌 《科技成果纵横》2009,(3):74-74,78
搜索引擎分成综合搜索引擎(如百度、谷歌)和垂直搜索引擎.垂直搜索引擎技术,也被称为专业或专用搜索引擎,就是专为查询某一个学科或主题的信息而产生的查询工具,专门收录某一方面、某一行业或某一主题的信息,在解决某些实际查询问题时比综合搜索引擎较有效.  相似文献   

2.
基于时效性信息的特征,构建了一个用来提高专业搜索的"查全、准、新率"的垂直搜索引擎. 以航空机票价格为例,分析了时效性信息的获取和过滤技术,并给出了基于时效性垂直搜索引擎的关键程序.  相似文献   

3.
由于通用搜索引擎具有搜索信息量大、查询不准确、深度不够等缺点,本文在通用搜索引擎技术的基础上,依据专业领域搜索策略,设计并实现了一个面向教育主题的垂直搜索引擎系统,着重研究了专业网络蜘蛛定制、基于VSM的主题相关度算法和倒排索引建立等关键技术及其实现细节.实验结果表明,该系统能够快速地响应用户的查询请求,并且返回结果具有较高的准确性.实现了教育资源的共享,具有较高的应用价值.  相似文献   

4.
如何有效地构建面向领域的垂直搜索引擎,是信息检索领域众多研究者关注的问题.本文提出了一种通用的基于专业词汇表构建垂直搜索引擎的方法,通过分析网页特征,提出了基于链接结构和文本内容的启发式网页爬取策略.该策略结合网页的结构信息特征,在网页和主题相关度计算中考虑了特征词汇在网页中的权重,有效地提高了专业搜索引擎的查询效率.通过具体实现一个面向医疗领域的垂直搜索引擎,验证了本文所提出的方法的有效性.  相似文献   

5.
从图书搜索引擎概况、常用的图书搜索引擎资源、图书搜索引擎的检索途径和图书资源的利用方式4方面,对图书搜索引擎资源及其利用进行了探析。  相似文献   

6.
面向垂直搜索引擎的一种动态网页的抓取方法   总被引:2,自引:0,他引:2  
在垂直搜索引擎中,怎样抓取动态生成的主题网页一直是面向垂直搜索引擎网页抓取器的一个难题.本文提出了一种基于IE内核和DOM的面向垂直搜索引擎的动态网页抓取方法.实验表明,该方法对动态网页和主题网页抓取的准确率平均在95%以上,召回率平均在97%以上.  相似文献   

7.
随着互联网竞争日趋激烈,垂直搜索引擎技术日渐发展。本文从军事工程兵的角度出发,对垂直搜索引擎进行系统研究,研究表明垂直搜索引擎具有很强针对性、智能性和实时性,其应用价值更为突出。  相似文献   

8.
从图书搜索引擎概况、图书资源概况和图书资源的检索途径3方面,对Internet网络上“独秀”图书搜索引擎的图书资源及其检索途径进行了探讨。  相似文献   

9.
由于通用搜索引擎具有搜索信息量大、查询不准确、深度不够等缺点,本文在通用搜索引擎技术的基础上,依据专业领域搜索策略,设计并实现了一个面向教育主题的垂直搜索引擎系统,着重研究了专业网络蜘蛛定制、基于VSM的主题相关度算法和倒排索引建立等关键技术及其实现细节。实验结果表明,该系统能够快速地响应用户的查询请求,并且返回结果具有较高的准确性。实现了教育资源的共享,具有较高的应用价值。  相似文献   

10.
在介绍中文搜索引擎现状的基础上,阐述了搜索引擎的工作原理及搜索引擎分类,探讨了垂直搜索在文献检索中的应用.  相似文献   

11.
高校图书馆重点学科垂直搜索引擎初探   总被引:1,自引:0,他引:1  
简要介绍了垂直搜索引擎与普通搜索引擎相比所具有的特点,阐述了高校重点学科建设的迫切性,探讨了垂直搜索引擎在图书馆重点学科建设中的应用,提出了基于垂直搜索技术的重点学科主题搜索引擎方案。  相似文献   

12.
垂直搜索在个性化Web搜索中的应用   总被引:1,自引:0,他引:1  
潘望  朱宏明 《科技信息》2008,(36):89-90
本文先介绍了个性化Web搜索,然后根据个性化Web搜索提出的要求引出了垂直搜索技术,并探讨了与通用搜索引擎相比较而言.将垂直搜索应用于个性化Web搜索的优越性。最后介绍了垂直搜索中的关键性技术,即信息提取技术,并着重给出了基于网页布局和关键字段的信息提取技术。  相似文献   

13.
为了弥补互联网信息爆炸带来的搜索引擎用户满意度低的问题,提出了一种基于本体的垂直搜索引擎模型。该模型构建一个本体知识树,利用增加了属性提取和相似度算法的NWeb-Crawler对网页进行抓取,并将非相关信息进行隔离;然后,进行网页源代码格式信息和语义信息两方面的抽取;抽取的数据信息通过分词后建立二维索引表,用户的请求通过本体知识树扩展概念集和二维索引表进行检索。该系统模型从入口网页到出口数据逐步贴近检索需求,具有良好的扩展性,对垂直搜索引擎的研究有一定的参考借鉴作用。  相似文献   

14.
基于XML的藏文图书检索系统的设计与研究   总被引:1,自引:0,他引:1  
通过设计一个藏文图书查询系统,并给出该系统的总体结构图,对基于XML的搜索引擎中涉及的关键技术进行了研究,提出对XML这种半结构化文档建立索引和查询时采用的数据结构和算法.它在不丢失文档中结构信息的情况下,能充分利用XML的标签所带来的上下文信息,能够大幅度提高查询的准确率.  相似文献   

15.
面向行业主题的搜索在特定主题信息覆盖方面与通用搜索引擎有着截然不同的要求,为解决行业信息搜索的问题对基于向量空间算法的化工相关度计算以及对经典的Page-Rank页面排序算法做了研究与改进并且在Nutch搜索引擎架构基础上,搭建了一个面向化工行业信息资源的垂直搜索引擎。相对于通用搜索引擎来说剔除掉了不必要的搜索结果信息量,提升了系统速度,提高了行业信息搜索的准确度。  相似文献   

16.
网络上的机电技术信息资源分布丰富。介绍了机电工程技术信息检索途径(包括期刊、图书、专利信息、标准信息及其他书目信息),同时介绍了网上获取机电技术类信息的检索工具(搜索引擎、网上资源目录、网络资源导航或主题指南、用户组、已知站点的超文本链接等)。  相似文献   

17.
介绍了垂直搜索引擎和网络爬虫的基本概念,以及Heritrix系统的体系结构,分析了Heritrix工作流程,针对Hefifirx中存在的一些不完善的地方,引入了ELFHash算法并通过扩展Heritrix实现了电信信息搜索平台信息的定向与多线程抓取,为建立面向电子信息的垂直搜索引擎提供了信息源.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号