首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
网络搜索引擎的工作原理是利用蜘蛛程序发现和搜集网页信息,建立索引库,再在索引库中快速检出文档。本文分析了搜索引擎的工作原理,研究了常用搜索引擎的类型与基本技术指标。探讨了搜索引擎的应用方法和技巧。  相似文献   

2.
针对各行各业出现的大量的各种电子格式的文件,本文介绍了一个能有效地存储和管理海量非结构化数据的全文检索系统平台TRIP,对TRIP的存储结构和索引体系进行了详细地阐述,比较了和同类产品的区别,给出了TRIP的应用范围。  相似文献   

3.
超文本全文检索技术的研究与实现   总被引:7,自引:0,他引:7  
在分析超文本全文检索功能需求的基础上,提出了一种将非结构的超文本转换成为结构化数据库,以支持全文检索的实现思想和模型,形式化地描述了超文本检索引擎的原理,并分析了模型设计与实现的关键技术问题,如超文本关键词提取、查询条件构造、全文检索算法及查询结果处理等。该模型具有实现简单、通用性强、支持大容量超文本信息检索等特点,并已在鲁讯图书馆数字化网络化信息系统和钱学森特色数据库系统中得到了验证和应用。  相似文献   

4.
全文检索是现代信息检索技术的一个非常重要的分支,它是处理非结构化数据的强大工具,也是搜索引擎的核心技术之一。本文首先介绍了全文检索技术,其次概括了全文检索技术的发展现状,明确了全文检索开发的意义和内容,分析了搜索引擎全文检索机制,最后对开源全文检索引擎的优势进行了概括。  相似文献   

5.
Lucene全文检索技术是信息检索领域广泛使用的基本技术。它是一个优秀的开源全文本搜索技术框架。按照Lucene的框架规范,扩展Lucene的功能,可以将Lucene很好地嵌入到自己的搜索引擎中。首先介绍了一个高性能的全文检索引擎--Lucene开源系统,详细分析了Lucene的系统结构,程序运行逻辑,以及在Lucene上的扩展,即中文分词器的设计;然后将其引入具体应用,给出了一个基于Lucene全文检索技术的名著——《红楼梦》搜索引擎的设计与实现。  相似文献   

6.
张锐 《科技信息》2011,(24):I0234-I0235,I0237
本文主要介绍图书馆网站实现全文检索的几种方法以及各自的优缺点,以便图书馆网站根据实际需求及自身情况进行选择,使全文检索技术能广泛应用于各类型图书馆网站。  相似文献   

7.
常征 《科技信息》2007,(16):89-90
本文介绍了全文检索及其发展状况,以及采用全文检索的必要性。详细论述了在SQL2000中实现全文检索的配置方法,步骤清晰,操作性强,引导读者正确配置和实现全文检索功能。并且介绍了全文检索中的“噪音词”过滤的机制。  相似文献   

8.
黎敏 《科技信息》2009,(25):I0011-I0012
主要介绍了Oracle Text的体系结构和实现基于Oracle Text全文检索应用的步骤。把Oracle全文检索技术应用到了电子校务的全文检索当中。  相似文献   

9.
中文Web文档全文检索系统的设计及实现   总被引:10,自引:0,他引:10  
为解决在检索某些词时发生漏检或错检,以及查全率和查准率不高的问题,研究字索引技术在中文Web文档检索中的应用.着重讨论字索引组织结构和检索方法,并引入了字节对齐的索引压缩方法,最后描述了一个中文Web文档全文检索系统的结构和实现.测试表明,该系统在响应时间和查准率方面性能均比较好,具有一定的实用性.  相似文献   

10.
倒排索引压缩及在RDBMS全文检索中的实现   总被引:2,自引:0,他引:2  
提出了一种对倒排索引进行压缩的方法,在保证较高压缩率的前提下,对压缩后的数据提供了随机访问的能力.这种方法将压缩后的数据分为两部分,第一部分用来表示单词在子区间的出现次数,第二部分用来表示单词在子区间的具体出现位置,详细描述了检索过程,通过第一部分的信息可以直接对第二部分的任意位置进行解压缩,体现了其随机访问能力,并分析了压缩比和检索效率,讨论了该压缩方法在RDBMS全文检索中的实现,以及如何用表格形式对其进行存储,针对多关键字的检索对算法进行了优化.该实现方法一方面充分利用了数据系统的优点,获得了良好的动态性能,另一方面节省了倒排索引对空间的需求,并提高了检索效率.  相似文献   

11.
本文主要分析了中文全文检索技术中有关内容,并根据此内容设计实现了一个中文全文检索系统.针对汉语词法的特殊性,在基于词表的全文索引方面,本文应用了一种改进的倒排索引结构,同传统索引结构相比,更便于索引的构建、维护、更新.并根据其特征,设计了优化的查询策略.  相似文献   

12.
全文检索中的文本学习技术研究   总被引:1,自引:0,他引:1  
分析了本学习技术在全检索系统中的作用,指出本学习机制的优劣从基础上决定了全检索系统的性能;从训练本集的标准化表示、特征子集的抽取、学习算法分析三个方面讨论了本学习技术的内部机制,介绍了TFIDEF、Bayes、k-Nearest Neighbor和Decision tree等主要学习算法,还列出了一些较有影响的其它算法,并对这些算法进行了经验性比较;介绍了有关实际系统对学习技术的应用情况。  相似文献   

13.
胡嘉海 《安徽科技》2012,(12):46-47
一、引言搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。搜索引擎可分为全文索引、目录索引、元搜索引擎、垂直搜索引擎等。全文搜索引擎是目前广泛应用的主流搜索引擎,国外代表有Google,国内则有百度。  相似文献   

14.
流行的数据库管理系统通常实现了全文检索子系统,从而方便对数据库表中的文本数据建立全文索引,进而借助于这个索引来检索文本数据.达梦数据库管理系统提供多文本数据检索服务.包括全文索引和全文检索.达梦数据库实现了全文检索系统.但是此系统存在着索引膨胀率过高,索引填充时间较长的问题.全文检索,是一门综合性很强的技术.它牵扯到了很多的技术点,主要有分词技术,数据源提取和文档解析技术,相关度计算技术,存储技术.压缩技术等.  相似文献   

15.
针对支持关键字搜索的XML非结构化查询,本文提出借助关系数据库存储XML数据,利用SQL查询。为此讨论了XML结构与关系模式的映射方法,倒排索引结构设计与存储,并对XML-QL进行扩展,使其支持关键字查询。  相似文献   

16.
公安文献全文检索系统中嵌入超文本技术,其技术关键主要有动态锚点词生成技术、锚点词库的构造、锚点词库与其他数据库之间的链接关系以及利用锚点词进行全文定位检索的实现方法。  相似文献   

17.
当今搜索引擎已经成为人们在网上搜索信息的重要工具,分析索引机制架构和全文检索系统结构,探讨了实现Tomcat+JSP+Lucene的运作流程和核心代码,对如何提高索引性能进行了研究.  相似文献   

18.
随着信息技术的发展,国家电网公司亟待改变人工项目审核的现状,实现项目重复审核自动化。因此,提出了基于Lucene的全文检索技术在电力项目计划审核方面的应用方案。首先深入分析了国家电网公司的项目审核现状和全文检索技术的研究现状,其次简单介绍了全文检索技术和Lucene全文检索引擎的概念,然后详细介绍了全文检索过程;最后将全文检索技术引入电力企业项目计划审核,给出了一个基于全文检索的电力企业项目计划审核系统的架构设计。使用Lucene全文检索引擎进行企业专项项目重复审核,可以方便、快速地获得检索排序结果和文档相似度,并且检索准确度高。  相似文献   

19.
在数据检索系统中,基于越来越大的隐私数据量以及越来越高的安全检索要求,Mimir全文检索系统应时而生。Mimir是一种新型的安全索引结构,在B+树结构基础上,其检索环境为全密文环境,从而保证了信息传递的私密性以及安全性。同传统的检索系统相比,该密文检索系统没有设置词频信息以及词汇位置信息。因而对于已知明文攻击具有良好的抵御性,并对词频统计攻击以及选择明文攻击进行良好的抵御。通过对该种全文检索系统的测试,可以表明其性能具有高度的安全性,并且在实验结果的分析中也进一步说明Mimir密文全文检索的储存空间以及检索时间都具有一定的优势。  相似文献   

20.
分析了建立数字化公文数据库的必要性,阐述了Lucene技术在建立数字化公文数据库全文检索系统中具备的优势,介绍了应用Lucene技术实现数字化公文全文检索的整个流程及关键技术.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号