首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
全文检索是现代信息检索技术的一个非常重要的分支,它是处理非结构化数据的强大工具,也是搜索引擎的核心技术之一。由于目前全文检索系统的开发平台并不多见,本文介绍了一种全文检索引擎工具包——Lucene,它功能强大,便于嵌入各种应用。本研究对如何利用新技术、改善检索系统的结构、提高检索系统的性能和效率、不断适应中文信息技术发展的需求等方面进行了新的探索。  相似文献   

2.
梁晟  熊莎 《科技信息》2011,(32):I0122-I0122
本文通过分析校园网网站信息的特点,采用Nutch网络爬虫和Lucene技术构建一个校园网全文检索系统,解决了中文分词等问题,提高了用户搜索的效率。  相似文献   

3.
分析了建立数字化公文数据库的必要性,阐述了Lucene技术在建立数字化公文数据库全文检索系统中具备的优势,介绍了应用Lucene技术实现数字化公文全文检索的整个流程及关键技术.  相似文献   

4.
针对传统数据库检索中检索速度较慢、 检索结果不完整、 检索结果排列无序等问题, 基于全文检索工具Lucene索引的结构, 设计一种基于Lucene的数据库索引结构, 并提出记录倒排索引链表的概念, 使网站不用再按照传统顺序查找方式进行检索, 而是以索引库中的关键词进行检索, 提高了检索效率. 实验结果表明, 基于
Lucene的数据库全文检索具有查全率高、 检索结果排列有序等优点.  相似文献   

5.
Lucene全文检索技术是信息检索领域广泛使用的基本技术。它是一个优秀的开源全文本搜索技术框架。按照Lucene的框架规范,扩展Lucene的功能,可以将Lucene很好地嵌入到自己的搜索引擎中。首先介绍了一个高性能的全文检索引擎--Lucene开源系统,详细分析了Lucene的系统结构,程序运行逻辑,以及在Lucene上的扩展,即中文分词器的设计;然后将其引入具体应用,给出了一个基于Lucene全文检索技术的名著——《红楼梦》搜索引擎的设计与实现。  相似文献   

6.
介绍开放源代码的全文检索引擎工具包Lucene的系统结构和实现机制,分析Lucene的组织结构及全文检索的分词的相关方法后,给出Lunene在全文检索领域中的应用方式。  相似文献   

7.
随着信息技术的发展,国家电网公司亟待改变人工项目审核的现状,实现项目重复审核自动化。因此,提出了基于Lucene的全文检索技术在电力项目计划审核方面的应用方案。首先深入分析了国家电网公司的项目审核现状和全文检索技术的研究现状,其次简单介绍了全文检索技术和Lucene全文检索引擎的概念,然后详细介绍了全文检索过程;最后将全文检索技术引入电力企业项目计划审核,给出了一个基于全文检索的电力企业项目计划审核系统的架构设计。使用Lucene全文检索引擎进行企业专项项目重复审核,可以方便、快速地获得检索排序结果和文档相似度,并且检索准确度高。  相似文献   

8.
设计实现了一个基于Lucene的全文检索系统模型.在该系统模型中,针对中文分词实现了基于词库的采用正向最大匹配算法的中文分词模块;针对多种格式文档的处理采用接口实现的方式和动态实例化的方法,实现了可以有效地处理txt、xml、html、pdf、doc和rtf等常见格式文档.  相似文献   

9.
全文检索是现代信息检索技术的一个非常重要的分支,它是处理非结构化数据的强大工具,也是搜索引擎的核心技术之一。本文首先介绍了全文检索技术,其次概括了全文检索技术的发展现状,明确了全文检索开发的意义和内容,分析了搜索引擎全文检索机制,最后对开源全文检索引擎的优势进行了概括。  相似文献   

10.
基于Lucene的网站全文搜索的设计与实现   总被引:6,自引:0,他引:6  
Lucene是一个基于Java技术的开放源代码全文索引引擎工具包,它可以方便地嵌入到各种应用中实现针对应用的全文索引/检索功能。利用Lucene的API可以比较万便地为一个网站提供全文搜索功能。探讨了如何使用Lucene建造一个通用的Web站点全文搜索工具,并对在构建系统中应注意的若干问题进行了探讨。  相似文献   

11.
流行的数据库管理系统通常实现了全文检索子系统,从而方便对数据库表中的文本数据建立全文索引,进而借助于这个索引来检索文本数据.达梦数据库管理系统提供多文本数据检索服务.包括全文索引和全文检索.达梦数据库实现了全文检索系统.但是此系统存在着索引膨胀率过高,索引填充时间较长的问题.全文检索,是一门综合性很强的技术.它牵扯到了很多的技术点,主要有分词技术,数据源提取和文档解析技术,相关度计算技术,存储技术.压缩技术等.  相似文献   

12.
阐述和分析了全文检索系统的概念及其特点,研究了Lucene.Net架构及其主要模块,在此基础上,实现了具有用户权限的全文检索系统.  相似文献   

13.
全文检索系统的数据库设计   总被引:1,自引:0,他引:1  
应用软件工程的方法对全文检索系统的数据库进行规范化设计,给出了系统数据库组织结构图。  相似文献   

14.
介绍了一种建立基于Web的全文检索电子图书系统的方法,讨论了WWWServer与SQI.Server数据库的CGI接口,并介绍了以WWW技术建立的电子图书系统实例--家族医生杂志全文检索系统。  相似文献   

15.
Lucene作为Apache Software Foundation的子项目之一在开源信息检索库的发展过程中扮演着相当重要的角色。本文分析了Lucene信息检索库并着重对其体系结构和索引机制进行了研究,在文章的最后对开源信息检索库Lucene的应用给予了探讨。  相似文献   

16.
对全文检索技术进行了介绍,提出了一种基于网络爬虫Heritrix和开源全文信息检索包Lucence的全文检索解决方案.该方案将Web应用中经常用到的全文检索功能进行封装,使其可以很方便地被集成到Java EE项目中.本方案被用于校园网内容检索功能的实现,实践证明,该解决方案简单易用、应用效果较好.  相似文献   

17.
随着网络的发展,用户对搜索引擎的要求越来越高,Lucene是一个用Java写的全文索引引擎工具包,可以方便的嵌入到各种应用程序中,与传统的搜索引擎相比,它更快捷、更准确的实现全文索引/检索功能。  相似文献   

18.
对基于关键字的数据库全文检索方案进行了研究,对已有的全文检索方法进行了分析研究.在按列扫描方法的基础上,提出了按行扫描的数据库全文检索方法.该方案不依赖于具体的数据库模式,提高了全文检索的检索效率,并能支持各种关系数据库管理系统,可以作为连接数据库和前端搜索程序的中间件.  相似文献   

19.
公安文献全文检索系统中嵌入超文本技术,其技术关键主要有动态锚点词生成技术、锚点词库的构造、锚点词库与其他数据库之间的链接关系以及利用锚点词进行全文定位检索的实现方法。  相似文献   

20.
本文基于Java体系开源框架Spring3.0、Struts2、Hibernate3.3和Compass2.1设计与实现了一个B/S模式的图书文献全文检索系统,系统采用MVC框架,集成Spring3.0、Struts2、Hibernate3.3实现/AOP以及事务管理、控制层,数据持久层,应用Compass实现索引的创建与数据库同步更新,系统应用在图书馆海量图书文献的检索中,此传统的C/S模式的基于SQL的数据库检索系统,检索结果的呈现要提高教倍,耗时为毫秒级.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号