首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
全文检索系统的数据库设计   总被引:1,自引:0,他引:1  
应用软件工程的方法对全文检索系统的数据库进行规范化设计,给出了系统数据库组织结构图。  相似文献   

2.
对基于关键字的数据库全文检索方案进行了研究,对已有的全文检索方法进行了分析研究.在按列扫描方法的基础上,提出了按行扫描的数据库全文检索方法.该方案不依赖于具体的数据库模式,提高了全文检索的检索效率,并能支持各种关系数据库管理系统,可以作为连接数据库和前端搜索程序的中间件.  相似文献   

3.
简述了文史资料的特点及其开发利用现状,以临沂文史资料全文数据库系统的构建为例,详细介绍了如何利用TPI全文检索系统,开发利用数量浩大、内容丰富的文史资料,以解决传统检索方法存在的不足。  相似文献   

4.
介绍了一种建立基于Web的全文检索电子图书系统的方法,讨论了WWWServer与SQI.Server数据库的CGI接口,并介绍了以WWW技术建立的电子图书系统实例--家族医生杂志全文检索系统。  相似文献   

5.
实现了中文单字切分模块,并在Lucene API基础上建立支持中英文混合检索的全文数据库。在电子文献全文检索系统项目中作为全文检索工具。中文全文数据库的主要性能和功能包括:支持中英文混合检索;可以不关机动态添加或删除一篇文档索引;采用多线程设计,能承受大量的访问请求;支持跨平台运行;提供命令行直接查询方式和基于WEB的查询方式;易学通用的检索表达式;系统可扩展性强。  相似文献   

6.
面对国外数据库厂商垄断中国市场的局面,达梦怀揣着自主研发中国数据库的梦想,致力开发具有自主版权的数据库软件。从第一代数据库产品DM1到第七代DM7,在长达十余年的市场推广中,达梦已建立了众多的示范工程,打破了国外数据库产品在我国一统天下的局面,走出了一条中国人自主研发数据库管理系统的道路。  相似文献   

7.
全文检索是现代信息检索技术的一个非常重要的分支,它是处理非结构化数据的强大工具,也是搜索引擎的核心技术之一。由于目前全文检索系统的开发平台并不多见,本文介绍了一种全文检索引擎工具包——Lucene,它功能强大,便于嵌入各种应用。本研究对如何利用新技术、改善检索系统的结构、提高检索系统的性能和效率、不断适应中文信息技术发展的需求等方面进行了新的探索。  相似文献   

8.
超文本全文检索技术的研究与实现   总被引:7,自引:0,他引:7  
在分析超文本全文检索功能需求的基础上,提出了一种将非结构的超文本转换成为结构化数据库,以支持全文检索的实现思想和模型,形式化地描述了超文本检索引擎的原理,并分析了模型设计与实现的关键技术问题,如超文本关键词提取、查询条件构造、全文检索算法及查询结果处理等。该模型具有实现简单、通用性强、支持大容量超文本信息检索等特点,并已在鲁讯图书馆数字化网络化信息系统和钱学森特色数据库系统中得到了验证和应用。  相似文献   

9.
针对传统数据库检索中检索速度较慢、 检索结果不完整、 检索结果排列无序等问题, 基于全文检索工具Lucene索引的结构, 设计一种基于Lucene的数据库索引结构, 并提出记录倒排索引链表的概念, 使网站不用再按照传统顺序查找方式进行检索, 而是以索引库中的关键词进行检索, 提高了检索效率. 实验结果表明, 基于
Lucene的数据库全文检索具有查全率高、 检索结果排列有序等优点.  相似文献   

10.
详细介绍了中文报刊全文数据库文献的特点。同时对报刊全文数据库设计、实现方法以及应用作了详细的讨论,最后分析了系统的特点与改进方向.  相似文献   

11.
本文论述了法规全文检索系统设计思想、系统的特点、主要功能和实现的方法 ,介绍了系统提供的包括自由文本检索、逻辑组合检索、程序检索在内的多种手段和方式 ,以及 B+树索引文件结构 .并进一步分析了采用超文本检索、多 B树结构、汉语词的切分和自动标引等可行方法 .  相似文献   

12.
漫谈网络数据库   总被引:2,自引:0,他引:2  
系统地介绍了网络数据库的定义、历史及其发展,着重分析了处于国际领先水平的非结构化数据管理和全文检索等方面的重大突破,以及网络数据库的独特功能。  相似文献   

13.
公安文献全文检索系统中嵌入超文本技术,其技术关键主要有动态锚点词生成技术、锚点词库的构造、锚点词库与其他数据库之间的链接关系以及利用锚点词进行全文定位检索的实现方法。  相似文献   

14.
本文主要分析了中文全文检索技术中有关内容,并根据此内容设计实现了一个中文全文检索系统.针对汉语词法的特殊性,在基于词表的全文索引方面,本文应用了一种改进的倒排索引结构,同传统索引结构相比,更便于索引的构建、维护、更新.并根据其特征,设计了优化的查询策略.  相似文献   

15.
DM数据库中的数据规模大且维度复杂,为了在有限的条件下尽可能满足用户对DM数据库功能的需求,提出一种新的DM数据库中大规模数据可扩展并行算法。不可扩展并行算法包括朴素并行、典型并行与逻辑并行三种处理规则,新算法将这三种处理规则结合起来实现数据自主运算,令每个运算节点均拥有三种处理模式,采用有向图将大规模数据划分为局部数据,并分配到处理器上,通过设置数据处理优先等级,完成流水线形式的数据处理过程,赋予并行算法强大的可扩展性。实验结果表明,新算法具有较强的可扩展性,负债均衡能力强。  相似文献   

16.
梁晟  熊莎 《科技信息》2011,(32):I0122-I0122
本文通过分析校园网网站信息的特点,采用Nutch网络爬虫和Lucene技术构建一个校园网全文检索系统,解决了中文分词等问题,提高了用户搜索的效率。  相似文献   

17.
分析了建立数字化公文数据库的必要性,阐述了Lucene技术在建立数字化公文数据库全文检索系统中具备的优势,介绍了应用Lucene技术实现数字化公文全文检索的整个流程及关键技术.  相似文献   

18.
在数据检索系统中,基于越来越大的隐私数据量以及越来越高的安全检索要求,Mimir全文检索系统应时而生。Mimir是一种新型的安全索引结构,在B+树结构基础上,其检索环境为全密文环境,从而保证了信息传递的私密性以及安全性。同传统的检索系统相比,该密文检索系统没有设置词频信息以及词汇位置信息。因而对于已知明文攻击具有良好的抵御性,并对词频统计攻击以及选择明文攻击进行良好的抵御。通过对该种全文检索系统的测试,可以表明其性能具有高度的安全性,并且在实验结果的分析中也进一步说明Mimir密文全文检索的储存空间以及检索时间都具有一定的优势。  相似文献   

19.
全文检索是现代信息检索技术的一个非常重要的分支,它是处理非结构化数据的强大工具,也是搜索引擎的核心技术之一。本文首先介绍了全文检索技术,其次概括了全文检索技术的发展现状,明确了全文检索开发的意义和内容,分析了搜索引擎全文检索机制,最后对开源全文检索引擎的优势进行了概括。  相似文献   

20.
设计实现了一个基于Lucene的全文检索系统模型.在该系统模型中,针对中文分词实现了基于词库的采用正向最大匹配算法的中文分词模块;针对多种格式文档的处理采用接口实现的方式和动态实例化的方法,实现了可以有效地处理txt、xml、html、pdf、doc和rtf等常见格式文档.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号