首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
1.全文检索及发展 随着大量信息的出现以及计算机存储技术的发展,文献数据库正由书目数据库向全文数据库转变.这一转变使得全文检索技术得到空前的发展.常用的实现全文检索的方法主要有以下两种:第一种方法是不对数据库建立索引而直接对文章进行匹配的方法.这种方法由于没有建立索引库,因此所占空间较少,但同时正是因为它没有索引库,所以在进行全文匹配时要花费大量的时间.第二种方法是一种为全文建立索引的方法.这种方法可以大大节省检索的时间.但同时,这种方法需要占用一定的存储空间来建立索引库.目前,许多研究机构都在进行对全文检索的研究.传统的信息单位,图书馆等也开始建立全文数据库.一些软件公司,也纷纷推出全文检索软件.比较著名的有Microsoft公司开发的SQL Senrer 2000.  相似文献   

2.
1全文检索及发展随着大量信息的出现以及计算机存储技术的发展,文献数据库正由书目数据库向全文数据库转变。这一转变使得全文检索技术得到空前的发展。常用的实现全文检索的方法主要有以下两种:第一种方法是不对数据库建立索引而直接对文章进行匹配的方法。  相似文献   

3.
流行的数据库管理系统通常实现了全文检索子系统,从而方便对数据库表中的文本数据建立全文索引,进而借助于这个索引来检索文本数据.达梦数据库管理系统提供多文本数据检索服务.包括全文索引和全文检索.达梦数据库实现了全文检索系统.但是此系统存在着索引膨胀率过高,索引填充时间较长的问题.全文检索,是一门综合性很强的技术.它牵扯到了很多的技术点,主要有分词技术,数据源提取和文档解析技术,相关度计算技术,存储技术.压缩技术等.  相似文献   

4.
针对传统数据库检索中检索速度较慢、 检索结果不完整、 检索结果排列无序等问题, 基于全文检索工具Lucene索引的结构, 设计一种基于Lucene的数据库索引结构, 并提出记录倒排索引链表的概念, 使网站不用再按照传统顺序查找方式进行检索, 而是以索引库中的关键词进行检索, 提高了检索效率. 实验结果表明, 基于
Lucene的数据库全文检索具有查全率高、 检索结果排列有序等优点.  相似文献   

5.
实现了中文单字切分模块,并在Lucene API基础上建立支持中英文混合检索的全文数据库。在电子文献全文检索系统项目中作为全文检索工具。中文全文数据库的主要性能和功能包括:支持中英文混合检索;可以不关机动态添加或删除一篇文档索引;采用多线程设计,能承受大量的访问请求;支持跨平台运行;提供命令行直接查询方式和基于WEB的查询方式;易学通用的检索表达式;系统可扩展性强。  相似文献   

6.
介绍了一种建立基于Web的全文检索电子图书系统的方法,讨论了WWWServer与SQI.Server数据库的CGI接口,并介绍了以WWW技术建立的电子图书系统实例--家族医生杂志全文检索系统。  相似文献   

7.
本文主要分析了中文全文检索技术中有关内容,并根据此内容设计实现了一个中文全文检索系统.针对汉语词法的特殊性,在基于词表的全文索引方面,本文应用了一种改进的倒排索引结构,同传统索引结构相比,更便于索引的构建、维护、更新.并根据其特征,设计了优化的查询策略.  相似文献   

8.
根据全文检索Apache Lucene引擎原理与流程,设计了一种网络视频信息的索引方法.可以对所有的视频信息进行索引,解决了视频搜索引擎排序信息不明以及局域网站搜索的局限性等问题.  相似文献   

9.
分析了建立数字化公文数据库的必要性,阐述了Lucene技术在建立数字化公文数据库全文检索系统中具备的优势,介绍了应用Lucene技术实现数字化公文全文检索的整个流程及关键技术.  相似文献   

10.
对基于关键字的数据库全文检索方案进行了研究,对已有的全文检索方法进行了分析研究.在按列扫描方法的基础上,提出了按行扫描的数据库全文检索方法.该方案不依赖于具体的数据库模式,提高了全文检索的检索效率,并能支持各种关系数据库管理系统,可以作为连接数据库和前端搜索程序的中间件.  相似文献   

11.
随着人类步入信息时代,网上庞大的数字化信息与人们获取所需信息能力之间的矛盾日益突出,怎样快速地检索相关信息已经成为研究热点。阐述了全文检索系统的原理,分析了基于字表结构的索引组织方法和索引库的建立。通过和B-树的对比,提出了基于B+树的索引存储方法及其算法思想,对提高索引的存储效率和查找速度具有一定意义。  相似文献   

12.
介绍了一种在程序中动态建立数据表的主索引和次索引的方法 ,使用这种方法可以提高数据库应用程序的稳定性和可靠性  相似文献   

13.
为了实现基于内容的语音全文检索,提高语音检索性能,以及保障云端语音数据的隐私安全,提出了一种基于声母和深度哈希的密文语音全文检索方法.该方法将提出的基于汉语声母和元音的双向循环递归神经网络(RNN)-长短时记忆(LSTM)深度学习模型与语音感知哈希相结合,分别将加密语音和生成的哈希码上传至云端密文语音库和全文哈希索引表,并建立一一映射关系.查询时提取待查询语音的哈希码,并与云端的全文哈希索引表进行阶段式匹配检索.实验结果表明:该方法既能保障语音隐私安全,又能获得较高的检索精确度与可观的召回率(当精确度为97.68%时召回率可达47.60%),并在一定程度上减弱了说话人声音特征对全文检索的不利影响.  相似文献   

14.
采用文献计量学的方法,从文献数量的年度分布、被引量和下载量、作者及机构分布几方面对国内索引方法与技术研究的文献进行了统计分析,利用CitesPace软件绘制了研究热点聚类图.结果表明:专门研究索引方法与技术的研究者比较少,稳定的核心研究群体尚未形成;核心研究人员比较集中于硕士、博士群体;总体上,该领域研究面还比较窄,主要集中于空间索引、全文检索、XML索引、时空数据库、位置敏感哈希、时态索引等6个热点研究领域,关于应用与服务相关的研究还比较欠缺.  相似文献   

15.
全文检索是基于Web的信息搜索的关键技术,文章从基于KySou的全文检索系统的实现机制入手,深入分析了全文检索系统的工作原理、系统组成及API接口设计,并就全文检索系统的优化进行探讨,包括索引过程优化和搜索过程优化。  相似文献   

16.
大型指纹数据库的广泛应用,使得记录数量的增长和检索效率的矛盾日益尖锐,这就需要建立一种多级索引指纹数据库.文章提出使用指纹纹形、脊线数目和基于Gabor滤波的指纹特征———指纹码构建多级索引指纹数据库和在此基础上检索多级指纹数据库的方法.通过实验数据对两级和多级索引指纹数据库作比较,并作算法性能分析.  相似文献   

17.
为实现数据库的快速查询,我们引入了索引结构,.目前已有多种不同的数据结构可用作索引.,稀疏索引、稠密索引、辅助索引、散列表、B树等等。但随着多媒体数据库与数据挖掘等应用领域的发展,只建立一维索引已经不能解决问题,随后我们引入了多维索引。所谓多维索引,就是关系的每个属性都可以看成一维,而所有的元组就是在由这些维上定义的空间中的点。多维索引结构大概分为两种,一种是类散列结构,一种是树形结构。下面我主要介绍多维数据的树形结构组织方法。  相似文献   

18.
提出了实现全文检索系统的具体方案,介绍了相关技术并详细描述了系统实现过程,给出了部分关键代码,设计并实现了基于ASP.NET及索引服务的Web站点全文检索系统.该系统的建立及运行,提高了用户站内检索效率及查全率,使站内信息资源得以充分利用.  相似文献   

19.
为在保证中文歧义包容和长度限制的同时提高中文全文检索的速率, 在现有中文分词算法的基础上, 提出了一种改进的中文分词算法。通过在算法中建立索引的过程建立文本中相关词与词库的映射, 对词库进行改造, 使之更好地与相关词进行映射, 以便于实现中文分词。实验证明, 改进的中文分词算法能降低检索耗时, 是已有的分词算法的1/2和1/5, 有效提高中文全文检索的速率。  相似文献   

20.
全文检索的效率依赖于数据结构-倒排索引,存储倒排索引需要较大的硬盘存储空间。提出了一种新的压缩算法,主要用于倒排索引中文档标识符的压缩。对于给定的文档集合使用信息检索工具Terrier,使用不同的压缩算法压缩倒排索引中的文档标识符,从而生成倒排索引文件,然后比较倒排索引文件的大小。实验结果表明,使用新的压缩算法能够节省倒排索引文件的存储空间。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号