首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 625 毫秒
1.
分布式搜索引擎在实际运行中存在大量的用户,同时索引更新频繁,而索引更新过程的复杂度使得用户的检索请求响应出现较大的延迟。本文提出一种基于内存映射表的索引库动态维护算法,按照一定时间粒度组织索引库,在内存中维护一个当前可用的子索引库列表,实现索引的透明更新。实验表明,该算法能够保证及时地对新数据建立索引,同时有效降低用户检索请求的响应时间。  相似文献   

2.
引文索引不同于一般意义上的索引,它具有独特的功能与形式.在编制原理、体例结构和检索方法上与常规的索引不一样.我们可以利用引文索引查出相关的所需文献后,再利用这些文献的引文查找一批新的文献,了解引文源对目标文献的影响,研究新旧文献在该领域的学术价值贡献以及动态.  相似文献   

3.
中文Web文档全文检索系统的设计及实现   总被引:10,自引:0,他引:10  
为解决在检索某些词时发生漏检或错检,以及查全率和查准率不高的问题,研究字索引技术在中文Web文档检索中的应用.着重讨论字索引组织结构和检索方法,并引入了字节对齐的索引压缩方法,最后描述了一个中文Web文档全文检索系统的结构和实现.测试表明,该系统在响应时间和查准率方面性能均比较好,具有一定的实用性.  相似文献   

4.
倒排索引压缩及在RDBMS全文检索中的实现   总被引:2,自引:0,他引:2  
提出了一种对倒排索引进行压缩的方法,在保证较高压缩率的前提下,对压缩后的数据提供了随机访问的能力.这种方法将压缩后的数据分为两部分,第一部分用来表示单词在子区间的出现次数,第二部分用来表示单词在子区间的具体出现位置,详细描述了检索过程,通过第一部分的信息可以直接对第二部分的任意位置进行解压缩,体现了其随机访问能力,并分析了压缩比和检索效率,讨论了该压缩方法在RDBMS全文检索中的实现,以及如何用表格形式对其进行存储,针对多关键字的检索对算法进行了优化.该实现方法一方面充分利用了数据系统的优点,获得了良好的动态性能,另一方面节省了倒排索引对空间的需求,并提高了检索效率.  相似文献   

5.
首先对地理空间的变化进行了研究,发现人们日常所处的空间(如城市)本质上是一个渐变空间,在日常空间管理中,为空间实体建立动态空间索引,融合空间实体的层次关系和邻接关系,即维护了索引的完整性和一致性,又提高了系统的效率,经过对现有空间索引结构的分析和比较,发现它们都缺少邻接关系的表达,只有将R树和Voronoi图结合起来,才能满足建立动态空间索引的要求,最后给出了实现动态空间索引自我维护的插入,删除方法的实现步骤。  相似文献   

6.
分析了当前信息检索多是建立在语词匹配基础上的搜索,索引库不断增大,搜索时间长等问题.通过对文本检索步骤和索引结构的研究表明,索引结构是决定文本检索效率的关键.提出对动态索引结构B+树进行改进,通过改进减少了索引层数,提高了检索速度,降低了索引存储空间,研究结果对改进文本检索效率具有积极意义.  相似文献   

7.
空间数据库的索引技术是提高空间数据库存储效率、空间检索性能的关键技术.迄今人们已经提出了许多空间索引方法,其中网格空间索引数据结构是目前在GIS中被最为广泛采用的一种索引数据结构.网格索引中最大的难点在于确定网格划分的精细程度,网格划分的好坏将对索引数据量和检索效率产生直接影响.针对网格空间索引方法的特点和局限性,我们提出了对地理范围多次划分,划分矩形的长宽取值与空间实体对象直接关联的改进算法.改进后的算法可以减少划分过程中人为因素的影响,增强层次划分的稳定性,提高空间数据的访问效率.  相似文献   

8.
为了提高自然语言网络答疑系统(Natural Language Web Answer System,简称NLWAS)中问答对的匹配速度和精度,提出了基于倒排词的倒排索引设计方案,详细阐述了索引体系结构,数据结构,匹配策略,动态维护,并对时间复杂度进行了分析.实际应用结果表明,使用倒排索引后系统性能优化效果明显增强.  相似文献   

9.
数据仓库中的索引技术研究   总被引:1,自引:0,他引:1  
介绍了数据仓库中的几种索引的建立与维护方法,并对各种索引方法的优缺点进行了分析与比较,以便在数据仓库的实施中选择合适的索引技术,提高数据仓库的性能。  相似文献   

10.
针对传统数据库检索中检索速度较慢、 检索结果不完整、 检索结果排列无序等问题, 基于全文检索工具Lucene索引的结构, 设计一种基于Lucene的数据库索引结构, 并提出记录倒排索引链表的概念, 使网站不用再按照传统顺序查找方式进行检索, 而是以索引库中的关键词进行检索, 提高了检索效率. 实验结果表明, 基于
Lucene的数据库全文检索具有查全率高、 检索结果排列有序等优点.  相似文献   

11.
Index structure that enables efficient similarity queries in high-dimensional space is crucial for many applications. This paper discusses the indexing problem in dataset composed of partially clustered data, which exists in many applications. Current index methods are inefficient with partially clustered datasets. The dynamic and adaptive index structure presented here, called a multi-cluster tree (MC-tree), consists of a set of height-balanced trees for indexing. This index structure improves the querying efficiency in three ways: 1) Most bounding regions achieve uniform distributions, which results in fewer splits and less overlap compared with a single indexing tree. 2) The clusters in the dataset are dynamically detected when the index is updated. 3) The query process does not involve a sequential scan. The MC-tree was shown to be better than hierarchical and cluster-based indexes for the partially clustered datasets.  相似文献   

12.
提出了一种基于BWT(Burrows-wheeler-transform)的字符串集合的索引方法,以解决带有匹配字符串长度和匹配子串位置约束的子串确切匹配查找问题.讨论了BWT和基于BWT索引进行确切子串查找的基本原理.分析了字符串集合、匹配字符串长度和匹配子串位置约束对原BWT索引的影响.重点解决了快速地从匹配后缀位置到字符串ID和匹配子串位置的计算问题.在3个真实的数据集上进行了比对实验,结果表明:所提出的基于BWT索引方法在没有增加原索引大小的情况下,大大提升了带有匹配字符串长度和匹配位置约束的确切子串的查找的性能,因此该算法更加适用于大规模的字符串集合的索引进行近似字符串匹配和连接.  相似文献   

13.
李晔  谢琦 《河南科学》2005,23(2):292-295
探讨了一种空间数据的组织方式,以及在这种方式下为了加快检索速度而建立的空间索引的方法.针对配电网络的实际应用情况,分析对比了BSP树、KDB树、R 树、网格划分等方法针对二维空间数据索引的效率,及其优缺点.详细讨论了适合于配电网络的网格索引机制的建立方法.  相似文献   

14.
索引技术的发展对索引方式的现代化具有重要意义,网络信息的索引方式主要有人工索引、自动索引、基于网络机器人的索引、基于元数据方式的索引、数据库的索引等.  相似文献   

15.
索引编号图(以下称为"索引图")是构成产品装配工艺图及产品图册的关键元素。为提高索引图制作效率,提出一种基于模型的索引图标注方法,通过索引自动排序、指引点确定及索引智能排布等算法,实现了三维索引图自动标注功能。与其他方法相比,该方法提高了索引图的制作效率,对服务人员维修产品具有一定的应用价值。以典型工程机械起重机为例对所提方法进行了说明。  相似文献   

16.
针对传统索引算法在数字数据索引应用中存在的索引建立时间开销较大问题, 提出一种将B+树理论和算法应用于索引的设计方案. 在对B+树索引基础上, 建立了索引存储模型, 结合位图存储方式将B+树节点存储在存储介质上, 实现索引存储. 实验结果表明, 使用B+树, 可按路径读取, 节省了建立索引时间, 同时提高了B+树的稳定性, 在B+树节点存储的情况下访问键值信息, 索引速度得到较大提升.  相似文献   

17.
通过对基于交通网络(简称网络)移动对象索引方法FNR-Tree的分析,提出了一种改进的TNR-Tree方法。该方法充分利用网络信息,增大空间索引粒度,使用更合理的时间间隔,加强对轨迹的索引。性能分析说明了TNR-Tree方法较大程度地减少数据存储量和索引尺寸,提高了插入性能,并能有效地进行轨迹索引。  相似文献   

18.
为在网络数据中搜索到所需相关数据, 通过对基于后缀数组的全文索引结构的改进研究, 设计和实现一种降低空间占用率并有效提高索引速度的全文索引结构加权有向词图。通过实验证明, 加权有向词图在相同问题规模下能降低存储空间, 同时不影响检索的效率, 是一种更为高效的全文索引结构。  相似文献   

19.
通过对基于交通网络(简称网络)移动对象索引方法FNRTree的分析,提出了一种改进的TNRTree方法。该方法充分利用网络信息,增大空间索引粒度,使用更合理的时间间隔,加强对轨迹的索引。性能分析说明了TNRTree方法较大程度地减少数据存储量和索引尺寸,提高了插入性能,并能有效地进行轨迹索引。  相似文献   

20.
端齿盘加工精度的高低会直接影响到整个刀架的分度精度.在对端齿盘加工误差进行分析的基础上建立了端齿盘的分度误差模型,利用二阶矩和摄动方法求出端齿盘的可靠性指标,并计算出其可靠度.以端齿盘的分度误差模型为基础,将可靠性理论与灵敏度分析方法相结合,给出了动力伺服刀架端齿盘分度精度可靠性灵敏度设计的分析方法.通过算例得出了端齿盘各随机参数的可靠性灵敏度变化规律,并分析了各随机参数的变化对端齿盘分度精度可靠性的影响.研究表明,端齿盘各设计参数的改变对其可靠性的敏感程度不一,可通过优化敏感参数来提高齿盘的分度精度可靠性.同时为提高刀架系统的分度精度可靠性提供理论依据.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号