首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
为了使空间文本数据的处理更加快捷准确,针对基于位置的发布/订阅提出了将R-tree与布尔表达式有效结合的索引结构TR-tree.TR-tree主要由文本索引与空间索引组成,其中文本索引根据订阅中谓词的数量和不同的关键谓词将空间文本数据进行订阅分组和谓词分组.文本索引中使用了操作符列表储存谓词,以达到避免重复储存谓词、减少内存使用的目的.空间索引根据关键谓词与谓词数量构建不同的R-tree,增强了空间修剪的性能.实验结果表明TR-tree具有高效的匹配能力与较好的内存管理性能.  相似文献   

2.
针对空间文本对象流和订阅流的匹配,采用一种混合索引树来组织数据对象,包括多叉树空间索引、谓词索引和倒排文件三个部分,其中多叉树空间索引用于空间区域管理,谓词索引和倒排文件用于订阅谓词管理.在此基础上,提出了谓词索引建立算法、空间文本对象与倒排项匹配算法和混合索引树检索算法.与基于空间网格加倒排文件的检索方法进行了对比实验,结果表明:所提出的算法提高了用户的检索效率,并验证了其有效性.  相似文献   

3.
为解决偏序域上的skyline查询问题,本文提出一种高效的偏序域上的skyline查询处理方法,来满足人们对查询效率日益增长的需求.首先,为提高偏序域上skyline的查询效率,将倒排索引引入skyline查询,提出一种基于倒排的索引结构.其次,提出基础算法(Basic Partially-ordered Skyline Processing based on inverted index,PSP_B),PSP_B包含两个阶段:第一阶段,能够通过映射将偏序域转化成全序域,并建立倒排索引;第二阶段,通过倒排索引提前找到扫描结束点,得到最终的skyline结果.再次,在PSP_B的基础上,进一步提出优化算法(Improved Partially-ordered Skyline Processing based on inverted index,PSP_I).PSP_I通过先分组再建索引的方法能够进一步提高计算效率.最后,用大量的实验证明本文所提算法的正确性和高效性.  相似文献   

4.
为了便于道路网距离的计算、对象文本信息和时间信息的组织和快速获取,改进G-Tree,在索引结构上增加时间戳和倒排序列相关信息,称包含时间戳和倒排序列相关信息的G-Tree为IGT-Tree.并基于构建的IGT-Tree设计了两种推荐算法:一种是基于时间的目标点查询算法,另一种是在目标点查询算法基础上的路径推荐算法.最后,在基于时间的关键字路网通过实验对比G-Tree的算法验证了所提算法的高效性.  相似文献   

5.
对于提高网络搜索引擎系统的性能而言,有效的存取倒排索引表和快速的响应搜索操作起着关键的作用,故提出了一种能够有效提高索引压缩率的文档重排算法--Star-Scan算法.该算法是利用聚类算法将相似的文档排列到一起,从而减少编码文档编号(DocID)之间的差值所需要的字节数,达到提高索引压缩率的效果.在TREC12数据集上进行的多个实验表明,与随机排列相比,通过Star-Scan算法重新排列后的倒排表在Delta编码方式上压缩率平均提高了大约30.22%,从而有效地提高了搜索引擎的效率.  相似文献   

6.
全文检索的效率依赖于数据结构-倒排索引,存储倒排索引需要较大的硬盘存储空间。提出了一种新的压缩算法,主要用于倒排索引中文档标识符的压缩。对于给定的文档集合使用信息检索工具Terrier,使用不同的压缩算法压缩倒排索引中的文档标识符,从而生成倒排索引文件,然后比较倒排索引文件的大小。实验结果表明,使用新的压缩算法能够节省倒排索引文件的存储空间。  相似文献   

7.
针对星型组查询只考虑了用户的位置信息和朋友关系,而没有考虑用户的偏好信息,使得推荐质量不高的问题,本文提出一种基于范围的星型组查询算法(m SG),同时考虑用户的社交关系、文本信息和当前位置信息,在给定范围为用户返回k个得分最高的星型组。为了迅速查找中心点用户,提出带倒排表的网格索引结构。为中心点用户更快速地查找朋友,提出了社交关系和文本信息混合索引结构。最后,通过实验表明,利用所提索引结构减少了查询算法的运行时间。  相似文献   

8.
倒排索引压缩及在RDBMS全文检索中的实现   总被引:2,自引:0,他引:2  
提出了一种对倒排索引进行压缩的方法,在保证较高压缩率的前提下,对压缩后的数据提供了随机访问的能力.这种方法将压缩后的数据分为两部分,第一部分用来表示单词在子区间的出现次数,第二部分用来表示单词在子区间的具体出现位置,详细描述了检索过程,通过第一部分的信息可以直接对第二部分的任意位置进行解压缩,体现了其随机访问能力,并分析了压缩比和检索效率,讨论了该压缩方法在RDBMS全文检索中的实现,以及如何用表格形式对其进行存储,针对多关键字的检索对算法进行了优化.该实现方法一方面充分利用了数据系统的优点,获得了良好的动态性能,另一方面节省了倒排索引对空间的需求,并提高了检索效率.  相似文献   

9.
随着互联网的迅速发展,搜索引擎变得越来越重要,人们对信息检索的要求越来越高.XML不仅仅关注文档结构.而且关注其中的语义内容.而倒排索引则是搜索引擎的核心技术.结合两种技术设计了一个基于XML的检索系统.并对其中的关键技术倒排索引更新优化提出新的方法.  相似文献   

10.
一种面向域的高效倒排索引结构及实时更新   总被引:1,自引:1,他引:0  
倒排索引是搜索引擎的核心组成部分,对搜索的效率与质量有着较大的影响.在一些主题搜索引擎中,关键词被划分为多个域以提高检索质量,针对这种特点,本文提出了一种新的面向域的高效倒排索引结构,以及实时更新倒排索引的算法.实验结果表明,在每个域内索引词项个数接近词典大小的情况下,本文提出的倒排索引结构可以有效地提高搜索引擎的检索效率.  相似文献   

11.
为弥补传统BoW(Bag of Words)模型缺失的颜色信息和空间信息, 提出了基于多特征索引和局部约束的服饰检索方法。基于BoW 模型分别建立关于颜色特征和SIFT 特征的两种倒排文件索引结构, 检索相似服饰图像, 并提出了局部约束的后验证方法。实验结果表明, 该方法在不同环境采集的服饰数据库的测试中, 得到了理想的检索性能。  相似文献   

12.
派生索引空间连接查询   总被引:3,自引:0,他引:3  
空间连接查询是最耗时、最重要的空间查询。针对空间多路连接中一方有R树索引,另一方是连接或选择的中间结果,因而无索引的情况,提出派生索引连接方法。这一方法基于父母索引为中间结果建立派生索引,以用于随后的空间连接,分析其查询花费,用于多路连接的查询优化。最后用实验结果说明方法的有效性。  相似文献   

13.
针对主题爬行器获取网页更新速度快的特点, 提出一种用于网络搜索引擎的增量索引结构. 在建立倒排索引时, 每个词项的记录表以链接块的形式存放于倒排索引文件中, 每次新分配的块大小递增. 该索引结构解决了倒排索引连续存储所带来的难以更新问题. 实验结果表明, 与支持实时更新的传统链表式存储方式相比, 这种索引结构能提供更高效的检索, 采用以空间换时间的方法有效地提高了索引的更新效率.  相似文献   

14.
 空间聚类和空间索引的结合是当前空间数据库中提高数据检索效率的技术之一。本文从空间聚类和空间索引的存储原理入手,阐述了K-Means聚类算法及其改进算法的技术思路,研究了K-Means算法在空间数据库中与空间索引方法结合的技术问题;分析了当前基于K-Means算法的R-树系列空间索引技术的研究成果,阐述了它们提高空间检索效率的技术路线及实验结果,研究显示这些技术都能在一定程度上提高数据检索的效率。最后给出了聚类与空间索引结合技术未来的研究方向。  相似文献   

15.
PR-tree:P2P环境下一种多维数据的分布式索引结构   总被引:2,自引:0,他引:2  
提出了一种基于R-tree的更适用于P2P环境的新型多维空间索引结构———PR-tree,并且在这种新型的索引结构下进行了高维数据的查询操作.这种新型的空间索引结构有两个主要的特点:对需要查询的数据空间进行层次划分;并且对结点的插入、删除等操作具有高度的灵活性.实验表明这种新型的空间索引结构在查询效率等方面都优于其他的索引形式.  相似文献   

16.
基于情感分析方法,对股票市场进行预测。将从社交媒体中抽取的文本信息(词信息、情感词信息和情感分类信息)与股票技术指标相结合,利用支持向量回归构建模型。通过实验与多种预测方法进行比较,结果表明该方法能够获得较为理想的预测结果。  相似文献   

17.
高性能网页索引器JU_Indexer的实现   总被引:4,自引:1,他引:3  
高性能网页索引器JU_Indexer用倒排索引表存储网页索引数据, 以多线程并行的方式对网页建立索引数据, 采用经过优化的检索算法实现用户的查询. 首先给出了JU_Indexer的系统框架, 然后描述了索引数据在JU_Indexer中的存储结构、 建立网页索引的算法、 以及实现用户查询的检索算法. 实验结果表明, JU_Indexer能在毫秒级的时间内完成用户的查询, 它采用的经过优化的词组检索算法缩短了词组的检索时间.  相似文献   

18.
There are current, historical and future information about continuously moving spatio-temporal objects. And there are correspondingly spatio-temporal indexes for current, past and future querying. Among the various types of spatio-temporal access methods, no one can support historical and future information querying. The Time Parameterized R-tree(TPR-tree) employs the idea of parametric bounding rectangles in the R-tree. It can effectively support predictive querying to continuously moving objects.Unfortunately, TPR-tree can not used to historical querying. This paper presents a partial-persistence method in order to extend TPR-tree for querying past information of moving objects. In this method, several TPR-trees will be created for more effectively predictive querying, because TPR-tree has a time horizon limit for predictive querying.Further more, a B-tree will be used to index time dimension. Since the partial-persistence method brings about huge storage space using, this paper also discusses some methods on how to reduce storage space. Finally, this paper presents an extensive experimental study for the proposed method and gives some interesting directions for future work.  相似文献   

19.
传统的WEB查询是基于HTML文档中的全文信息的,只要文档中包含某一待查询的词语,文档就会被选中,而不管该单词在文档中的作用和地位如何.提出了一种基于文档的Dublin Core元数据的查询方法,首先从HTML文档中提取出相应的Dublin Core元数据放入索引库中.当用户提出查询请求时,在索引库查找与用户请求相匹配的文档条目,然后将它们返回给用户.由于元数据是对文档资源的精确描述,因此这种查询方法得到的文档具有较高的相关性,避免了出现大量无关的查询结果.  相似文献   

20.
There are current, historical and future information about continuously moving spatio-temporal objects. And there are correspondingly spatio-temporal indexes for current, past and future querying. Among the various types of spatio-temporal access methods, no one can support historical and future information querying. The Time Parameterized R-tree(TPR-tree) employs the idea of parametric bounding rectangles in the R-tree. It can effectively support predictive querying to continuously moving objects. Unfortunately, TPR-tree can not used to historical querying. This paper presents a partial-persistence method in order to extend TPR-tree for querying past information of moving objects. In this method, several TPR-trees will be created for more effectively predictive querying, because TPR-tree has a time horizon limit for predictive querying. Further more, a B-tree will be used to index time dimension. Since the partial-persistence method brings about huge storage space using, this paper also discusses some methods on how to reduce storage space. Finally, this paper presents an extensive experimental study for the proposed method and gives some interesting directions for future work.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号