期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

《中南民族大学学报(自然科学版)》2019,(2):285-290

为了使空间文本数据的处理更加快捷准确,针对基于位置的发布/订阅提出了将R-tree与布尔表达式有效结合的索引结构TR-tree.TR-tree主要由文本索引与空间索引组成,其中文本索引根据订阅中谓词的数量和不同的关键谓词将空间文本数据进行订阅分组和谓词分组.文本索引中使用了操作符列表储存谓词,以达到避免重复储存谓词、减少内存使用的目的.空间索引根据关键谓词与谓词数量构建不同的R-tree,增强了空间修剪的性能.实验结果表明TR-tree具有高效的匹配能力与较好的内存管理性能. 相似文献

2.

基于混合索引树的空间文本匹配算法

《华中科技大学学报(自然科学版)》2016,(5):1-6

针对空间文本对象流和订阅流的匹配,采用一种混合索引树来组织数据对象,包括多叉树空间索引、谓词索引和倒排文件三个部分,其中多叉树空间索引用于空间区域管理,谓词索引和倒排文件用于订阅谓词管理.在此基础上,提出了谓词索引建立算法、空间文本对象与倒排项匹配算法和混合索引树检索算法.与基于空间网格加倒排文件的检索方法进行了对比实验,结果表明:所提出的算法提高了用户的检索效率,并验证了其有效性. 相似文献

3.

PSP：一种高效的偏序域上skyline查询处理方法

白梅王京徽王习特朱斌李冠宇《湖南大学学报(自然科学版)》2020,47(8):9-20

为解决偏序域上的skyline查询问题,本文提出一种高效的偏序域上的skyline查询处理方法,来满足人们对查询效率日益增长的需求.首先,为提高偏序域上skyline的查询效率,将倒排索引引入skyline查询,提出一种基于倒排的索引结构.其次,提出基础算法(Basic Partially-ordered Skyline Processing based on inverted index,PSP_B),PSP_B包含两个阶段:第一阶段,能够通过映射将偏序域转化成全序域,并建立倒排索引;第二阶段,通过倒排索引提前找到扫描结束点,得到最终的skyline结果.再次,在PSP_B的基础上,进一步提出优化算法(Improved Partially-ordered Skyline Processing based on inverted index,PSP_I).PSP_I通过先分组再建索引的方法能够进一步提高计算效率.最后,用大量的实验证明本文所提算法的正确性和高效性. 相似文献

4.

基于时间的关键字路网路径规划

卢航李艳红黄金亮《中南民族大学学报(自然科学版)》2024,(2):201-208

为了便于道路网距离的计算、对象文本信息和时间信息的组织和快速获取,改进G-Tree,在索引结构上增加时间戳和倒排序列相关信息,称包含时间戳和倒排序列相关信息的G-Tree为IGT-Tree.并基于构建的IGT-Tree设计了两种推荐算法：一种是基于时间的目标点查询算法,另一种是在目标点查询算法基础上的路径推荐算法.最后,在基于时间的关键字路网通过实验对比G-Tree的算法验证了所提算法的高效性. 相似文献

5.

基于文档重排的索引压缩技术

纪蕾陈英《清华大学学报(自然科学版)》2005,45(9):1828-1832

对于提高网络搜索引擎系统的性能而言,有效的存取倒排索引表和快速的响应搜索操作起着关键的作用,故提出了一种能够有效提高索引压缩率的文档重排算法--Star-Scan算法.该算法是利用聚类算法将相似的文档排列到一起,从而减少编码文档编号(DocID)之间的差值所需要的字节数,达到提高索引压缩率的效果.在TREC12数据集上进行的多个实验表明,与随机排列相比,通过Star-Scan算法重新排列后的倒排表在Delta编码方式上压缩率平均提高了大约30.22%,从而有效地提高了搜索引擎的效率. 相似文献

6.

一种变长编码压缩倒排索引算法

毛福林瞿有利《山东大学学报(理学版)》2014,(12):30-35

全文检索的效率依赖于数据结构-倒排索引,存储倒排索引需要较大的硬盘存储空间。提出了一种新的压缩算法,主要用于倒排索引中文档标识符的压缩。对于给定的文档集合使用信息检索工具Terrier,使用不同的压缩算法压缩倒排索引中的文档标识符,从而生成倒排索引文件,然后比较倒排索引文件的大小。实验结果表明,使用新的压缩算法能够节省倒排索引文件的存储空间。相似文献

7.

地理社交网中基于范围的星型组查询

《燕山大学学报》2017,(5)

针对星型组查询只考虑了用户的位置信息和朋友关系,而没有考虑用户的偏好信息,使得推荐质量不高的问题,本文提出一种基于范围的星型组查询算法(m SG),同时考虑用户的社交关系、文本信息和当前位置信息,在给定范围为用户返回k个得分最高的星型组。为了迅速查找中心点用户,提出带倒排表的网格索引结构。为中心点用户更快速地查找朋友,提出了社交关系和文本信息混合索引结构。最后,通过实验表明,利用所提索引结构减少了查询算法的运行时间。相似文献

8.

倒排索引压缩及在RDBMS全文检索中的实现 总被引：2，自引：0，他引：2

朱虹吴林《华中科技大学学报(自然科学版)》2005,33(4):7-9

提出了一种对倒排索引进行压缩的方法,在保证较高压缩率的前提下,对压缩后的数据提供了随机访问的能力.这种方法将压缩后的数据分为两部分,第一部分用来表示单词在子区间的出现次数,第二部分用来表示单词在子区间的具体出现位置,详细描述了检索过程,通过第一部分的信息可以直接对第二部分的任意位置进行解压缩,体现了其随机访问能力,并分析了压缩比和检索效率,讨论了该压缩方法在RDBMS全文检索中的实现,以及如何用表格形式对其进行存储,针对多关键字的检索对算法进行了优化.该实现方法一方面充分利用了数据系统的优点,获得了良好的动态性能,另一方面节省了倒排索引对空间的需求,并提高了检索效率. 相似文献

9.

基于XML的搜索引擎倒排索引研究

张淳晟郑丽英《太原科技》2009,180(1)

随着互联网的迅速发展,搜索引擎变得越来越重要,人们对信息检索的要求越来越高.XML不仅仅关注文档结构.而且关注其中的语义内容.而倒排索引则是搜索引擎的核心技术.结合两种技术设计了一个基于XML的检索系统.并对其中的关键技术倒排索引更新优化提出新的方法. 相似文献

10.

一种面向域的高效倒排索引结构及实时更新 总被引：1，自引：1，他引：0

谭斌丁莎车念徐力聂清彬谭钱茂黄翔《四川大学学报(自然科学版)》2011,48(2):321-326

倒排索引是搜索引擎的核心组成部分,对搜索的效率与质量有着较大的影响.在一些主题搜索引擎中,关键词被划分为多个域以提高检索质量,针对这种特点,本文提出了一种新的面向域的高效倒排索引结构,以及实时更新倒排索引的算法.实验结果表明,在每个域内索引词项个数接近词典大小的情况下,本文提出的倒排索引结构可以有效地提高搜索引擎的检索效率. 相似文献

11.

基于多特征索引和局部约束的服饰检索方法

王丹臧雪柏《吉林大学学报(信息科学版)》2015,33(6):728-733

为弥补传统BoW(Bag of Words)模型缺失的颜色信息和空间信息, 提出了基于多特征索引和局部约束的服饰检索方法。基于BoW 模型分别建立关于颜色特征和SIFT 特征的两种倒排文件索引结构, 检索相似服饰图像, 并提出了局部约束的后验证方法。实验结果表明, 该方法在不同环境采集的服饰数据库的测试中, 得到了理想的检索性能。相似文献

12.

派生索引空间连接查询 总被引：3，自引：0，他引：3

刘宇朱仲英施颂椒《上海交通大学学报》2001,35(2):275-278

空间连接查询是最耗时、最重要的空间查询。针对空间多路连接中一方有R树索引,另一方是连接或选择的中间结果,因而无索引的情况,提出派生索引连接方法。这一方法基于父母索引为中间结果建立派生索引,以用于随后的空间连接,分析其查询花费,用于多路连接的查询优化。最后用实验结果说明方法的有效性。相似文献

13.

一种增量倒排索引结构的设计与实现

王冬左万利赫枫龄彭涛张长利《吉林大学学报(理学版)》2007,45(6):953-958

针对主题爬行器获取网页更新速度快的特点, 提出一种用于网络搜索引擎的增量索引结构. 在建立倒排索引时, 每个词项的记录表以链接块的形式存放于倒排索引文件中, 每次新分配的块大小递增. 该索引结构解决了倒排索引连续存储所带来的难以更新问题. 实验结果表明, 与支持实时更新的传统链表式存储方式相比, 这种索引结构能提供更高效的检索, 采用以空间换时间的方法有效地提高了索引的更新效率. 相似文献

14.

基于K-Means聚类的R-树空间索引方法研究与分析

余冬梅《科技导报(北京)》2012,30(11):76-79

空间聚类和空间索引的结合是当前空间数据库中提高数据检索效率的技术之一。本文从空间聚类和空间索引的存储原理入手,阐述了K-Means聚类算法及其改进算法的技术思路,研究了K-Means算法在空间数据库中与空间索引方法结合的技术问题;分析了当前基于K-Means算法的R-树系列空间索引技术的研究成果,阐述了它们提高空间检索效率的技术路线及实验结果,研究显示这些技术都能在一定程度上提高数据检索的效率。最后给出了聚类与空间索引结合技术未来的研究方向。相似文献

15.

PR-tree:P2P环境下一种多维数据的分布式索引结构 总被引：2，自引：0，他引：2

郭鹏王斌王国仁张恩德《华中科技大学学报(自然科学版)》2005,33(Z1):221-225

提出了一种基于R-tree的更适用于P2P环境的新型多维空间索引结构———PR-tree,并且在这种新型的索引结构下进行了高维数据的查询操作.这种新型的空间索引结构有两个主要的特点:对需要查询的数据空间进行层次划分;并且对结点的插入、删除等操作具有高度的灵活性.实验表明这种新型的空间索引结构在查询效率等方面都优于其他的索引形式. 相似文献

16.

基于文本信息的股票指数预测

董理王中卿熊德意《北京大学学报(自然科学版)》2017,53(2)

基于情感分析方法,对股票市场进行预测。将从社交媒体中抽取的文本信息(词信息、情感词信息和情感分类信息)与股票技术指标相结合,利用支持向量回归构建模型。通过实验与多种预测方法进行比较,结果表明该方法能够获得较为理想的预测结果。相似文献

17.

高性能网页索引器JU_Indexer的实现 总被引：4，自引：1，他引：3

赫枫龄左万利张雪松《吉林大学学报(理学版)》2006,44(1):50-56

高性能网页索引器JU_Indexer用倒排索引表存储网页索引数据, 以多线程并行的方式对网页建立索引数据, 采用经过优化的检索算法实现用户的查询. 首先给出了JU_Indexer的系统框架, 然后描述了索引数据在JU_Indexer中的存储结构、建立网页索引的算法、以及实现用户查询的检索算法. 实验结果表明, JU_Indexer能在毫秒级的时间内完成用户的查询, 它采用的经过优化的词组检索算法缩短了词组的检索时间. 相似文献

18.

An index method for continuous moving objects

ZHANG Hui-bin XIE Kun-qing MA Xiu-jun XU dan YANG Bao-gang 《重庆邮电大学学报(自然科学版)》2004,16(5)

There are current, historical and future information about continuously moving spatio-temporal objects. And there are correspondingly spatio-temporal indexes for current, past and future querying. Among the various types of spatio-temporal access methods, no one can support historical and future information querying. The Time Parameterized R-tree(TPR-tree) employs the idea of parametric bounding rectangles in the R-tree. It can effectively support predictive querying to continuously moving objects.Unfortunately, TPR-tree can not used to historical querying. This paper presents a partial-persistence method in order to extend TPR-tree for querying past information of moving objects. In this method, several TPR-trees will be created for more effectively predictive querying, because TPR-tree has a time horizon limit for predictive querying.Further more, a B-tree will be used to index time dimension. Since the partial-persistence method brings about huge storage space using, this paper also discusses some methods on how to reduce storage space. Finally, this paper presents an extensive experimental study for the proposed method and gives some interesting directions for future work. 相似文献

19.

一个基于Dublin Core元数据的超文本查询引擎

章旭钱龙华《苏州大学学报(医学版)》2004,20(2):30-34

传统的WEB查询是基于HTML文档中的全文信息的，只要文档中包含某一待查询的词语，文档就会被选中，而不管该单词在文档中的作用和地位如何．提出了一种基于文档的Dublin Core元数据的查询方法，首先从HTML文档中提取出相应的Dublin Core元数据放入索引库中．当用户提出查询请求时，在索引库查找与用户请求相匹配的文档条目，然后将它们返回给用户．由于元数据是对文档资源的精确描述，因此这种查询方法得到的文档具有较高的相关性，避免了出现大量无关的查询结果．相似文献

20.

An index method for continuous moving objects

ZHANGHui-bin XIEKun-qing MAXiu-jun XUdan YANGBao-gang 《重庆邮电学院学报(自然科学版)》2004,16(5):1-4

There are current, historical and future information about continuously moving spatio-temporal objects. And there are correspondingly spatio-temporal indexes for current, past and future querying. Among the various types of spatio-temporal access methods, no one can support historical and future information querying. The Time Parameterized R-tree(TPR-tree) employs the idea of parametric bounding rectangles in the R-tree. It can effectively support predictive querying to continuously moving objects. Unfortunately, TPR-tree can not used to historical querying. This paper presents a partial-persistence method in order to extend TPR-tree for querying past information of moving objects. In this method, several TPR-trees will be created for more effectively predictive querying, because TPR-tree has a time horizon limit for predictive querying. Further more, a B-tree will be used to index time dimension. Since the partial-persistence method brings about huge storage space using, this paper also discusses some methods on how to reduce storage space. Finally, this paper presents an extensive experimental study for the proposed method and gives some interesting directions for future work. 相似文献