首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
逆向Skyline查询能够应用到诸如决策支持、用户偏好支持以及市场行为分析等方面。由于参考对象q的存在,在执行逆向Skyline查询的过程中数据空间被划分成许多分区。然而,存在的算法都没有考虑这个问题的影响,直接使用原始数据集建立索引结构。本文提出了一种新的逆向Skyline查询方法CRSQ,它考虑了这个问题。CRSQ首先根据查询对象q对数据进行聚类,然后建立R-tree索引,最后利用高效修剪策略修剪索引搜索空间。实验结果表明CRSQ算法是有效的,它相对于没有聚类技术的算法获得了50%以上的性能提高。  相似文献   

2.
为了提高Skyline查询的数据安全性和响应速度,提出了标记Skyline立方体概念.标记Skyline立方体面向标记安全数据库,符合强制访问控制的读访问规则.它由所有不同标记用户的Skyline查询结果组成,通过预计算这种立方体,能迅速响应每个不同标记用户的Skyline查询.为了高效计算标记Skyline立方体,设计并实现了一个基于共享策略的算法.该算法结合Skyline特点和标记特点进行了优化.利用标记支配关系所蕴含的点集包含关系,通过迭代实现计算结果共享,避免了独立计算立方体中每个Skyline所导致的低效率.  相似文献   

3.
为了解决云环境下对于海量数据的Skyline查询,提出了在Map-Reduce框架下基于衰减因子网格Skyline查询(SQBDFG)算法,该算法通过衰减式的网格进行区域划分,利用网格间的统治关系进行快速过滤,达到减少传输开销的目的,并针对网格的衰减速度会影响实际查询性能进行进一步优化.首先提出网格的最大剪枝空间和最大剪枝效率两个概念,然后从理论上证明了采用衰减式网格在处理海量数据的Skyline查询时在这两方面具有明显的优势.最后通过Hadoop分布式集群上的大量实验,在Skyline查询时间和数据I/O开销两个方面进行对比,证明了提出的SQBDFG算法具有良好的有效性和实用性.  相似文献   

4.
针对感知数据固有的不确定性问题,研究了无线传感器网络中概率Skyline查询的处理与优化技术.首先分析了概率Skyline查询的性质,证明了概率Skyline查询的不可分解性,因而无法直接利用网内计算方法求解;进而提出了无线传感器网络中基于过滤的概率Skyline查询处理算法(filter basedprobabilisticSkylinequeryprocessingalgorithminWSN,FPSP).FPSP算法将感知数据划分为候选数据、相关数据和无关数据;只需要候选数据和相关数据即可求得概率Skyline查询结果,可以在传感器节点过滤无关数据以避免大量的数据网内传输.仿真实验结果表明,FPSP算法可以有效降低传感器节点的数据传输量,极大地延长了无线传感器网络的使用寿命.  相似文献   

5.
提出一种MapReduce并行计算模型下基于R树索引的Skyline查询算法, 解决了海量空间数据集下执行Skyline查询效率低的问题. 通过建立R树索引实现空间数据不同粒度的范围剪枝, 有效降低了分布式Skyline查询需扫描的数据规模, 提高了在MapReduce模型下Skyline查询的执行效率. 在不同数据分布下进行对比实验的结果表明, 该方法比已有算法在执行效率上更具优势.  相似文献   

6.
提出了一种高效的子空间可逆skyline查询算法RSQS.该算法采用基于分区的B+树对可逆Skyline进行计算,不同于传统的R-tree修剪方法;RSQS利用提出的几种修剪策略,包括相互修剪、预计算、尽早终止搜索等,采用过滤-精炼框架实现,能快速地修剪搜索空间,避免了大部分的I/O操作.实验结果表明:RSQS算法具有极高的修剪能力和很高的效率:在二维子空间中每个对象平均仅需与约1.2个其他对象比较.  相似文献   

7.
为解决偏序域上的skyline查询问题,本文提出一种高效的偏序域上的skyline查询处理方法,来满足人们对查询效率日益增长的需求.首先,为提高偏序域上skyline的查询效率,将倒排索引引入skyline查询,提出一种基于倒排的索引结构.其次,提出基础算法(Basic Partially-ordered Skyline Processing based on inverted index,PSP_B),PSP_B包含两个阶段:第一阶段,能够通过映射将偏序域转化成全序域,并建立倒排索引;第二阶段,通过倒排索引提前找到扫描结束点,得到最终的skyline结果.再次,在PSP_B的基础上,进一步提出优化算法(Improved Partially-ordered Skyline Processing based on inverted index,PSP_I).PSP_I通过先分组再建索引的方法能够进一步提高计算效率.最后,用大量的实验证明本文所提算法的正确性和高效性.  相似文献   

8.
针对推荐系统利用多目标决策技术进行位置信息的查询与推荐时,由于查询者位置的移动和空间障碍物的位置变化导致传统多目标决策技术的查询效率较低的问题,提出了一种基于范围的障碍空间连续Skyline查询算法。首先,根据静态Skyline点的特征对由空间数据对象信息组成的初始数据集进行约减;然后,根据障碍空间中查询者的位置移动的特点构建距离相交模型,利用距离相交模型和数据对象的属性提出了剪枝策略,再根据剪枝策略过滤掉当查询者的位置移动时对查询结果无影响的数据对象,从而精减了冗余数据,得到过滤后的候选数据集;最后,根据数据对象的非空间属性和相互间的支配关系特征得出影响候选数据集的事件,利用影响候选数据集的事件再对候选数据集进行精炼计算,从而减少了冗余计算,查询出当前时刻的结果集。理论研究与实验结果表明:所提算法在查询者位置移动和空间障碍物位置变化时,能提升多目标决策技术的查询效率;相对传统对比算法,在数据集规模、障碍物数量、查询范围增大时,所提查询算法的平均效率提升约13%;针对多维度数据信息的查询,所提查询算法的平均效率提高了约11%。  相似文献   

9.
一种个性化的主题提取和层次发现算法   总被引:3,自引:0,他引:3  
从语义相关性角度分析超链归纳主题搜索(HITS) 算法,发现其产生主题漂移的原因在于页面被投影到错误的语义基上,因此提出了一种个性化的主题提取和层次发现算法(PTDHE),通过个人查询日志扩展查询词,构造符合用户需要的个性化根集和基础集合,达到防止主题漂移的目的.PTDHE采用基于最小最大原则的图划分方法,层次地发现与用户查询相关的主题页面集合,利用HITS算法分别计算每个主题页面集合中页面的权威值,返回与查询相关的其他主题权威页面.在14个查询上的实验结果表明,与HITS算法相比,PTDHE算法不仅可以减少2%~66%的主题漂移率,而且可以发现与查询相关的多个主题.  相似文献   

10.
集合包含查询分为子集、等值和超集3种查询,在多个领域有重要的研究意义和应用价值.随着集合数据集规模的不断增大,迫切需要提高集合包含查询的效率.集合包含查询并行化是解决这一问题的一条途径,基于OpenMP提出并行子集、等值和超集查询算法,这些算法采用反向索引结构,通过for循环并行化实现查询间的并行执行.为提高算法效率,设计2个高效的并行共享数据结构:1PVEC结构:用于存储并行查询结果.2CountArr数组:针对超集查询,用于对反向列表中的元素计数,并行线程可异步地对这两个结构进行访问.在MSWEB和DBLP 2个数据集上进行扩展实验,结果表明,实现的3种并行集合包含查询具有较高的效率,对3种查询在MSWEB数据集上均可达到4X以上的加速比.  相似文献   

11.
针对阈值轮廓查询忽略了轮廓的整体性,只考虑单个对象成为轮廓中对象的现象,深入地研究了不确定数据库中的轮廓查询处理技术.首先,提出了将对象集合作为整体考虑其轮廓概率的不确定轮廓查询的定义;其次,通过对其性质的分析,提出了基于状态空间搜索的基本的不确定轮廓算法(BUS);接着,通过进一步分析,在BUS算法的基础上,增加了有效的过滤策略,提出了改进的不确定轮廓算法(IUS).实验结果表明,加入了改进策略的IUS算法明显优于BUS算法,验证了改进策略的有效性.  相似文献   

12.
聚合查询(GNN)在网络环境中是一个相对比较新的操作.与传统的只有一个查询结点的任意性,使得GNN查询比只有一个查询点的kNN查询复杂得多.文章提出了一种基于2个查询点的差值聚合查询,基于单查询点的YPK-CNN,利用双曲线性质把查询空间分成几大部分,在此基础上计算出双曲线的渐近线以简化删减条件,直接删减掉不符合条件的搜索空间.实验结果显示,针对这种特定的差值聚合查询,我们所提出的基于双曲线渐近线过滤策略的查询算法要比基本查询算法在查询响应时间和访问结点次数方面更高效.  相似文献   

13.
针对度量空间中的无索引空间数据库,提出一种基于最优点的集合最近邻查找算法及其改进算法.采用真实数据集与人工生成的数据集对算法进行测试,评估所提出算法的效率.实验结果表明,所提算法的效率优于组最近邻居查询算法,并且对于高维数据空间,所提出的算法有较高的稳定性.由于查询区域中数据点的数量比较少,改进的基于最优点的集合最近邻...  相似文献   

14.
多查询优化的主要目的就是为了消除多个查询间存在的冗余.基于扩展查询头部变量算法,提出一种多查询优化算法.其主要思想是:通过构造一棵查询集合的伪包含树,建立查询间的联系.然后通过解析这棵树,来构造全局优化的查询计划.  相似文献   

15.
蚂蚁的自我聚集的行为可以形成蚂蚁聚簇,根据此行为提出一种基于蚂蚁树的文本文件的聚簇算法.算法中将对象属性作为为关键词,提取文本文件关键词组成一个关键词集合,一个集合代表一个对象(蚂蚁).算法将计算关键词的相对频率和对象之间的相似度,然后比较对象相似度阈值和相异度阈值,最终完成文本文件对象的聚簇.  相似文献   

16.
基于Skyline和局部选择的启发式服务组合方法   总被引:1,自引:0,他引:1  
为了改善现有基于QoS的Web服务组合方法的效率,在已有服务组合算法的基础上提出了一种新颖的基于Skyline点和局部选择的启发式服务组合方法SLOMIP(Skyline local optimi-zation mixed integer programming).该方法首先从候选服务集合中选出Skyline服务,可以证明如果存在最优服务组合方案,则其一定是由Skyline服务集中的服务组成的.然后,为了进一步缩小解空间,再从Skyline服务集中选取最优的K个服务进行最终服务组合方案的优化求解.与传统启发式服务组合方法的不同之处在于,该方法一旦获得解,必然是最优解而不是次优解.实验结果表明:在固定任务总数和固定候选服务个数的情况下,该方法的效率都远高于传统方法;K值越大,该方法的准确率越高.该方法可较大幅度地提高服务组合的效率,提升用户体验.  相似文献   

17.
连续K最近邻(CKNN)查询是最近邻查询的扩展,可广泛地应用于地理信息系统、城市规划、智能交通等领域.CKNN查询搜索某一路径上所有点的K个最近的感兴趣对象.本文研究基于交通路网的连续K最近邻查询问题,不同于传统的基于欧式空间的CKNN查询,基于路网的CKNN查询中对象间的距离度量不再是欧式距离,而是基于路网的最短可达距离.显然,传统的基于欧式距离的CKNN查询算法并不能直接应用于基于路网的CKNN查询问题.本文提出了一种基于路网的高效的CKNN查询算法-IIE算法,广泛实验表明本文提出的IIE算法优于传统的IE算法.  相似文献   

18.
提出了一种基于无线传感器网络数据流聚集的预处理算法。传感器结点将其在一段时间内采集到的信息当作一个数据流,由此组成数据流上的查询集合,为了得到对于给定查询的结果,结点采用预处理的算法在查询集合中选择出最有效的时间段信息,并把该段时间内的数据发给路由上其他结点进行进一步处理。提高了网络结点感知效率和数据精确度。  相似文献   

19.
距离查询是图数据挖掘应用中的最基本的操作之一,但是目前的现存查询算法均无法高效处理大规模图数据.针对这个问题,提出建立多级社区中心的标签机制,即首先在原图中将结点按社区划分为多个集合,然后再将各集合中的中心结点建成带权查询子图,经过多次递归操作,最终为各结点建立一个基于社区中心的树状结构标签集,该标签集可以实现利用较短的创建时间和较小的存储代价大幅度提高距离查询的效率.从实验结果可以看出,该方法综合效率明显优于现存的高效算法.  相似文献   

20.
提出了一种基于节点剪枝的Top-k査询算法.定义集合支配区域与剪枝规则,根据用户查询位置的变动,按照给定的剪切规则,对传感器网络节点进行剪枝处理,将符合规则的节点预先筛除,运用统计学抽样理论,设计了空间关键字近似Top-k查询算法.在2个真实数据集上进行验证.实验结果表明,该算法能够满足传感器网络环境中用户的需求,并且相比于边界距离增量算法(IBD)与基于改进的MW-Voronoi区域的空间关键字查询算法(MSK-uvr),其网络通信开销较低.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号