首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 187 毫秒
1.
针对大数据库中正则表达式查询,提出了一种基于索引的有效算法。首先,构造索引。该索引结构在前缀树基础上加以改进,为每个节点创建二维数组存放该节点所辖子树各层的首次关键节点,并对每个节点附加关键节点指针以指向同层的下一关键节点。然后,通过所提出的索引结构进行查询。最后,分析了所提出算法的时间和空间复杂度,并进行了实验。实验结果证明:随着数据集的增加,其查询时间和输入/输出(I/O)时间增长速度较缓慢,说明其可扩展性较好,适合于大数据库中正则表达式查询。并且,随着查询字串的增加,查询时间与I/O时间均呈递减趋势,证明了该算法的效率和有效性。  相似文献   

2.
随着移动社交网络的迅速发展,如何从海量带有时间属性和地理位置属性的短文本信息中快速查询到有效信息具有重要意义.社交网络环境下传统短文本查询算法忽略时间维度,并且在海量数据下无法满足用户快速响应的需求.针对以上问题,提出一种社交网络环境下并行短文本查询算法.提出的算法设计了基于MapReduce模型下的查询框架,该框架使用了基于滑动窗口下的多版本时空索引(MVSTR-tree),保证了查询过程中融合了时间和空间属性,实现了对海量数据高效查询的目标.最后,通过真实数据集的实验证明该算法能有效缩短查询时间.  相似文献   

3.
为了解决无线广播环境下空间关键字查询的问题,研究广播环境下空间关键字k近邻查询处理(BkSKQ),设计了一种结合kd树、倒排位图和(1,m)索引机制的空间关键字索引(ISKW)结构,以有效地组织对象的关键字信息、位置信息以及索引信息.该索引结构为客户的查询处理提供有效的指导,使得他们尽可能只下载查询处理所必须的数据信息.在ISKW索引结构的基础上,提出了BkSKQ查询处理算法.最后,通过模拟实验验证了提出的索引结构和算法的性能,实验结果表明所提出方法在访问时间和调谐时间上明显优于基于IR树的方法(BIRM).  相似文献   

4.
逆向Skyline查询能够应用到诸如决策支持、用户偏好支持以及市场行为分析等方面。由于参考对象q的存在,在执行逆向Skyline查询的过程中数据空间被划分成许多分区。然而,存在的算法都没有考虑这个问题的影响,直接使用原始数据集建立索引结构。本文提出了一种新的逆向Skyline查询方法CRSQ,它考虑了这个问题。CRSQ首先根据查询对象q对数据进行聚类,然后建立R-tree索引,最后利用高效修剪策略修剪索引搜索空间。实验结果表明CRSQ算法是有效的,它相对于没有聚类技术的算法获得了50%以上的性能提高。  相似文献   

5.
为提高空间移动对象数据更新效率和查询准确率,提出了一种空间移动对象并行索引结构.利用主索引和辅助索引支持对空间对象进行基于范围的查询和基于对象标识的查询,还通过查询索引将更新操作和可能受其影响的查询操作相连接,在满足并行操作时间片语义的同时,避免了传统方法进行范围查询时对查询范围内相关对象及相关索引结构全部进行锁定的需求.实验结果表明:高负载环境下,该索引结构不但能保证查询准确率,其处理能力也明显优于传统索引结构.该索引通过提高系统并行度,使同一范围内的更新和查询操作可以并行执行,提升了系统整体运行效率.  相似文献   

6.
提出了一种基于小波和动态时间弯曲(DTW)距离的时间序列索引和相似匹配方法. 该方法采用小波变换进行数据降维,利用R·-tree建立多维索引结构. 给出了查询序列的DTW距离边界和其在小波空间的查询超矩形的计算方法,从而将原始空间的基于DTW距离的相似匹配转换为小波空间基于欧氏距离的相似匹配. 证明了此匹配方法不会产生漏报,给出了基于DTW距离的范围查询算法和近邻查询算法. 实验结果表明该方法具有较高匹配精度和其较低的计算代价.  相似文献   

7.
随着信息技术和网络技术的发展,图作为一种通用的数据结构被用于不同学科建模各种实体以及实体之间的关系,,图中各实体间隐藏了很多有价值的信息,为了挖掘图中隐藏的这些信息,图的相关研究成为了各领域的研究热点,但在大多数图研究中最关键的问题是如何有效地进行图查询。在图数据库中存在着两种图数据集:单图和图集。针对单图或图集进行图查询是相当费时的,为了加快图查询速度,图索引成为各种图查询算法的研究重点,而图索引的焦点在于利用图索引的结构模式来最小化搜索空间的大小。本文将图查询归为两种:子图查询和超图查询。在每种查询中,依据图索引建立时选择的图结构特性进行了细分,主要集中于图索引的构建思想,并对典型的索引方法进行了详细的叙述。针对不同的图索引分析了各自的优缺点,并比较了各种索引方法的特点,最后,总结并探讨了图索引的发展趋势。  相似文献   

8.
针对度量空间中的无索引空间数据库,提出一种基于最优点的集合最近邻查找算法及其改进算法.采用真实数据集与人工生成的数据集对算法进行测试,评估所提出算法的效率.实验结果表明,所提算法的效率优于组最近邻居查询算法,并且对于高维数据空间,所提出的算法有较高的稳定性.由于查询区域中数据点的数量比较少,改进的基于最优点的集合最近邻...  相似文献   

9.
提出一种新的索引并行化技术,利用多处理机来提高建立在B树结构上的索引性能,并提出了一种改进的B树结构-FALNB树,基于该树结构,以大结点B树方式在多个处理机上分布索引数据,通过动态调整算法快速进行调整,取得很好的负载平衡效果,给出了时间分析模型,实验结果显示FALNB树能加快查询响应速度,对海量数据的索引有良好性能。  相似文献   

10.
研究基于线序划分(LOP)分布式时态索引技术DTindex.首先,建立DTindex所需数据结构和算法,并讨论分布式时态数据索引DTindex;其次,针对时间数据LOP结构提出基于查询期望的数据分布算,依据DTindex两层索引架构提出P2P部署以减少系统的通信开销.另外,完成仿真以表明索引可行性和有效性.  相似文献   

11.
提出了一种新的高维查询空间过滤策略,通过将高维数据动态投影到低维的数据空间中,然后在投影空间中对查询空间进一步过滤,精练并快速缩小查询空间.同时提出了一种有效的投影策略基于最大间隔投影,这种投影策略能够提高投影空间的精练能力.而且,设计了一种新的高维索引结构MS-tree,并将新的过滤策略运用于MS-tree的范围查询.实验结果表明,这种查询空间精练策略能够有效的提高索引的性能,降低相似性查询的IO代价和CPU代价.  相似文献   

12.
提出了一种高效的数据立方高效索引机制CuboidTree,利用Z-Order编码以保持同一数据小方内立方元组之间的多维空间邻近性,将数据立方查询归结构为针为其中某个特定数据小方的查询,从而将同一数据小方中的立方元组聚簇在一起以加速响应数据立方查询,对模拟数据和真实数据进行的实验表明,CuboidTree不仅可以明显地提高数据立方范围查询的性能,而且节省了存储空间,更重要的是它对数据立方查询性能的改进效果随着数据立方维数的增加而愈加明显。  相似文献   

13.
在分析分布式数据库查询目标和策略的基础上,提出了一种新的查询优化算法:基于二级索引的查询算法。该算法利用全局和局部二级索引对查询语句进行分析,进而确定最优查询路径。该算法可以有效地减少分布式数据库系统查询过程对带宽的消耗。  相似文献   

14.
基于B 树,并借鉴XB树的特点设计一种XM L文档的索引方法.索引关键字分为元素关键值和XM L编码的范围.利用元素编码的范围查询,不必在整XM L文档中搜索,提高了查询效率.对于复杂分支查询,提出了拆分成简单查询路径的规则.在结构化连接问题上,提出了不仅要进行祖孙(父子)关系的连接,还要进行兄弟关系的判断,以得到正确的匹配结果.  相似文献   

15.
利用局部分析法,提出一种基于词语之间同义关系的查询扩展方法.该方法利用原始查询术语实现初次查询,然后利用局部分析法得到查询术语在初次查询结果集中的同义词,并实现查询扩展.实验结果表明,该方法能有效提高检索性能.  相似文献   

16.
提出了一种新的图像存储检索模型 ,在原有的检索方法中加入了不完全分解与匹配功能 .根据不同检索目的决定检索方法 ,在检索的过程中利用计算结果改变(相关度等 )存储信息 .然后在这一模型下进一步计论了存储与处理合一等问题  相似文献   

17.
18.
从P2P系统自组织和动态性特点出发,提出分布式环境下隐语义索引(LSI)构建和更新的P2P网络模型,设计适合P2P系统文档矩阵的降维表示(RDR)合并算法,结合信号和噪声子空间模型从理论上分析RDR合并算法的有效性及算法需要满足的前提条件;使用M atlab6.5针对标准文集测试RDR合并算法对查询精度的影响.理论分析和数字实验证明,该算法能够解决P2P系统中分布式LSI的构建和更新问题,能在可容忍的查询精度影响范围内,以较低的网络开销和计算量分布式地构建、更新隐语义索引.  相似文献   

19.
In Chinese question answering system, because there is more semantic relation in questions than that in query words, the precision can be improved by expanding query while using natural language questions to retrieve documents. This paper proposes a new approach to query expansion based on semantics and statistics Firstly automatic relevance feedback method is used to generate a candidate expansion word set. Then the expanded query words are selected from the set based on the semantic similarity and seman- tic relevancy between the candidate words and the original words. Experiments show the new approach is effective for Web retrieval and out-performs the conventional expansion approaches.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号