首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
对XML数据建立有效的索引,是左右XML数据处理性能的重要因素。对XML的索引技术进行研究,提出一种基于Schema的XML数据结构索引,结合Schema的数据字典提出了OB(Orthogonal B tree)树的存储方式,可快速确立元素间关系。与XISS相比明显减少元素访问及路径连接次数,从而缩短路径查询的响应时间。  相似文献   

2.
提出了一种基于元素编号的系统XISS进行索引和存储XML数据,编号方式能迅速地确定XML数据层次结构中元素间的祖先-子孙关系;同时在XISS中采用了一种处理有规则路径表达式的算法:EE-Join(元素-元素加入算法),EE-Join算法对于查询那些长路径或者长度不确定的路径特别有效.  相似文献   

3.
面向对象XML数据索引技术   总被引:2,自引:2,他引:0  
提出了一种面向对象XML数据的索引模式路径仓,路径仓是紧凑地、准确地表示面向对象的XML数据的一棵树,是两级双向树:组级和元素级.在组级上,路径仓提供路径信息、类层次信息,类层次信息存储以索引类为根的类层次子树上特有的元素和属性的对象标识符,而继承的元素和属性的对象标识符存在较高的层次中,可以在查询早期阶段减少大量存储空间;在元素级,它保存从孩子元素到父亲元素的信息,快速存取元素的父亲,提高查询处理效率.不使用全局标志符而是用基于组的引用,可以按组区分不同类型的元素值聚簇相同类型元素值并且索引它们.  相似文献   

4.
根据GML数据查询的需要,在分析XML文档编码和空间索引技术的基础上,提出一种基于扩展的元素区间编码的GML索引方法.首先通过扩展的区间编码方法对GML文档中的元素、属性、文本、几何体等要素进行编码;其次依据元素编码算法并将非空间节点、空间节点、元素节点从GML文档树中分离,产生元素编码序列;在此基础上根据节点类型的不同对属性和文本节点建立B+树索引以实现值查询,对几何体节点建立R树索引以实现空间数据的分析操作,并在查询处理时通过查询优化算法避免不必要的节点的遍历,进一步提高查询效率.实验结果表明,基于元素区间编码的GML数据索引方法是可行的、高效的.  相似文献   

5.
XML Schema作为一种描述XML文档模式信息即结构信息的标准,对于XML索引的建立及查询效率的提高有着重要的作用。现在大部分XML索引结构着重研究XML文档的结构查询。本文在比较研究了现有的区间编码方式和XML索引技术的基础上,提出了一种基于Schema的XML索引技术SBXI(Schema-Based XML Indexing)。SBXI充分利用了XML Schema建立XML索引从而提高路径查询的效率,并进一步展望未来的研究方向。  相似文献   

6.
在XML文档中,相当大的部分是由文本数据组成的,针对XML文本数据占用空间较大、对压缩文本数据有效搜索效率较低的难点,基于BWC提出了压缩XML文本数据索引的技术,通过构造全文本数据模型,并利用整体压缩自索引存储XML文档的文本数据,实验结果表明,该技术不仅有效支持XPath查询语言文本搜索,而且内存消耗相对较小,实现了中小规模数据的内存搜索.  相似文献   

7.
一种基于XML前缀编码的路径查询   总被引:1,自引:0,他引:1  
为了解决XML文档树子结点过多时前缀编码长度增加的问题,提出一种改进的XML前缀编码——IPE编码.基于IPE编码,结合倒排索引表,给出XPath路径查询算法,可以有效地提高XML文档的查询速度.  相似文献   

8.
SQL Server 2005查询XML数据优化研究   总被引:2,自引:0,他引:2  
SQL Server 2005关系数据库管理系统提供了强大的管理XML数据的功能,但它采用传统的通过建立索引等方式进行查询效果并不理想.分析了SQL Server 2005在查询XML数据过程中低效的原因,提出了通过建立附加表或者附加列以及相应索引、利用查询窗口等措施来优化查询.实验结果表明,该方法能有效提高查询XML数据的效率.  相似文献   

9.
随着XML相关标准和技术的不断推广和应用,网络上出现了大量的XML数据,XML已成为网络数据表示和交换的标准.在海量XML文档中进行精确快速地查询成为当前XML研究的主要方向.由于XML文档自身的半结构化特性,对存储在其中的数据进行查询就需要建立相应的索引并制定特殊的查询算法.对基于文本节点的XML索引进行改进,在原索...  相似文献   

10.
时态XML数据操作的基本途径是相应时态索引模式,而时间信息与结构信息的整合协同是涉及索引效率的关键技术.该文研究了一种基于时态拟序和时态编码协调的时态XML快照索引Txmlsindex,实现了“一次一集合”的时态数据查询和基于Tcodes编码的结构信息重置;比较评估Txmlsindex的可行性与有效性;提出的技术框架和索引模式还可拓展到时态XML的一般查询过程当中.  相似文献   

11.
A new way of indexing and processing twig patterns in an XML documents is proposed in this paper. Every path in XML document can be transformed into a sequence of labels by Structure-Encoded that constructs a one-to-one correspondence between XML tree and sequence. Base on identifying characteristics of nodes in XML tree, the elements are classified and clustered. During query proceeding, the twig pattern is also transformed into its Structure-Encoded. By performing subsequence matching on the set of sequences in XML documents, all the occurrences of path in the XML documents are refined. Using the index, the numbers of elements retrieved are minimized. The search results with pertinent format provide more structure information without any false dismissals or false alarms. The index also supports keyword search Experiment results indicate the index has significantly efficiency with high precision.  相似文献   

12.
基于B 树,并借鉴XB树的特点设计一种XM L文档的索引方法.索引关键字分为元素关键值和XM L编码的范围.利用元素编码的范围查询,不必在整XM L文档中搜索,提高了查询效率.对于复杂分支查询,提出了拆分成简单查询路径的规则.在结构化连接问题上,提出了不仅要进行祖孙(父子)关系的连接,还要进行兄弟关系的判断,以得到正确的匹配结果.  相似文献   

13.
针对XML解析器在解析大体积XML文件时速度慢的缺点,提出了一种加快其解析速度的新方法,该方法通过对XML文件中关键元素的存储地址编索引的方式实现了对所要解析内容的直接读取;同时给出了该方法的应用实例,并与别的解析方法进行了比较,结果表明该方法能显著提高解析速度。  相似文献   

14.
BTCS:基于二叉遍历的XML文档编码模式   总被引:5,自引:0,他引:5  
XML文档数据的编码模式与索引技术决定了基于纯XML数据库的XML查询效率,在正则路径表达式实现方面有重要意义.基于树遍历的XML文档编码在更新与结构关系判断方面存在不足.为了解决此类问题,作者作了如下工作:(1)提出一种新的基于二叉树遍历的XML文档编码模式BTCS(Binary Traveling Coding Scheme);(2)实现了BTCS编码算法,支持XML文档更新,提高了编码更新效率;(3)在常数复杂度的时间内快速准确判断XML文档结构树中任意两个结点之间的父子以及祖孙关系,并能计算它们的辈数差(Distance of Genera-tions);(4)通过详细实验证明了BTCS编码模式的良好性能.  相似文献   

15.
索引结构是影响查询性能的一个重要因素,目前出现的索引结构主要存在以下几个问题:1)不能有效支持带有谓词约束条件的分支查询;2)只能在小文档上进行测试或者建立的索引文件比较大.为了解决这些问题,提出了一种基于DTD结构的不完全值索引方法——DBPVI(DTD-based Partly-Value XML Indexing).实验证明,该索引方法能在不影响查询性能的前提下,很好地解决上述问题.  相似文献   

16.
丁峰  沈钧毅  赵天海 《西安交通大学学报》2002,36(10):1066-1069,1074
为了将关系数据以扩展置标语言(XML)数据的形式发布,分别提出了将关系模式映射为文件类型定义(DTD)和扩展置标语言方案(XMLSchema)的两种规则;非空表元素规则和空表元素规则,前者将关系模式中的表,记录和字段分别映射为表元素,表元素中的记录元素和记录元素中的字段子元素,后者将表映射为表元素,记录映射为表元素算法,前者借助一个链队列和两个栈分别存放解析得到的各级元素的开始,结束标记和属性,后者借助一个链队列存放解析得到的元素标记和属性,它们均可实现将关系数据写入XML文档,最后对实验结果进行了分析,得出在表数目相同,表中字段数也相同的情况下,表元素非空算法略优于空表元素算法的结论。  相似文献   

17.
提出一种基于DTD的不完全值索引结构DBPVI,并设计一个基于Dewey编码的有效结构连接算法。结合Timber关于非完全结构查询的最小公共祖先的有意义判断方法,提出一种基于DTD的非完全结构化查询处理算法。实验证明,该算法能够获得较高的查询效率,并保证非完全结构化查询的质量。  相似文献   

18.
针对XML查询语言进行了介绍及比较,研究了Xquery、Xpath和目标节点为导向的XML路径查询3种方法,前两种方法简单直接,但效率较低,而第三种方法通过减少结构连接的数目进而增加查询效率,但增加了复杂性.提出今后的研究重点应为集中查询方法的结合,也是今后的研究方向.  相似文献   

19.
XML的函数依赖   总被引:1,自引:0,他引:1  
为了表达引起数据冗余的XML函数依赖,研究了XML中存在的复杂的多种形式的函数依赖约束,提出了一种DTD的路径语言,对于导航和定位XML文档的内容具有较强的表达能力.提出了一套XML模式及文档的形式化描述方法,进而提出了一种XML函数依赖(XFD)的定义.与以前的XML函数依赖的定义进行比较,展示了XFD可以表达更多的XML上存在的函数依赖,可以概括以前的基于路径表达式定义的XML函数依赖的约束能力.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号