首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 821 毫秒
1.
对 XML 数据建立有效的索引,是左右 XML 数据处理性能的重要因素.对 XML 的索引技术进行研究,提出一种XML 数据结构索引,结合 Schema 的数据字典提出 OB(Orthogonal B tree)树的存储方武,可快速的确立元素间关系.与 XISS 相比明显减少元素访问及路径连接次数,从而缩短路径查询的响应时间.  相似文献   

2.
XML Schema作为一种描述XML文档模式信息即结构信息的标准,对于XML索引的建立及查询效率的提高有着重要的作用。现在大部分XML索引结构着重研究XML文档的结构查询。本文在比较研究了现有的区间编码方式和XML索引技术的基础上,提出了一种基于Schema的XML索引技术SBXI(Schema-Based XML Indexing)。SBXI充分利用了XML Schema建立XML索引从而提高路径查询的效率,并进一步展望未来的研究方向。  相似文献   

3.
分析XISS,DBXI,DDT等索引方法的优缺点,提出一种基于XML Schema的XML索引,以提高XML查询的效率.通过利用XML Schema结构信息对XML进行索引,支持对基于不同XMLSchema的多类XML文档的统一查询,同时兼顾对XML文档的有效性验证和对无效查询的判断.通过在编码时预留一定的编码空间,方...  相似文献   

4.
提出了一种基于元素编号的系统XISS进行索引和存储XML数据,编号方式能迅速地确定XML数据层次结构中元素间的祖先-子孙关系;同时在XISS中采用了一种处理有规则路径表达式的算法:EE-Join(元素-元素加入算法),EE-Join算法对于查询那些长路径或者长度不确定的路径特别有效.  相似文献   

5.
面向对象XML数据索引技术   总被引:2,自引:2,他引:0  
提出了一种面向对象XML数据的索引模式路径仓,路径仓是紧凑地、准确地表示面向对象的XML数据的一棵树,是两级双向树:组级和元素级.在组级上,路径仓提供路径信息、类层次信息,类层次信息存储以索引类为根的类层次子树上特有的元素和属性的对象标识符,而继承的元素和属性的对象标识符存在较高的层次中,可以在查询早期阶段减少大量存储空间;在元素级,它保存从孩子元素到父亲元素的信息,快速存取元素的父亲,提高查询处理效率.不使用全局标志符而是用基于组的引用,可以按组区分不同类型的元素值聚簇相同类型元素值并且索引它们.  相似文献   

6.
提出了一种基于 Schema 和微型数据块优化的XML方法(XTrim)。XTrim对 XML Schema 信息进行优化, 并提出了最小化结构信息方法, 即利用优化后的 XML Schema 信息对 XML 文档的结构进行压缩, 同时改进了分组存储策略来提高压缩率。此外, XTrim优化了微型数据块的存储, 进一步提高了压缩效果。实验数据表明, 与一些现有的方法相比,XTrim 取得了更好的压缩效果。  相似文献   

7.
为了管理模糊时空XML数据,将若干个模糊构造子引入到XML文档中,并对XML文档的Schema进行模糊时空扩展,同时,通过修改XML文档的Schema以容纳这些新引入的模糊构造子.由此形式化提出模糊时空XML数据模型,之后分别对模糊时空XML数据模型中OID部分、ATTR部分、FP部分、FM部分以及FT部分的Schema进行扩展,并举出具体实例加以说明.通过对Schema的扩展,使其兼容模糊时空信息,方便管理模糊时空XML数据,从而可以进一步表示、推理和查询模糊时空XML数据.  相似文献   

8.
针对大量Internet应用程序需要将关系数据高效准确的转换发布为XML数据的问题,提出了从关系数据库模式到XML Schema的转换规则.本文通过分析目标数据库的关系模式和关联约束,归纳其在XML Schema中的等价形式,将目标数据库的结构和语义约束完整的保留到XML Schema中,并使转换后的XML Schema达到高度的嵌套.  相似文献   

9.
基于XML Schema的模糊数据建模方法   总被引:1,自引:0,他引:1  
为了满足现实Web应用中对不精确和不确定信息处理的需要,提出了一种基于XML Schema的模糊XML数据模型.利用该模糊XML数据模型,模糊信息在XML文档中能以自然的方式进行表示.在模糊集和可能性分布理论的基础上,分析了XML文档中模糊数据的多重粒度,给出了不同类型模糊数据的XML Schema表示方法.为模糊数据的Web发布与共享,以及实现基于Web的智能信息处理奠定了坚实的基础.  相似文献   

10.
基于数据元的交换数据标准维护   总被引:4,自引:0,他引:4  
针对直接通过XML(extensible Makeup Language)Schema维护交换数据标准有不易维护、对已有数据的利用率低等自身的缺点,在分析数据元概念的基础上,提出了用数据元自底向上维护数据标准的方法;结合数据元在专利电子申请中的具体应用,设计了数据元的元数据属性;给出一套对数据元进行描述和维护以及基于其上信息抽取的方法;定义了数据元到XML Schema的映射规则;设计了XML Schema辅助生成的算法.结果表明:与传统的对数据交换标准进行构建和维护的方法相比,直接方法对已有数据的利用率提高了60%,减少数据冗余,方便数据标准的创建和更新,减少了维护成本.  相似文献   

11.
传统异种数据交换强调借助某一通用XML Schema作为过渡实现不同格式数据之间的交换,尽管理论上可行,但该通用XML Schema并没有被制定出来,所以异种数据交换一直没能实现.基于对传统方式的理论研究,分析XML与.NET技术相结合在异种数据交换的优势,最终将结合实例详细描述一种完全可以不借助通用XML Schema实现数据交换的模型.  相似文献   

12.
基于XML /Schema 甲骨文语料库语料标注的研究   总被引:3,自引:1,他引:2  
对语料库进行语料标注是实现原始语料信息计算机可读的关键.采用XML+XML Schema对甲骨文语料库进行结构化标注,使不同类型的数据表示成统一的格式,方便数据的交换与共享.给出了一种依据XML文档中使用的词汇集,对词汇集进行建模来约束XML文档中使用的元素和属性及其之间的结构关系和数据类型.根据定义好的XMLSchema使用XML对甲骨文信息进行结构化标注,可以准确地描述数据的结构及数据类型.  相似文献   

13.
XML(Extensible Markup Language),即可扩展标记语言。为保证文档的有效性,任何应用程序在执行关于XML数据的计算和转换之前,必须对XML文档进行验证。在完成对待验证的XML文档的封闭性检测之后,对XML文档和其相对应的Schema文档的数据结构进行检测,判断一下它们的树结构是否完全同构。再利用DOM技术读取Schema文档树和XML文档树的各节点,判断XML文档树各节点是否符合与之相对应的Schema文档各节点所定义的规则。具体来说,包括:类型定义部件,组部件,属性组部件。该系统可以顺利地检测待验证的XML文档,基于Schema文档规则,在满足封闭性和同构性的前提下,可以判断并指出XML文档的错误信息,并对其进行定位。  相似文献   

14.
数据约束是数据库规范化理论的基础,不完全信息引入XML文档后,需要重新定义数据约束。基于XML Schema、符合XML Schema的不完全XML文档树、子树信息等价和子树信息相容等定义给出了XML弱多值依赖的定义和性质;为了研究数据依赖的逻辑蕴涵问题,给出了XML弱多值依赖的推理规则集,并对其正确性进行了证明。以上研究为不完全信息环境下存在XML弱多值依赖的XML文档的规范化研究奠定了基础。  相似文献   

15.
面向方面的XML   总被引:3,自引:0,他引:3  
针对面向方面这种新型的编程方法进行分析,并对面向对象理论在解决XML文档定义时不足之处加以阐述,提出利用面向方面的编程方法对XML文档定义进行扩展,解决XML文档定义仅采用简单包含关系、代码重复、横切关注点的分散及扩充XML元素时必须对原有元素修改的问题.在XML文档定义中引入关注点这一概念和织入重要机制,使XML文档定义具有面向方面编程技术的功能.在XML Schema原有定义方式中增加aspect,pointcut和advice几个定义元素的标识元素.给出相应的表示符号,并用数学模型描述.结果表明这种定义方式减少系统中的代码重复,降低模块间的耦合,使之具有较好的模块性和可移植性.  相似文献   

16.
根据GML数据查询的需要,在分析XML文档编码和空间索引技术的基础上,提出一种基于扩展的元素区间编码的GML索引方法.首先通过扩展的区间编码方法对GML文档中的元素、属性、文本、几何体等要素进行编码;其次依据元素编码算法并将非空间节点、空间节点、元素节点从GML文档树中分离,产生元素编码序列;在此基础上根据节点类型的不同对属性和文本节点建立B+树索引以实现值查询,对几何体节点建立R树索引以实现空间数据的分析操作,并在查询处理时通过查询优化算法避免不必要的节点的遍历,进一步提高查询效率.实验结果表明,基于元素区间编码的GML数据索引方法是可行的、高效的.  相似文献   

17.
XML Schema与XML DTD的技术比较与分析   总被引:1,自引:0,他引:1  
XML DTD是目前使用最广泛的一种XML模式,XML Schema则已经成为W3C的正式推荐标准,并有替代XML DTD的趋势.从技术角度,比较XML Schema与XML DTD的区别,探计了XML Schema的一些优势.  相似文献   

18.
在XML文档中,相当大的部分是由文本数据组成的,针对XML文本数据占用空间较大、对压缩文本数据有效搜索效率较低的难点,基于BWC提出了压缩XML文本数据索引的技术,通过构造全文本数据模型,并利用整体压缩自索引存储XML文档的文本数据,实验结果表明,该技术不仅有效支持XPath查询语言文本搜索,而且内存消耗相对较小,实现了中小规模数据的内存搜索.  相似文献   

19.
油气井工程领域中存在大量的XML文档,传统的XML集成方案无法提供面向语义的信息查询,导致数据利用率不高。针对油气井XML文档WeXML语义集成与查询应用需求,提出一种基于抽取规则和本体映射的语义集成方法。首先定义一系列类、属性抽取规则,分别将WeXML Schema中的元素、属性映射为WeOWL本体中的类和属性;然后,利用实例转换算法将WeXML文档转换为本体实例数据;由于WeOWL提供有限的局部语义模型,需要在两者之间建立语义映射,并借助WeOWL中的术语对全局语义模型中的类和属性进行解释,进而提供面向领域全局本体的语义查询。通过构建WeXML数据语义集成原型系统,对提出的转换规则、转换算法和映射规则进行了验证。  相似文献   

20.
基于XML的MARC信息描述研究   总被引:1,自引:0,他引:1  
针对传统的MARC数据,研究了基于XML DTD和XML Schema的MARC元数据描述技术,从而使得专用的MARC数据能被转换为普通的元数据,指出这对于MARC数据更好地发展具有重要的意义。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号