首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 578 毫秒
1.
复杂数据类型验证是XML文档验证的主要内容,是检查XML文档结构是否符合模式规则的关键.根据Schema规范中复杂数据类型的描述和自动机理论,提出了一种称为模式自动机的数据结构,讨论了将XML复杂数据类型结构转换成模式自动机的方法,并设计了用来验证文档结构的算法.使用模式自动机验证算法可以全面地发现XML文档中的结构错误并准确地给出相应的错误信息,在实际应用中具有很高的效率.  相似文献   

2.
提出了一种面向异质可扩展标记语言(XML)文档的近似查询算法(TPQR).利用模式重写策略,通过对XML模式之间语义相似度及节点映射关系的求解,将原始查询树改写为多种XML模式下的重写查询树,从而解决了XML数据的多样性带来的查询语义缺失问题.将经变异操作序列得到的变异查询树精确地嵌入在XML数据树之中,即可将XML近似查询问题转变为多棵变异查询树的精确查询问题.在汽车外形智能化设计的实验中比较了TPQR算法和静态有序选择算法,结果表明,在查准率、查全率上,前者比后者分别提高了5%~10%和10%~30%.  相似文献   

3.
与传统数据库对XML数据的处理不同,对XML流数据的处理不仅受实时性的约束,还受存储空间的限制.在Hole-Filler模型的基础上,首先利用XML的查询统计信息,定义了路径频率树,提出了基于兄弟关系的XML流数据剪切分片策略及其算法.在此基础上,提出了基于父子关系的XML流数据剪切分片策略及算法.这两个基于路径频率树的剪切算法有效地提高了XML片段的利用率,增强了XML片段的内聚性.实验结果表明,基于路径频率树的XML剪切算法在剪切时间、查询时间、空间消耗等方面都表现出较好的性能.  相似文献   

4.
在模糊XML数据管理中,模糊XML文档和模糊DTD的相似性是模糊XML数据整合、模糊XML文档聚类的关键步骤.为了研究模糊XML文档和模糊DTD的相似性,对模糊DTD树进行了规则变换,主要解决元素和属性的析取约束和基数约束问题,即由析取范式转化为合取范式,将元素或属性的重复次数确定化,然后利用树编辑距离算法对模糊XML文档树和转化后的模糊DTD树集合进行相似性对比.通过实验验证了所提方法的性能优势.  相似文献   

5.
网络环境下XML数据库查询应用,目前国内外已存在多种优化技术,查询重写,语义缓存等,但在冗余去除方面却缺乏研究。在已有技术的基础上,从减少网络流量的角度改进原XPath查询集冗余去除方案,利用XPath树模式和DTD对查询集在不同XML文档结构下冗余度进行评估,并在算法中权衡网络流量和XPath查询复杂度,来满足用户需求。  相似文献   

6.
Independent XML storage based on XSD (XML Schema Document) is adopted in NXD(Native XML Data base), XMI. storage structure based on tree-structure disassemble and the algorithm used in dynamically updating XML document are provided in this paper. The main idea is that in term of data model of XML document, XML document is parsed to Document Structure-Tree with Hierarchical Model and Leaf-Data with Relation Model for storage. Simultaneously Proxy node is imported in order to solve the problem that XML data store in cross-blocks. And with XSD model information, sparse index is constructed to save storage space. It is proved that this storage structure could improve efficiency of XML document operation.  相似文献   

7.
基于Hole-Filler模型的XML流数据剪切分片技术   总被引:2,自引:0,他引:2  
对基于Hole-Filler模型的XML流数据剪切分片问题,首先利用XML文档的Document Object Model(DOM)结构,根据节点扇出度提出了基于DOM的XML流数据剪切分片策略及其算法.然后,在此基础上,对标签结构进行剪切以确定文档的剪切点,提出了基于标签的XML流数据剪切分片算法,有效地减少了节点扇出度与阈值的比较次数.最后,提出了优化的剪切策略,根据阈值与节点扇出度的比值对XML子树加以整合,以减少碎片的产生.实验结果表明,XML剪切算法在剪切时间、分片粒度等方面都有较好的性能.  相似文献   

8.
BTCS:基于二叉遍历的XML文档编码模式   总被引:5,自引:0,他引:5  
XML文档数据的编码模式与索引技术决定了基于纯XML数据库的XML查询效率,在正则路径表达式实现方面有重要意义.基于树遍历的XML文档编码在更新与结构关系判断方面存在不足.为了解决此类问题,作者作了如下工作:(1)提出一种新的基于二叉树遍历的XML文档编码模式BTCS(Binary Traveling Coding Scheme);(2)实现了BTCS编码算法,支持XML文档更新,提高了编码更新效率;(3)在常数复杂度的时间内快速准确判断XML文档结构树中任意两个结点之间的父子以及祖孙关系,并能计算它们的辈数差(Distance of Genera-tions);(4)通过详细实验证明了BTCS编码模式的良好性能.  相似文献   

9.
XML与数据库的映射技术研究   总被引:2,自引:0,他引:2  
XML作为实现数据库间数据交换的载体,如何使XML文档导入数据库以及如何使数据库中的数据转换为XML数据是关键问题所在.论述了XML文档与关系数据库间的映射规则算法、XML文档与面向数据库间的映射规则算法及基于XML异构数据库间的映射规则.  相似文献   

10.
XML文档集的结构连接算法研究   总被引:1,自引:0,他引:1  
针对XML文档集进行结构连接时,因数据量大且需要进行文档之间的比较而产生了定位复杂的问题,提出了一种利用栈实现基于缓存的结构连接算法。实验结果表明,该方法有效实现了XML文档集的结构连接计算。  相似文献   

11.
研究了可扩展的标志性语言(XM L)存取控制策略。通过基于不确定的自动机(NFA)的XM L查询重写技术,实现了支持精细粒度的XM L文档存取控制策略。通过构造XM L文档存取控制策略的NFA以及基于NFA的查询语句重写技术,有效地实现了独立于视图的、高效的XM L精细粒度的存取控制。  相似文献   

12.
基于DOM的XML文档支持系统   总被引:11,自引:0,他引:11  
作为SGML的子集,元标记语言XML及其相关技术正得到越来越广泛的应用,文档对象模型是一种平台无关、语言无关的标准接口,是XML、HTML、文档互操作的基础,首先论述了XML的应用前景和应用现状,然后提出了基于DOM的XML文档支持系统,系统为用户提供一套组件,用来完成XML文档的生成、表现、文档转换等工作,系统同时提供DOM1.0所定义的对外功能接口以支持Web的互操作。  相似文献   

13.
XML安全视图是实现访问控制的关键技术.本文研究了递归DTD,提出了一种避免XML递归安全视图产生的算法,并对算法进行了分析,解决了当DTD中存在环路时所带来的递归安全视图的问题,提高了查询重写的效率.  相似文献   

14.
基于Huffman编码的XML数据压缩方法   总被引:1,自引:0,他引:1  
针对一定网络带宽下生产过程报表系统对大型数据源访问速率不高的问题,提出了一种基于Huffman编码的XML数据压缩方法。通过构造数据处理类获取XML文档中重复率高的节点单元,采用Huffman编码对节点单元进行编码,将编码后文档利用LZMA算法压缩,构建了Huffman-LZMA压缩算法,并将该压缩算法应用于生产过程报表系统设计。实际应用结果表明,该压缩算法对生产过程报表数据源的压缩率达到约88%,有效的节省了网络带宽和存储空间,提高了报表系统的访问速率。  相似文献   

15.
基于本体的多源异构XML数据近似查询方法   总被引:2,自引:0,他引:2  
提出了一种基于本体的面向多源异构可扩展置标语言(XML)的近似查询方法.该方法将传统的基于查询模式树松弛的近似查询策略与基于本体的XML数据集成思想相融合,首先建立文档类型定义结构与全局模式的映射模型(PTO),再将PTO与近似查询领域的松弛操作、打分机制相结合,提出了一种新的XML近似查询算法——OAXQ.这样,用户在全局模式下的查询语言不再是Xpath查询表达式,而是对象查询语言的一个简单子集,松弛的产生不再依靠查询模式树的变换,而是通过一系列映射规则转化而成.汽车外型的智能设计实验表明,OAXQ算法的查询速度比单纯基于查询模式树松弛策略的静态有序选择算法平均提高了20倍,查询准确度提高了2%~24%.  相似文献   

16.
XML作为信息交换的标准。广泛应用于Internet/Intranet计算环境中.根据SAX模型的特点,提出一种基于SAX模型的XML文档更新算法.使用X—Path表示文档结点,形式化定义XML文档的更新脚本;在XML文档的SAX扫描过程中生成结点的X—Path,然后判断结点是否需要更新,将更新脚本应用到文档上实现文档的更新.采用SAX模型,与DOM模型相比,实现对XML文档的动态更新,在时间和空间上取得比较好的效果.  相似文献   

17.
为了解决目前存在大量XML文档无模式定义的问题,提出一种XML文档模式的自动构造算法.该算法以XML数据为输入,输出具有通用意义的文档模式,再根据具体要求转化到所要求的文档定义类型.实验证明,该模式构造算法确实可行,且具有较好的通用性,可应用于模式的自动生成、XML数据模式挖掘等方面.  相似文献   

18.
朱燕 《燕山大学学报》2006,30(6):530-533
XML的发展,引发了人们对于文档和形式语言之间关系的研究,树自动机理论重新引起了研究者们的高度重视。介绍了树自动机的概念、类型及处理方式,讨论了树自动机在XML中的应用,以XML文档有效性检验为例,实现了一个XML文档DTD树自动机,实验结果表明树自动机理论能够有效地处理XML文档。  相似文献   

19.
文章根据XML加密规范,对XML加密采用自定义密码算法的实现方式进行了研究。指出XML加密采用自定义密码算法时,应用系统需对所采用的密码算法进行自定义并调整XML加密文档结构,详细设计了自定义密码算法的XML加密的实现过程和相应文档结构的调整方式,对其中的关键技术做了阐述。作为XML加密采用自定义或新定义密码算法的一般实现方式,有助于XML加密的扩展应用和广泛使用。  相似文献   

20.
XML文件可以利用树状结构来表示,于是把如何将XML文件做聚类看成如何对树状结构的数据作聚类.使用SOM聚类工具搭配上Jaccard 的距离测量公式来对XML 文件做聚类,然后在每个cluster 中利用GST(Graph Search Technique)算法从这些XML文件当中找出他们的最大序列,最后将这些最大序列融合起来成为共同的结构.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号