首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
在模糊XML数据管理中,模糊XML文档和模糊DTD的相似性是模糊XML数据整合、模糊XML文档聚类的关键步骤.为了研究模糊XML文档和模糊DTD的相似性,对模糊DTD树进行了规则变换,主要解决元素和属性的析取约束和基数约束问题,即由析取范式转化为合取范式,将元素或属性的重复次数确定化,然后利用树编辑距离算法对模糊XML文档树和转化后的模糊DTD树集合进行相似性对比.通过实验验证了所提方法的性能优势.  相似文献   

2.
XML(Extensible Markup Language),即可扩展标记语言。为保证文档的有效性,任何应用程序在执行关于XML数据的计算和转换之前,必须对XML文档进行验证。在完成对待验证的XML文档的封闭性检测之后,对XML文档和其相对应的Schema文档的数据结构进行检测,判断一下它们的树结构是否完全同构。再利用DOM技术读取Schema文档树和XML文档树的各节点,判断XML文档树各节点是否符合与之相对应的Schema文档各节点所定义的规则。具体来说,包括:类型定义部件,组部件,属性组部件。该系统可以顺利地检测待验证的XML文档,基于Schema文档规则,在满足封闭性和同构性的前提下,可以判断并指出XML文档的错误信息,并对其进行定位。  相似文献   

3.
XML作为交换资料的标准,广泛应用于分布式系统中,但是在使用XML DOM来处理大型XML文件时,会占用过多的存储器资源并需要更多的CPU时间.提出一种基于SAX模型的XML 文档更新算法,利用SAX模型占用时间和空间少的优点进行文档的更新.形式化地定义了XML文档的更新脚本,使用X-Path来表示所更新的文档节点,在XML文档的SAX扫描过程中,生成XML文档的节点的X-Path,从而判断文档节点是否需要更新,然后通过将更新脚本应用到需更新文档实现文档更新.  相似文献   

4.
基于SAX模型的XML文档更新算法研究   总被引:2,自引:0,他引:2  
XML作为交换资料的标准,广泛应用于分布式系统中,但是在使用XML DOM来处理大型XML文件时,会占用过多的存储器资源并需要更多的CPU时间。提出一种基于SAX模型的XML文档更新算法,利用SAX模型占用时间和空问少的优点进行文档的更新。形式化地定义了XML文档的更新脚本,使用X-Path来表示所更新的文档节点,在XML文档的SAX扫描过程中,生成XML文档的节点的X-Path,从而判断文档节点是否需要更新,然后通过将更新脚本应用到需更新文档实现文档更新。  相似文献   

5.
阐述了现有XML文档的版本管理机制所采用的关键技术,总结其存在的不足,然后设计了新的XML文档节点的编码方案并生成结构化连接所需要的四元组结构,在此基础上对一个经典结构连接算法进行了扩展,使之支持多版本XML文档的查询。  相似文献   

6.
XML作为信息交换的标准。广泛应用于Internet/Intranet计算环境中.根据SAX模型的特点,提出一种基于SAX模型的XML文档更新算法.使用X—Path表示文档结点,形式化定义XML文档的更新脚本;在XML文档的SAX扫描过程中生成结点的X—Path,然后判断结点是否需要更新,将更新脚本应用到文档上实现文档的更新.采用SAX模型,与DOM模型相比,实现对XML文档的动态更新,在时间和空间上取得比较好的效果.  相似文献   

7.
朱燕 《燕山大学学报》2006,30(6):530-533
XML的发展,引发了人们对于文档和形式语言之间关系的研究,树自动机理论重新引起了研究者们的高度重视。介绍了树自动机的概念、类型及处理方式,讨论了树自动机在XML中的应用,以XML文档有效性检验为例,实现了一个XML文档DTD树自动机,实验结果表明树自动机理论能够有效地处理XML文档。  相似文献   

8.
分析了XML安全的重要性,介绍了如何利用XML安全包实现XML文档的数字签名、文档规范化和元素级加密。  相似文献   

9.
数据约束是数据库规范化理论的基础,不完全信息引入XML文档后,需要重新定义数据约束。基于XML Schema、符合XML Schema的不完全XML文档树、子树信息等价和子树信息相容等定义给出了XML弱多值依赖的定义和性质;为了研究数据依赖的逻辑蕴涵问题,给出了XML弱多值依赖的推理规则集,并对其正确性进行了证明。以上研究为不完全信息环境下存在XML弱多值依赖的XML文档的规范化研究奠定了基础。  相似文献   

10.
讨论了XML语言及DOM文档解析技术,通过DOM文档解析技术可以灵活地操纵XML文档中的各个部分,使得应用程序能够真正实现独立与跨平台的目标。在VC平台下,通过DOM技术实现了对XML文档的读取、增加结点的操作。  相似文献   

11.
张静  林淑飞 《科学技术与工程》2007,7(9):2092-20942097
XML文件作为一种数据存储与数据交换的文件,其应用日益广泛,但目前对于信息量大、结构复杂的文档要获取其中有用信息的操作效率较低。现提出一种新的基于程序切片技术对XML文档进行切片的方法。对给定的XML文档,可根据给定的切片规则对文档进行切片,从而得到一个用户感兴趣信息集合的新XML文档。同样,也可以对给定的XML文档对应的DTD或XML模式文档进行切片,根据给定的切片规则生成新的DTD或XML模式文档切片,同时,也会生成对应的XML文档切片,且切片获得的新文档是符合新的DTD或XML模式规范的有效文档。  相似文献   

12.
Independent XML storage based on XSD (XML Schema Document) is adopted in NXD(Native XML Data base), XMI. storage structure based on tree-structure disassemble and the algorithm used in dynamically updating XML document are provided in this paper. The main idea is that in term of data model of XML document, XML document is parsed to Document Structure-Tree with Hierarchical Model and Leaf-Data with Relation Model for storage. Simultaneously Proxy node is imported in order to solve the problem that XML data store in cross-blocks. And with XSD model information, sparse index is constructed to save storage space. It is proved that this storage structure could improve efficiency of XML document operation.  相似文献   

13.
提出了一种XML文档与关系数据库数据转换中间件,通过把以XML文档形式存放的请求信息转化成相应的数据库能识别的请求信息,和把数据库返回数据转化成统一的XML文档格式的方式,实现了各种关系数据库访问的统一接口.在介绍了XML以及中间件技术基础上,着重对XML数据与关系数据库之间转换的方法进行研究,并具体讲解如何通过中间件技术来实现两者之间的数据转换工作.  相似文献   

14.
XML与数据库的映射技术研究   总被引:2,自引:0,他引:2  
XML作为实现数据库间数据交换的载体,如何使XML文档导入数据库以及如何使数据库中的数据转换为XML数据是关键问题所在.论述了XML文档与关系数据库间的映射规则算法、XML文档与面向数据库间的映射规则算法及基于XML异构数据库间的映射规则.  相似文献   

15.
在实际应用中,XML(eXtensible Markup Language)文档中的一些结构经常被改变。为了挖掘XML文档在历史变化过程中经常改变的结构所蕴含的知识,提出了发现频繁变化结构的方法。该方法用一组频繁变化结构组成的文档向量模型代表一个XML文档,将频繁变化结构在簇中的出现比例作为权值,使用加权余弦相似度对XML文档进行聚类。经过实验分析,根据XML文档历史变化过程中的频繁变化结构能较好地将XML文档进行聚类。用加权余弦相似度对XML文档进行聚类,其聚类结果的正确率、召回率和簇内部距离均优于使用非加权余弦相似度对XML文档进行聚类得到的结果。  相似文献   

16.
针对XML文档半结构化的特点及传统tf\|idf方法仅考虑关键字在文档中出现的频率, 而未考虑XML文档中节点的语义信息问题, 利用向量空间模型, 设计一种基于XML关键字查询结果的相关度排序策略. 相关度计算充分考虑XML文档中各节点对文档的区分程度、 节点描述文档的明确程度及节点描述文档的直接程度, 以提高节点权重度量的准确性, 从而将最相关的信息提供给用户, 经DBLP数据集实验验证了该方法的有效性.  相似文献   

17.
为了挖掘XML(Extensible Markup Language)文档在历史变化过程中不经常发生变化的结构所蕴含的知识,给出了发现冰冻结构的方法,使用一组冰冻结构组成的文档向量模型代表一个XML文档,并使用加权Jaccard系数作为相似度,利用基于XML文档历史变化过程中相对稳定的冰冻结构对XML文档进行聚类。经过实验证明,基于冰冻结构能够将XML进行有效的聚类,聚类后每簇中的XML文档具有相似的不经常变化结构。  相似文献   

18.
基于DOM的XML文档支持系统   总被引:11,自引:0,他引:11  
作为SGML的子集,元标记语言XML及其相关技术正得到越来越广泛的应用,文档对象模型是一种平台无关、语言无关的标准接口,是XML、HTML、文档互操作的基础,首先论述了XML的应用前景和应用现状,然后提出了基于DOM的XML文档支持系统,系统为用户提供一套组件,用来完成XML文档的生成、表现、文档转换等工作,系统同时提供DOM1.0所定义的对外功能接口以支持Web的互操作。  相似文献   

19.
面向方面的XML   总被引:3,自引:0,他引:3  
针对面向方面这种新型的编程方法进行分析,并对面向对象理论在解决XML文档定义时不足之处加以阐述,提出利用面向方面的编程方法对XML文档定义进行扩展,解决XML文档定义仅采用简单包含关系、代码重复、横切关注点的分散及扩充XML元素时必须对原有元素修改的问题.在XML文档定义中引入关注点这一概念和织入重要机制,使XML文档定义具有面向方面编程技术的功能.在XML Schema原有定义方式中增加aspect,pointcut和advice几个定义元素的标识元素.给出相应的表示符号,并用数学模型描述.结果表明这种定义方式减少系统中的代码重复,降低模块间的耦合,使之具有较好的模块性和可移植性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号