共查询到19条相似文献,搜索用时 171 毫秒
1.
XML的发展,引发了人们对于文档和形式语言之间关系的研究,树自动机理论重新引起了研究者们的高度重视。介绍了树自动机的概念、类型及处理方式,讨论了树自动机在XML中的应用,以XML文档有效性检验为例,实现了一个XML文档DTD树自动机,实验结果表明树自动机理论能够有效地处理XML文档。 相似文献
2.
数据约束是数据库规范化理论的基础,不完全信息引入XML文档后,需要重新定义数据约束。基于XML Schema、符合XML Schema的不完全XML文档树、子树信息等价和子树信息相容等定义给出了XML弱多值依赖的定义和性质;为了研究数据依赖的逻辑蕴涵问题,给出了XML弱多值依赖的推理规则集,并对其正确性进行了证明。以上研究为不完全信息环境下存在XML弱多值依赖的XML文档的规范化研究奠定了基础。 相似文献
3.
4.
传统数据库只管理确定性信息.但在许多应用中涉及大量不确定数据。本文把概率数据引入XML文档中.提出概率XML文档树、概率XML模式树、概率XML文档树符合概率XML模式树的定义;给出了概率XML Twig查询树和概率XML Twig查询匹配的定义,最后提出了计算概率XML Twig查询结果概率的定理。 相似文献
5.
由于DTD的复杂性,使得XFD的逻辑蕴涵问题研究比较困难.为了解决该问题,本文在M.Arenas等人给定的XFD定义基础上,提出了一种DTD路径编码方法,对它的性质进行了分析.编码后的DTD消除了部分XML平凡函数依赖,并能在线性时间内对XML函数依赖的逻辑蕴涵问题进行判定.提出了一个将XFD中的编码路径重新映射到DTD路径的算法,证明了它的正确性. 相似文献
6.
在模糊XML数据管理中,模糊XML文档和模糊DTD的相似性是模糊XML数据整合、模糊XML文档聚类的关键步骤.为了研究模糊XML文档和模糊DTD的相似性,对模糊DTD树进行了规则变换,主要解决元素和属性的析取约束和基数约束问题,即由析取范式转化为合取范式,将元素或属性的重复次数确定化,然后利用树编辑距离算法对模糊XML文档树和转化后的模糊DTD树集合进行相似性对比.通过实验验证了所提方法的性能优势. 相似文献
7.
网络环境下XML数据库查询应用,目前国内外已存在多种优化技术,查询重写,语义缓存等,但在冗余去除方面却缺乏研究。在已有技术的基础上,从减少网络流量的角度改进原XPath查询集冗余去除方案,利用XPath树模式和DTD对查询集在不同XML文档结构下冗余度进行评估,并在算法中权衡网络流量和XPath查询复杂度,来满足用户需求。 相似文献
8.
从XML键导出了既保持语义约束又符合DTD结构约束的XML函数依赖,并基于DTD的规范化技术及XML的查询转换技术提出了保持语义的XML文档规范化方法,并对其应用实例作了详细的分析. 相似文献
9.
XML与数据库的通信问题是XML研究领域中的一个重要问题。在总结多种映射方法的基础上,提出了一种方法将多个相似的XML文档进行解析。根据映射关系,生成统一模式,并分析归纳出一个集成的模式,然后创建一个数据库,提取并存储XML文档数据到数据库。它主要解决了XML文档与数据库通信问题,并通过实例论述了实现步骤及相关的关键技术,其最大的特点就是不用考虑文档的模式信息(DTD,XML Schema)。 相似文献
10.
近年来.人们已经提出了XML函数依赖多种定义方法.本文给出了基于树元组的XML函数依赖和基于路径的XML函数依赖的两种定义方法.一般说来,这两种方法是不可比较的,但是在DTD存在、XML文档没有信息缺失的情况下,这两种方法是可比较的, 并且是一致的. 相似文献
11.
针对XML模式设计中的规范化问题,总结出一套较系统的规范化理论,包括函数依赖、4种XML范式和2种XML规范化规则,并通过具体的实例,说明了这些XML规范化规则的应用.以此帮助解决XML实例文档出现的数据冗余和不一致问题. 相似文献
12.
13.
基于DTD的XML与数据库信息交换技术 总被引:1,自引:0,他引:1
XML与数据库信息交换的策略有多种,基于DTD的对象模型映射方法可应用于所有XML文档.映射的策略是以分析处理DTD中的每一个元素映射为对象模型,再由对象模型映射为数据库的关系模型.XML文档中的数据映射到对象所对应的关系数据库中.映射过程也可合并为直接有DTD到关系数据库的映射. 相似文献
14.
复杂数据类型验证是XML文档验证的主要内容,是检查XML文档结构是否符合模式规则的关键.根据Schema规范中复杂数据类型的描述和自动机理论,提出了一种称为模式自动机的数据结构,讨论了将XML复杂数据类型结构转换成模式自动机的方法,并设计了用来验证文档结构的算法.使用模式自动机验证算法可以全面地发现XML文档中的结构错误并准确地给出相应的错误信息,在实际应用中具有很高的效率. 相似文献
15.
分析XISS,DBXI,DDT等索引方法的优缺点,提出一种基于XML Schema的XML索引,以提高XML查询的效率.通过利用XML Schema结构信息对XML进行索引,支持对基于不同XMLSchema的多类XML文档的统一查询,同时兼顾对XML文档的有效性验证和对无效查询的判断.通过在编码时预留一定的编码空间,方... 相似文献
16.
17.
This paper presents an effective keyword search method for data-centric extensive markup language (XML) documents.The method divides an XML document into compact connected integral subtrees,called self-integral trees (Si-Trees),to capture the structural information in the XML document.The Si-Trees are generated based on a schema guide.Meaningful self-integral trees (MSI-Trees) are identified,which contain all or some of the input keywords for the keyword search in the XML documents.Indexing is used to accelerate the retrieval of MSI-Trees related to the input keywords.The MSI-Trees are ranked to identify the top-k results with the highest ranks.Extensive tests demonstrate that this method costs 10-100 ms to answer a keyword query,and outperforms existing approaches by 1-2 orders of magnitude. 相似文献
18.
邱长春 《武汉科技学院学报》2006,19(11):68-72
键是关系数据库和XML文档中重要的语义表达,是XML模式设计的基础。文章在XML树的定义和路径语言的概念的基础上,提出XML键的定义,给出XML键的一组完备推理规则集,最后提出了求解键集合最小覆盖的一般指导原则。 相似文献
19.
提出了一种基于八邻域网格聚类的多样性XML近似查询算法.首先给出了支持XML文档间语义距离计算的3种编辑操作代价模型,再利用XML文档间的语义距离建立XML文档的向量模型并设计基于八邻域网格的XML文档聚类算法,进而利用聚类过程中得到的物理和逻辑聚类中心对静态有序选择算法的查询评估策略进行优化,这样做只需定位聚类中心所在组群的局部范围,并在该范围内进行目标查询,而无需遍历整个XML数据库,从而快速返回满足用户需求的查询结果.经汽车外形智能化设计实验表明,所提算法的查询速度比静态有序选择算法平均提高了3~4倍. 相似文献