首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
在线联机分析处理(OLAP)是一个分析商业信息趋势的重要工具。虽然OLAP用多维立方体模型来分析结构化的商业数据是理想的,但是它并不适合用来表现和分析复杂的半结构化数据,如:XML文档。因为在广泛的应用领域,XML都是表现数据的语言选择,所以分析XML文档是必需的和紧迫的。描述了一个用XML树模型来分析XML文档的想法。鉴于OLAP的多维聚合操作不能够表示XML文档上的、结构复杂的分析操作,提出了新的、扩展了的XQUERY来支持这种复杂的分析操作。  相似文献   

2.
 从XML键导出了既保持语义约束又符合DTD结构约束的XML函数依赖,并基于DTD的规范化技术及XML的查询转换技术提出了保持语义的XML文档规范化方法,并对其应用实例作了详细的分析.  相似文献   

3.
越来越多的网上信息交换依附于XML文档,许多软件需要检索、存取、处理相关条件的XML文档并且返回近似值,因此XML文档的相似性评价受到越来越多的关注。本文对XML文档的相似性的几种常用的比较方法进行了总结和分析。  相似文献   

4.
XML文档检索日益重要,如何对XML文档建立索引是XML文档信息检索研究的关键。文中设计了一种索引结构,在索引项中引入索引词权重,根据权重值为XML文档各结构单元建立索引项,并给出得到索引项的索引算法。实验证明索引结构和算法能够大大降低计算量和复杂度。  相似文献   

5.
XML模式设计是XML数据库设计的关键,同关系数据库相似,对引起XML数据更新异常的原因及消除更新异常的方法进行研究具有重要的意义。与Vincent等人不同,本文在DTD一级对XML文档中的多值依赖进行了研究。首先分析了XML文档模式设计的研究方法,其次,重新给出了XML树,树元组等的定义,消除了Arenas等人在定义模型“相等”上的二义性,并基于DTD提出了XML多值依赖的概念。最后,分析了XML中多值依赖的公理系统及蕴涵问题并指出了XML多值依赖未来的研究方向。  相似文献   

6.
大型XML文档解析技术的应用与研究   总被引:1,自引:0,他引:1  
随着XML应用的不断深入,XML文档快速解析技术的研究成为了当前的热点问题.在研究XML相关解析技术的基础之上,讨论大型XML文档的解析和处理问题,寻求实际问题的最优解决方案.首先,对目前较适合大型XML文档解析的两种技术(VTD-XML和SAX)做了简要的介绍,对其各自的优劣性进行了比较和分析;其次,针对作者正在研发的"核磁共振谱仪控制软件系统"中参数的XML设计和处理问题提出了具体的解决方案,验证了它们在处理大型文件时的可行性,并对它们的实际效果进行了对比分析;最后,针对以上两种解决方案的不足之处,提出了大型XML数据文件处理的其他解决方案.  相似文献   

7.
张静  林淑飞 《科学技术与工程》2007,7(9):2092-20942097
XML文件作为一种数据存储与数据交换的文件,其应用日益广泛,但目前对于信息量大、结构复杂的文档要获取其中有用信息的操作效率较低。现提出一种新的基于程序切片技术对XML文档进行切片的方法。对给定的XML文档,可根据给定的切片规则对文档进行切片,从而得到一个用户感兴趣信息集合的新XML文档。同样,也可以对给定的XML文档对应的DTD或XML模式文档进行切片,根据给定的切片规则生成新的DTD或XML模式文档切片,同时,也会生成对应的XML文档切片,且切片获得的新文档是符合新的DTD或XML模式规范的有效文档。  相似文献   

8.
XML文档编码方案研究   总被引:1,自引:0,他引:1  
对目前XML文档主要的编码方案进行了探讨,并针对现有编码方案所存在的不足提出了一种可变扩展序号的编码方案.该方案不但能够快速准确地判断XML文档结构树中任意两个结点之间的父子、祖先/后裔以及兄弟关系,而且可以有效地支持XML文档的更新.  相似文献   

9.
王站立 《科技信息》2009,(17):61-61
扩展标记语言XML是一种简单的数据存储语言,随着XML越来起广泛地被采用,高效解析XML文档也变得越来越重要。Sun公司提供了JAXP接口来方便解析XML文档。本文讨论了如何使用此接口进行DOM解析XML文档。  相似文献   

10.
陈博 《咸宁学院学报》2010,30(12):30-31
XML作为一种与平台无关的数据表示形式已经成为数据交换的主流语言,而关系数据库是核心业务系统中最常用的数据库技术,本文介绍了XML文档与关系模型之间的对应关系,基于ASP.NET利用DOM提取XML文档信息数据,编程实现了XML文档到关系数据库的转换.  相似文献   

11.
XML文档对象模型(XML DOM)研究与应用   总被引:9,自引:0,他引:9  
介绍了XML的两种解析方法,重点分析了DOM模型及其特点,并给出了应用DOM技术对XML文档的一种解析处理过程。  相似文献   

12.
Domino和XML结构的相似性使XML文档可以方便有效地存储在Domino表单、域、页面、文件系统中,不需存储的XML数据可以在系统内存中处理.文章采用两种方法实现了XML文档在Domino中的存储:把XML原始数据存储在Notes域中,生成DOM(Document Object Model)树,通过遍历整个DOM树,按节点创建多个Notes文档;或者把XML原始文档调入系统内存,在内存中解析成DOM树,并只对包含所需数据的DOM树节点的子集进行处理,创建Notes文档.  相似文献   

13.
给出了XML文档树编码需考虑的因素,设计了支持动态调整的XML文档树编码算法,设计了编码方案,编码方式灵活,能够提高XML文档树重新编码的效率.  相似文献   

14.
在模糊XML数据管理中,模糊XML文档和模糊DTD的相似性是模糊XML数据整合、模糊XML文档聚类的关键步骤.为了研究模糊XML文档和模糊DTD的相似性,对模糊DTD树进行了规则变换,主要解决元素和属性的析取约束和基数约束问题,即由析取范式转化为合取范式,将元素或属性的重复次数确定化,然后利用树编辑距离算法对模糊XML文档树和转化后的模糊DTD树集合进行相似性对比.通过实验验证了所提方法的性能优势.  相似文献   

15.
在实际应用中,XML(eXtensible Markup Language)文档中的一些结构经常被改变。为了挖掘XML文档在历史变化过程中经常改变的结构所蕴含的知识,提出了发现频繁变化结构的方法。该方法用一组频繁变化结构组成的文档向量模型代表一个XML文档,将频繁变化结构在簇中的出现比例作为权值,使用加权余弦相似度对XML文档进行聚类。经过实验分析,根据XML文档历史变化过程中的频繁变化结构能较好地将XML文档进行聚类。用加权余弦相似度对XML文档进行聚类,其聚类结果的正确率、召回率和簇内部距离均优于使用非加权余弦相似度对XML文档进行聚类得到的结果。  相似文献   

16.
基于模板的XML文档表示技术研究   总被引:1,自引:1,他引:0  
大体积XML文档包含大量的冗余数据,因此它在网络上传输时存在有效传输效率低、浪费带宽等问题.针对大体积XML文档在网络上传输所存在的问题,提出了一种基于模板的XML文档表示方法,经实验证明本方法在一定程度上提高了大体积XML文档网络有效传输效率.  相似文献   

17.
随着XML相关标准和技术的不断推广和应用,网络上出现了大量的XML数据,XML已成为网络数据表示和交换的标准.在海量XML文档中进行精确快速地查询成为当前XML研究的主要方向.由于XML文档自身的半结构化特性,对存储在其中的数据进行查询就需要建立相应的索引并制定特殊的查询算法.对基于文本节点的XML索引进行改进,在原索...  相似文献   

18.
提出了一种XML文档与关系数据库数据转换中间件,通过把以XML文档形式存放的请求信息转化成相应的数据库能识别的请求信息,和把数据库返回数据转化成统一的XML文档格式的方式,实现了各种关系数据库访问的统一接口.在介绍了XML以及中间件技术基础上,着重对XML数据与关系数据库之间转换的方法进行研究,并具体讲解如何通过中间件技术来实现两者之间的数据转换工作.  相似文献   

19.
为了挖掘XML(Extensible Markup Language)文档在历史变化过程中不经常发生变化的结构所蕴含的知识,给出了发现冰冻结构的方法,使用一组冰冻结构组成的文档向量模型代表一个XML文档,并使用加权Jaccard系数作为相似度,利用基于XML文档历史变化过程中相对稳定的冰冻结构对XML文档进行聚类。经过实验证明,基于冰冻结构能够将XML进行有效的聚类,聚类后每簇中的XML文档具有相似的不经常变化结构。  相似文献   

20.
为了解决目前存在大量XML文档无模式定义的问题,提出一种XML文档模式的自动构造算法.该算法以XML数据为输入,输出具有通用意义的文档模式,再根据具体要求转化到所要求的文档定义类型.实验证明,该模式构造算法确实可行,且具有较好的通用性,可应用于模式的自动生成、XML数据模式挖掘等方面.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号