首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 10 毫秒
1.
张静  林淑飞 《科学技术与工程》2007,7(9):2092-20942097
XML文件作为一种数据存储与数据交换的文件,其应用日益广泛,但目前对于信息量大、结构复杂的文档要获取其中有用信息的操作效率较低。现提出一种新的基于程序切片技术对XML文档进行切片的方法。对给定的XML文档,可根据给定的切片规则对文档进行切片,从而得到一个用户感兴趣信息集合的新XML文档。同样,也可以对给定的XML文档对应的DTD或XML模式文档进行切片,根据给定的切片规则生成新的DTD或XML模式文档切片,同时,也会生成对应的XML文档切片,且切片获得的新文档是符合新的DTD或XML模式规范的有效文档。  相似文献   

2.
XML文档检索日益重要,如何对XML文档建立索引是XML文档信息检索研究的关键。文中设计了一种索引结构,在索引项中引入索引词权重,根据权重值为XML文档各结构单元建立索引项,并给出得到索引项的索引算法。实验证明索引结构和算法能够大大降低计算量和复杂度。  相似文献   

3.
XML文档编码方案研究   总被引:1,自引:0,他引:1  
对目前XML文档主要的编码方案进行了探讨,并针对现有编码方案所存在的不足提出了一种可变扩展序号的编码方案.该方案不但能够快速准确地判断XML文档结构树中任意两个结点之间的父子、祖先/后裔以及兄弟关系,而且可以有效地支持XML文档的更新.  相似文献   

4.
xml作为一种数据表示方式,越来越为人们所接受.最近,基于xml/半结构化数据的索引的查询引起了人们的广泛关注.有人提出来用结构索引来支持基于xml/半结构化数据的查询.由于xml/半结构化数据的结构不严格、不规则,结构索引会随着数据的增加或删除而变化,维护结构索引就成了首要问题.本文研究了在xml文档集合上增加多个文档和删除一个文档时结构索引的更新,提出了在这两种情况下的索引维护算法,这两种算法比现在已知的其它算法的性能要更优秀.  相似文献   

5.
介绍了如何将概念化信息模型转换为XML文档的设计,分析了一些必要的设计决策:如何表示类型层次,使用元素或属性,以及如何将二进制属性编码。  相似文献   

6.
数字图书馆的建设面临着资源整理、查找、存储等一系列问题,传统的文档存储形式不利于信息的再利用、web发布等。提出了将中文文本数据转换为可扩展标记语言(XML)文档的一种方法,通过解析一个文件类型表示(DTD),利用DTD中给的元素名称、属性等从文本数据中找到相应元素的内容,从而形成一个特定DTD下的XML文档。  相似文献   

7.
大型XML文档解析技术的应用与研究   总被引:1,自引:0,他引:1  
随着XML应用的不断深入,XML文档快速解析技术的研究成为了当前的热点问题.在研究XML相关解析技术的基础之上,讨论大型XML文档的解析和处理问题,寻求实际问题的最优解决方案.首先,对目前较适合大型XML文档解析的两种技术(VTD-XML和SAX)做了简要的介绍,对其各自的优劣性进行了比较和分析;其次,针对作者正在研发的"核磁共振谱仪控制软件系统"中参数的XML设计和处理问题提出了具体的解决方案,验证了它们在处理大型文件时的可行性,并对它们的实际效果进行了对比分析;最后,针对以上两种解决方案的不足之处,提出了大型XML数据文件处理的其他解决方案.  相似文献   

8.
通过Cocoon架构,将XML文档分别转换成能够被网络浏览器识别的HTML文档.以及能被Acrobat readers识别的PDF文档和能被手机识别的WML格式文档.给出了文档格式转换的代码.  相似文献   

9.
在模糊XML数据管理中,模糊XML文档和模糊DTD的相似性是模糊XML数据整合、模糊XML文档聚类的关键步骤.为了研究模糊XML文档和模糊DTD的相似性,对模糊DTD树进行了规则变换,主要解决元素和属性的析取约束和基数约束问题,即由析取范式转化为合取范式,将元素或属性的重复次数确定化,然后利用树编辑距离算法对模糊XML文档树和转化后的模糊DTD树集合进行相似性对比.通过实验验证了所提方法的性能优势.  相似文献   

10.
随着XML文档的大量涌现,如何高效地像存取整个文档一样直接存取文档中任意元素已成为一个亟待解决的关键问题,另外,能够快速高效地支持XML文档更新的索引技术在商业领域也更加急需,提出了一种基于倒排表的索引,能很好地支持文档结构和内容的动态更新,给出了利用关系数据库实现该索引的方法。  相似文献   

11.
一种XML数据到结构化数据的转换方法   总被引:2,自引:0,他引:2  
分析半结构化树状层次结构的XML文档的结构特征,描述XML结构与关系数据库的对应关系.给出XML文档的DTD中各主要元素与关系数据模型之间的映射规则,设计转换规则脚本的自动生成算法和数据转换算法.  相似文献   

12.
越来越多的网上信息交换依附于XML文档,许多软件需要检索、存取、处理相关条件的XML文档并且返回近似值,因此XML文档的相似性评价受到越来越多的关注。本文对XML文档的相似性的几种常用的比较方法进行了总结和分析。  相似文献   

13.
作为时空数据库的核心和基础,许多时空数据模型被提出以适应越来越多的应用.基于XML对时空数据建模的研究特别是修正时空数据在XML文档中的不一致性的研究还很少.首先,提出了一个基于XML的时空数据模型,并在此模型的基础上给出了时空数据在XML文档中的一致性条件.然后,对三种主要的变化操作即更新操作、插入操作和删除操作中的不一致性阐述了修正方法,并给出了相应的例子说明.最后,对这三种操作不一致性种类进行了讨论.  相似文献   

14.
本文简要介绍了XML的概念及文档对象(DOM),结合XML的相关技术和文档对象的方法,分析XML数据的格式和相关的存取技术。通过构建一个局域网程序来实现XML数据和数据库记录的转换。  相似文献   

15.
基于文档构件化技术的文档创作是提高文档生产率和文档质量的一条有效途径,可复用文档构件技术是使文档更加成熟的关键点.首先介绍了有关知识管理的相关知识,体现出对知识管理中显性知识———文档进行管理的充要性,并提出文档构造过程中存在的大量重复劳动的问题,提出了基于软件构件与复用理念的构造方式,接着,本文基于XML语言,对“文档构件化”过程中关键部分进行了定义、抽象、Schema设计、解析与组成分析,以及后期的构件存储分析,把文档构件归纳为3类主要构件,并对这3类构件的应用进行了设计.最后,以特殊领域文档为应用实例,设计出实现文档构件化与复用的文档构造模块.  相似文献   

16.
BTCS:基于二叉遍历的XML文档编码模式   总被引:5,自引:0,他引:5  
XML文档数据的编码模式与索引技术决定了基于纯XML数据库的XML查询效率,在正则路径表达式实现方面有重要意义.基于树遍历的XML文档编码在更新与结构关系判断方面存在不足.为了解决此类问题,作者作了如下工作:(1)提出一种新的基于二叉树遍历的XML文档编码模式BTCS(Binary Traveling Coding Scheme);(2)实现了BTCS编码算法,支持XML文档更新,提高了编码更新效率;(3)在常数复杂度的时间内快速准确判断XML文档结构树中任意两个结点之间的父子以及祖孙关系,并能计算它们的辈数差(Distance of Genera-tions);(4)通过详细实验证明了BTCS编码模式的良好性能.  相似文献   

17.
XML数据存储管理技术   总被引:4,自引:0,他引:4  
随着XML的出现,计算机领域出现了一个新的发展方向。XML不仅作为一种互联网上数据表示和交换的标准,而且被应用于搜索引擎、电子商务、电子数据交换等很多方面,因此受到了广泛的关注。为了更好的发挥XML的潜能和作用,必须有一种完善的技术对XML数据进行存储管理。本文详细分析了当前存在的XML数据存储管理技术及其分类方法,指出了这些方法存在的不足。然后,提出了基于映射对象的XML存储管理技术分类方法。最后,对一个完善的XML数据管理技术应当具有的功能进行了探讨。  相似文献   

18.
谭谈  姜秋艳  吕伟艳 《科技信息》2009,(9):47-47,75
在某大型项目中,为保证系统之间的数据共享,采用了XML文档作为数据的交换格式,基于.NET技术构建了XML文档管理系统,通过使用序列化与反序列化技术、流式读写技术和数据集技术提高了XML文档读写的易用性和高效性.通过XML架构模式验证交互数据的准确性。  相似文献   

19.
研究实现基于XML的数据集成技术,探讨了XML的主要技术以及XML应用。  相似文献   

20.
为了挖掘XML(Extensible Markup Language)文档在历史变化过程中不经常发生变化的结构所蕴含的知识,给出了发现冰冻结构的方法,使用一组冰冻结构组成的文档向量模型代表一个XML文档,并使用加权Jaccard系数作为相似度,利用基于XML文档历史变化过程中相对稳定的冰冻结构对XML文档进行聚类。经过实验证明,基于冰冻结构能够将XML进行有效的聚类,聚类后每簇中的XML文档具有相似的不经常变化结构。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号