首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
xml作为一种数据表示方式,越来越为人们所接受.最近,基于xml/半结构化数据的索引的查询引起了人们的广泛关注.有人提出来用结构索引来支持基于xml/半结构化数据的查询.由于xml/半结构化数据的结构不严格、不规则,结构索引会随着数据的增加或删除而变化,维护结构索引就成了首要问题.本文研究了在xml文档集合上增加多个文档和删除一个文档时结构索引的更新,提出了在这两种情况下的索引维护算法,这两种算法比现在已知的其它算法的性能要更优秀.  相似文献   

2.
XML文档检索日益重要,如何对XML文档建立索引是XML文档信息检索研究的关键。文中设计了一种索引结构,在索引项中引入索引词权重,根据权重值为XML文档各结构单元建立索引项,并给出得到索引项的索引算法。实验证明索引结构和算法能够大大降低计算量和复杂度。  相似文献   

3.
一种基于文本节点的XML文档索引   总被引:1,自引:0,他引:1  
XML将逐步取代HTML成为Internet上的主流数据表示及数据交换格式,如何快速准确地对XML文档中的数据进行查询也成为亟待解决的关键问题.因此,需要开发一种适合XML的查询策略以及特殊的索引技术.文章利用一种基于文本节点的XML索引TN—Index,特点是索引文件规模较小,而且可以进行局部查找,这样就实现了XML文档的快速查询.  相似文献   

4.
XML已经成为数据表示和数据交换的标准.它的自描述和特定可扩展性等核心特性提供了不同应用程序之间消息传输所需的灵活性.近年来,XML越来越多地活跃在数据交换和存储领域,用XML表示的半结构化数据越来越普遍,在B2B电子商务行业中尤其明显.面对XML数据量的指数级的增长,必然要求更有效的数据管理能力和更快、更精确的查询.因此,如何从XML数据源中准确有效地查询所需信息,也就变得越来越重要.就有关XML实现的检索方式探讨.  相似文献   

5.
支持更新的XML文档编码模式   总被引:1,自引:0,他引:1  
在比较了现有的编码模式后提出了一种新的编码方法,该方法能够快速准确地判断XML文档结构树中任意两个结点之间的父子、祖先/后裔以及兄弟关系。采用可变扩展序号支持XML文档更新,可有效降低XML文档的二次编码率。并且在编码时间性能上,也有较好地表现。  相似文献   

6.
对基于序列的XML索引技术进行了分析和研究,指出了由于同名兄弟节点的存在,导致了假警报,出现了查询不等价问题。并详细介绍了基于约束序列XML的索引技术,给出了基于序列的XML索引技术未来发展方向。  相似文献   

7.
张静  林淑飞 《科学技术与工程》2007,7(9):2092-20942097
XML文件作为一种数据存储与数据交换的文件,其应用日益广泛,但目前对于信息量大、结构复杂的文档要获取其中有用信息的操作效率较低。现提出一种新的基于程序切片技术对XML文档进行切片的方法。对给定的XML文档,可根据给定的切片规则对文档进行切片,从而得到一个用户感兴趣信息集合的新XML文档。同样,也可以对给定的XML文档对应的DTD或XML模式文档进行切片,根据给定的切片规则生成新的DTD或XML模式文档切片,同时,也会生成对应的XML文档切片,且切片获得的新文档是符合新的DTD或XML模式规范的有效文档。  相似文献   

8.
XML文档检索技术研究   总被引:2,自引:0,他引:2  
网络信息资源急剧增长,如何利用数据检索技术有效的发现和使用资源成为亟待解决的问题.XM L具备许多HTM L没有的优点,更加适合应用于网络检索,探讨了XM L文档检索模型的主要技术问题,并提出了一种基于树查询的索引和部分匹配检索算法.  相似文献   

9.
分析XISS,DBXI,DDT等索引方法的优缺点,提出一种基于XML Schema的XML索引,以提高XML查询的效率.通过利用XML Schema结构信息对XML进行索引,支持对基于不同XMLSchema的多类XML文档的统一查询,同时兼顾对XML文档的有效性验证和对无效查询的判断.通过在编码时预留一定的编码空间,方...  相似文献   

10.
介绍了如何将概念化信息模型转换为XML文档的设计,分析了一些必要的设计决策:如何表示类型层次,使用元素或属性,以及如何将二进制属性编码。  相似文献   

11.
XML既是互联网上流行的信息交换媒介,也是储存数据的主要方式.对大量XML数据做查询,要加快查询速度,最有效的方法之一就是建立良好的索引结构并辅以相关的搜寻技术.动态XML 数据标记法(LSDX)可以动态更新标记,不用重建索引和标记,由于有2个问题仍然没有完全解决,因而影响它的实用性,提出的2个标记编码规则很好地解决了这2个问题.  相似文献   

12.
提出一种基于DTD的不完全值索引结构DBPVI,并设计一个基于Dewey编码的有效结构连接算法。结合Timber关于非完全结构查询的最小公共祖先的有意义判断方法,提出一种基于DTD的非完全结构化查询处理算法。实验证明,该算法能够获得较高的查询效率,并保证非完全结构化查询的质量。  相似文献   

13.
在线联机分析处理(OLAP)是一个分析商业信息趋势的重要工具。虽然OLAP用多维立方体模型来分析结构化的商业数据是理想的,但是它并不适合用来表现和分析复杂的半结构化数据,如:XML文档。因为在广泛的应用领域,XML都是表现数据的语言选择,所以分析XML文档是必需的和紧迫的。描述了一个用XML树模型来分析XML文档的想法。鉴于OLAP的多维聚合操作不能够表示XML文档上的、结构复杂的分析操作,提出了新的、扩展了的XQUERY来支持这种复杂的分析操作。  相似文献   

14.
为了实现以一种开放、自身描述方式定义的数据结构,采用了将SGML的多功能与HTML的易用性结合的方法应用到Web中,构造了XML是SGML的一个简化子集,并介绍了XML具有可以统一电子数据交换的格式、优越的数据描述、可以作为子元素形成数据嵌套等特点及不足之处、主要相关技术(包括显示、打印、数据结构的变更等).通过实践证明在电子数据交换中有广泛的应用价值。  相似文献   

15.
XML ,作为HTML语言的一种补充 ,具有如可扩展性、简单性、开放性、互操作性、支持多国语言等有一系列特性 ,这就使得它必将成为新一代WWW环境的主要工具。但由于XML文件只是文本文件 ,它本身并不带有任何的处理数据能力 ,因此必须辅以其它的工具来应用它。针对目前XML应用技术现状 ,本文提出了利用DOM (或SAX)技术一次性解析文档后 ,将XML文档中的层次数据提取出来通过继承Java集合类来自定义相关类并进一步处理XML中的数据  相似文献   

16.
基于XML的PDF文档认证和完整性保护的实现   总被引:1,自引:0,他引:1  
PDF文档已经成为了网络传输的通用文件格式,其认证和完整性保护始终是个难题,最重要的原因是常用的图像认证和完整性保护方法无法在PDF文档中发挥作用。XML是适用于描述文件结构和内容的工具,所以,对PDF文档的内容提取、数据挖掘和信息过滤等操作将完全转移到对XML文档的操作,最终实现了PDF文档认证和完整性保护。  相似文献   

17.
分析了DBXML的体系结构.针对其采用的文本存储方式在XML文档的存储、查询和更新效率等方面的问题,提出并实现了基于树结构的存储方式,保证了较大的XML文档的查询和更新效率,并给出了两种方式的对比分析.  相似文献   

18.
王鹏 《科学技术与工程》2011,11(6):1241-1245
在信息检索中,关键词之间的距离反映了其对信息描述的集中程度,并对检索结果与用户需求的相关度产生影响。通过对XML数据固有的结构信息进行深入分析,确定了被检索数据的信息对象和信息分支的概念,并考虑以上因素建立语义距离模型。通过该模型的计算,能够更准确地计算出查询结果的相关度。实验结果证明:在真实数据集上,查询质量方面优于现有的主流算法(EASE、SLCA),同时具有较高的查询效率。  相似文献   

19.
索引结构是影响查询性能的一个重要因素,目前出现的索引结构主要存在以下几个问题:1)不能有效支持带有谓词约束条件的分支查询;2)只能在小文档上进行测试或者建立的索引文件比较大.为了解决这些问题,提出了一种基于DTD结构的不完全值索引方法——DBPVI(DTD-based Partly-Value XML Indexing).实验证明,该索引方法能在不影响查询性能的前提下,很好地解决上述问题.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号