首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
阐述了现有XML文档的版本管理机制所采用的关键技术,总结其存在的不足,然后设计了新的XML文档节点的编码方案并生成结构化连接所需要的四元组结构,在此基础上对一个经典结构连接算法进行了扩展,使之支持多版本XML文档的查询。  相似文献   

2.
XML文档集的结构连接算法研究   总被引:1,自引:0,他引:1  
针对XML文档集进行结构连接时,因数据量大且需要进行文档之间的比较而产生了定位复杂的问题,提出了一种利用栈实现基于缓存的结构连接算法。实验结果表明,该方法有效实现了XML文档集的结构连接计算。  相似文献   

3.
XML文档编码方案研究   总被引:1,自引:0,他引:1  
对目前XML文档主要的编码方案进行了探讨,并针对现有编码方案所存在的不足提出了一种可变扩展序号的编码方案.该方案不但能够快速准确地判断XML文档结构树中任意两个结点之间的父子、祖先/后裔以及兄弟关系,而且可以有效地支持XML文档的更新.  相似文献   

4.
现有的动态XML编码方案(如OrdPath、DLN、BSC等)对XML编码的动态更新仅限于叶节点的插入情况,并未考虑内部节点的插入情况,而内部节点的插入对XML而言是一个普通操作。文章通过扩展BSC编码提出了一种全面支持XML编码动态更新的编码方案EBSC编码,该编码方案在BSC编码中加入内部节点插入标示(IN)和父亲节点内部插入标示(PN),充分考虑叶节点的插入和内部节点的插入2种情况,能够全面地支持XML节点编码的动态更新问题。实验结果表明,该编码方案能够高效地处理XML文档树内部节点插入时编码的更新。  相似文献   

5.
本文提出了一种改进的遗传算法,用于优化Web日志挖掘的关联规则集。介绍了该算法的具体流程,提出新的染色体编码方案,新的编码配合本文的交叉操作使遗传过程更加优化,本文还对遗传的各步操作进行了改进,有效的避免遗传算法的早熟现象。  相似文献   

6.
Dewey是一种主流的XML文档编码方法。在Dewey编码基础上进行了扩展,根据XML文档树中结点的位置特性与更新代价的相关性,提出了一种扩展的Dewey二元组编码方案,给出了明确的节点编码计算表达式,为每个结点预留了不同大小的编码空间,降低了XML文档树更新操作时需重新编码结点的代价。结点编码采用二元组形式,每个编码包含了该结点深度指标值,缩短了计算结点间结构关系的时间。充分的试验结果证明,编码方案查询速度快,插入更新性能优异。因此,编码方法在不提高编码效率和不损失查询速度的前提下,可以较好地解决更新操作所造成的节点重新编码的问题,是一种较好的前缀编码。  相似文献   

7.
针对XML数据流可能具有复杂的递归层次结构,提出一种XML数据流小枝匹配算法TwigPM.通过获取查询节点的结构关系,进行有效的剪枝操作,减少了处理时间和数据所占用的内存空间.实验结果表明,算法具有高效性.  相似文献   

8.
为了满足基于Web的XML数据信息的挖掘的需求,提出一种基于结构相似度的XML文档的聚类算法,该方法是在根据XML文档的语义信息和结构信息计算出相似度基础之上对XML文档集合进行聚类,并进行了实验,证明该方法有效,与同类算法相比有其优势的地方。  相似文献   

9.
整体小枝连接是XML文档查询的重要方法.本研究改进了结点的编码结构,提出TwigStackList+算法.实验结果表明,该算法能够有效地提高整体结构连接的效率.  相似文献   

10.
基于改进遗传算法的神经网络优化   总被引:1,自引:0,他引:1  
针对在神经网络应用中,存在结构设计及权值训练算法的不足,提出一种新的基于混合编码方案的遗传算法.在算法中设计了用遗传算法全局优化神经网络拓扑结构和网络权值的新的编码方案,改进了适应度函数的设计和采用自适应的交叉和变异方法.试验结果表明本算法能有效地对神经网络的权值和结构同时优化,提高了训练效率.  相似文献   

11.
提出一种基于DTD的不完全值索引结构DBPVI,并设计一个基于Dewey编码的有效结构连接算法。结合Timber关于非完全结构查询的最小公共祖先的有意义判断方法,提出一种基于DTD的非完全结构化查询处理算法。实验证明,该算法能够获得较高的查询效率,并保证非完全结构化查询的质量。  相似文献   

12.
采用Shared Inlining方法,提出基于函数依赖的XML到关系的无损映射算法,使得原XML文档的内容和结构信息及语义约束完整地映射到关系数据库中.在此基础上利用外键连接与路径映射规则,提出基于语义约束的关系模式向XML模式的转换算法,以重构出原XML文档.提出的新观点是:映射得到的关系或XML文档的范式不但与映射算法有关,而且与XML文档或关系的规范化程度有关.定义了XML范式,提出XML文档与关系的相互转换中XML范式与关系范式对应关系的相关命题,并给出了相应证明.  相似文献   

13.
基于B 树,并借鉴XB树的特点设计一种XM L文档的索引方法.索引关键字分为元素关键值和XM L编码的范围.利用元素编码的范围查询,不必在整XM L文档中搜索,提高了查询效率.对于复杂分支查询,提出了拆分成简单查询路径的规则.在结构化连接问题上,提出了不仅要进行祖孙(父子)关系的连接,还要进行兄弟关系的判断,以得到正确的匹配结果.  相似文献   

14.
提出一种支持数据动态更新的编码方案SDUE,该编码将结点位置信息进行分解,避免记录冗余信息,从而有效地节省了存储空间.此外,SDUE还能有效地支持数据更新.在查询方面,由于SDUE编码记录了结点路径信息,在路径查询中避免了结构连接操作,有效地提高了查询效率.实验结果表明,与其他编码相比,SDUE编码在空间存储利用率、结点更新效率和查询速度方面都有较明显的优势.  相似文献   

15.
基于XML /Schema 甲骨文语料库语料标注的研究   总被引:3,自引:1,他引:2  
对语料库进行语料标注是实现原始语料信息计算机可读的关键.采用XML+XML Schema对甲骨文语料库进行结构化标注,使不同类型的数据表示成统一的格式,方便数据的交换与共享.给出了一种依据XML文档中使用的词汇集,对词汇集进行建模来约束XML文档中使用的元素和属性及其之间的结构关系和数据类型.根据定义好的XMLSchema使用XML对甲骨文信息进行结构化标注,可以准确地描述数据的结构及数据类型.  相似文献   

16.
BTCS:基于二叉遍历的XML文档编码模式   总被引:5,自引:0,他引:5  
XML文档数据的编码模式与索引技术决定了基于纯XML数据库的XML查询效率,在正则路径表达式实现方面有重要意义.基于树遍历的XML文档编码在更新与结构关系判断方面存在不足.为了解决此类问题,作者作了如下工作:(1)提出一种新的基于二叉树遍历的XML文档编码模式BTCS(Binary Traveling Coding Scheme);(2)实现了BTCS编码算法,支持XML文档更新,提高了编码更新效率;(3)在常数复杂度的时间内快速准确判断XML文档结构树中任意两个结点之间的父子以及祖孙关系,并能计算它们的辈数差(Distance of Genera-tions);(4)通过详细实验证明了BTCS编码模式的良好性能.  相似文献   

17.
XML数据聚簇技术研究   总被引:1,自引:1,他引:0  
在分析DOM标准中数据访问的特点后,提出了两种XML数据聚簇存储方法:基于父子关系的XML数据聚簇存储方法和基于兄弟关系的XML数据聚簇存储方法·针对两种典型树遍历操作,分析了两种XML聚簇存储方法发生I/O的概率,给出了两种DOM树遍历路径表达式查询算法,即深度优先查询算法和宽度优先查询算法·基于XMark和XMach测试基准进行了性能评价·  相似文献   

18.
Holistic twig query processing techniques based on region encoding have been developed to minimize the intermediate results, namely, those root-to-leaf path matches that are not in the final twig results. These algorithms have to scan all the streams of tags in query patterns. However, useless path matches cannot be completely avoided. TJFast which is based on the labeling scheme of Extended Dewey has been proposed to avoid useless intermediate results, and it only needs to access the labels of the leaf query nodes. However, it don't concern about the characteristics of elements with the same parent, and it has to merge join all the intermediate results which are evaluated during the first phrase. We propose a new labeling scheme to compress the XML elements which have the same characteristic. Based on the compressed path-labeled streams, a new novel holistic twig query algorithm named CPJoin is designed. Finally, implementation results are provided to show that CPJoin has good performance on both real and synthetic data.  相似文献   

19.
明确提出XML带来了数据模型设计从关系导向到实体导向的转变,分析了XML数据模型与关系数据模型的联系与区别,指出前者具有减少结构性冗余、灵活表达元组间的并列、包含、嵌套等关系的优点.同时,提出了一种XML的一般数据模型,包括描述实体的索引模型、嵌套模型和描述关系的链接模型.以客户服务系统为例说明了模型的实现,并检验了节省的空间开销率和时间开销率.  相似文献   

20.
分析现有XML模式到关系模式的各种映射算法的不足,提出针对递归结构的映射算法:XML2DB-recursion- mapping.该算法可以保留递归结构,建立符合范式的关系模式.递归关系从关系模式恢复到XML模式的实验证明,XML2DB-recursion-mapping具有可逆无损的算法特性,具有比已有算法更好的映射结果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号