首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 187 毫秒
1.
 从XML键导出了既保持语义约束又符合DTD结构约束的XML函数依赖,并基于DTD的规范化技术及XML的查询转换技术提出了保持语义的XML文档规范化方法,并对其应用实例作了详细的分析.  相似文献   

2.
基于海量XML文档查询速度已不能满足日益增长的信息关联和服务请求多样性的需求,本文提出一个重构XML结构的频繁向量选择增量模式树(XFP-tree)算法,该算法以XML键为基础,首先对XML结构进行向量矩阵处理,再通过投影频繁模式树实现对XML结构进行分裂、合并、更改与取消等优化措施,满足XML结构简洁性与查询多样性;结合投影和树结构技术,讨论XML键向量矩阵频繁项集的划分规则,而相应启发式策略的制定与支持度阈值的讨论有利于算法效率的提高。对比其它关联算法,一系列仿真实验表明所提出的算法具有一定的有效性及合理性,是重构XML结构的一种有效方法。  相似文献   

3.
在分析基于区间编码的结构连接算法Stack-Tree算法的基础上,研究基于树型模型的XML结构编码、XML查询处理过程中路径匹配等关键技术问题,并利用dom4j解析技术,基于Berkeley DB实现基于Stack-Tree算法的XML查询原型系统.实验结果表明本文设计的基于Stack-Tree算法的查询系统在查询时间,查询准确性以及全面性上能够满足对查询系统的功能和性能要求.  相似文献   

4.
XML数据在关系数据库中存储和检索的研究和实现   总被引:15,自引:0,他引:15  
论述了关系型数据和XML数据之间的相互转换 ,给出了将XML数据存储在关系数据库和将存储在关系数据库的XML数据恢复为XML形式的算法 .由于实际数据类型的复杂性 ,使用Schema来定义XML文档类型 .试验结果表明算法具有较好的性能 .讨论了将XMLQL查询语句转换为SQL查询语句的设计 ,根据文中XML数据存储在关系型数据库中的算法 ,可以对XMLQL查询语句的语法、语义进行分析以转换为相应形式的SQL语句来在关系数据库中查询被存储的XML数据 ,并返回相应的结果集  相似文献   

5.
由于DTD的复杂性,使得XFD的逻辑蕴涵问题研究比较困难.为了解决该问题,本文在M.Arenas等人给定的XFD定义基础上,提出了一种DTD路径编码方法,对它的性质进行了分析.编码后的DTD消除了部分XML平凡函数依赖,并能在线性时间内对XML函数依赖的逻辑蕴涵问题进行判定.提出了一个将XFD中的编码路径重新映射到DTD路径的算法,证明了它的正确性.  相似文献   

6.
与传统数据库对XML数据的处理不同,对XML流数据的处理不仅受实时性的约束,还受存储空间的限制.在Hole-Filler模型的基础上,首先利用XML的查询统计信息,定义了路径频率树,提出了基于兄弟关系的XML流数据剪切分片策略及其算法.在此基础上,提出了基于父子关系的XML流数据剪切分片策略及算法.这两个基于路径频率树的剪切算法有效地提高了XML片段的利用率,增强了XML片段的内聚性.实验结果表明,基于路径频率树的XML剪切算法在剪切时间、查询时间、空间消耗等方面都表现出较好的性能.  相似文献   

7.
提出一种基于DTD的不完全值索引结构DBPVI,并设计一个基于Dewey编码的有效结构连接算法。结合Timber关于非完全结构查询的最小公共祖先的有意义判断方法,提出一种基于DTD的非完全结构化查询处理算法。实验证明,该算法能够获得较高的查询效率,并保证非完全结构化查询的质量。  相似文献   

8.
研究了XML路径表达式的相关查询算法,提出了基于标注后缀树的XML路径表达式公共子查询的优化算法,通过冗余消除技术来提高路径表达式的查询效率·在REOA测试集上,通过对设计的查询进行测试,分析了基于标注后缀树的XML路径表达式公共子查询的优化算法的性能·实验结果表明,基于标注后缀树的XML路径表达式冗余消除技术可以极大地提高路径表达式的查询效率·  相似文献   

9.
提出了一种利用DTD的结构信息将XML文档映射到数据库中的的方法.在该方法中,不同DTD的XML文档可以保存在相同模式的关系表中,仅需两张表就能存储所有的DTD和XML文档.  相似文献   

10.
XML Schema作为一种描述XML文档模式信息即结构信息的标准,对于XML索引的建立及查询效率的提高有着重要的作用。现在大部分XML索引结构着重研究XML文档的结构查询。本文在比较研究了现有的区间编码方式和XML索引技术的基础上,提出了一种基于Schema的XML索引技术SBXI(Schema-Based XML Indexing)。SBXI充分利用了XML Schema建立XML索引从而提高路径查询的效率,并进一步展望未来的研究方向。  相似文献   

11.
基于本体的XML数据集成及映射关系的研究   总被引:2,自引:0,他引:2  
文章在集成异构分布式XML数据源时,提出一种基于本体的数据模型来描述XML数据的语义信息,以实现带有一定逻辑推理功能的智能查询。即通过一系列映射规则将XPath的局部路径与本体中的概念及角色关联起来,将用户查询重写为基于XML的XPath查询,本系统的目标是使用户可对Web上各XML数据源进行基于本体的查询。  相似文献   

12.
为了实现XML查询到SQL查询的转换,提出了一个基于XQuery查询和JDOM的转换框架和算法.设计了核心组件查询转换器,将XML查询语句定义为XML查询文档,使用JDOM解析XML查询文档,抽取出SQL语句的各个组成部分.该算法简洁并具有较高的通用性.  相似文献   

13.
It is nontrivial to maintain such discovered frequent query patterns in real XML-DBMS because the transaction database of queries may allow frequent updates and such updates may not only invalidate some existing frequent query patterns but also generate some new frequent query patterns. In this paper, two incremental updating algorithms, FUXQMiner and FUFXQMiner, are proposed for efficient maintenance of discovered frequent query patterns and generation the new frequent query patterns when new XML queries are added into the database. Experimental results from our implementation show that the proposed algorithms have good performance.  相似文献   

14.
索引结构是影响查询性能的一个重要因素,目前出现的索引结构主要存在以下几个问题:1)不能有效支持带有谓词约束条件的分支查询;2)只能在小文档上进行测试或者建立的索引文件比较大.为了解决这些问题,提出了一种基于DTD结构的不完全值索引方法——DBPVI(DTD-based Partly-Value XML Indexing).实验证明,该索引方法能在不影响查询性能的前提下,很好地解决上述问题.  相似文献   

15.
利用XML文档中各路径之间相似的特点,只扫描一次XML文档,把重复的XML标记所生成的事件组合成一个聚合事件,并在基于共享前缀的NFA算法YFilter基础上,提出一种改进算法PolYFilter,实现了聚合事件的谓词计算.实验表明,与YFilter相比,PolYFilter算法减少了大量相同的有限自动机状态转移的中间状态,避免了状态集的重复计算.特别是当XML文档比较大,且重复标记比较多的时候,PolYFilter有较好的过滤性能.  相似文献   

16.
针对面向对象XML数据的两种存储模式:集中式和分布式,基于两种存储模式的存储结构信息的路径仓和存储XML数据的数据仓,分别设计并实现了面向对象XML的查询代数.采用支持继承的扩展XML-RL查询语言,使用多态元素、多态引用、独占元素和独占引用四种典型查询,分析了两种存储模式的性能.结果表明查询多态元素和独占元素时,集中式优于分布式,而查询多态引用和独占引用时分布式优于集中式.  相似文献   

17.
By rapid progress of network and storage technologies, a huge amount of electronic data such as Web pages and XML has been available on Internet. In this paper, we study a data-mining problem of discovering frequent ordered sub-trees in a large collection of XML data, where both of the patterns and the data are modeled by labeled ordered trees. We present an efficient algorithm of Ordered Subtree Miner (OSTMiner) based on two- layer neural networks with Hebb rule, that computes all ordered sub-trees appearing in a collection of XML trees with frequent above a user-specified threshold using a special structure EM-tree. In this algo- rithm, EM-tree is used as an extended merging tree to supply scheme information for efficient pruning and mining frequent sub-trees. Experiments results showed that OSTMiner has good response time and scales well.  相似文献   

18.
用户浏览偏爱模式挖掘算法的研究   总被引:2,自引:0,他引:2  
针对当前的挖掘算法只是简单地把频繁访问路径作为用户浏览的兴趣路径的问题,充分地考虑了用户在页面上的浏览时间和在路径选择上表现出来的浏览偏爱,提出了基于远程代理数据收集的浏览偏爱模式挖掘算法。该算法先利用客户端的远程代理收集用户浏览信息,然后划分成用户事务,最后利用一个递归过程找出用户浏览偏爱模式。实验证明:该算法比当前的频繁访问路径算法在用户浏览兴趣度量上更准确。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号