首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 203 毫秒
1.
针对建立Native XML数据管理系统中XML数据存储,提出利用DOM规范建立父子关系和兄弟关系聚类存储策略。通过实验测试,它们分别适合XML数据深度优先查询与广度优先查询两种算法,提高了查询效率。  相似文献   

2.
Domino和XML结构的相似性使XML文档可以方便有效地存储在Domino表单、域、页面、文件系统中,不需存储的XML数据可以在系统内存中处理.文章采用两种方法实现了XML文档在Domino中的存储:把XML原始数据存储在Notes域中,生成DOM(Document Object Model)树,通过遍历整个DOM树,按节点创建多个Notes文档;或者把XML原始文档调入系统内存,在内存中解析成DOM树,并只对包含所需数据的DOM树节点的子集进行处理,创建Notes文档.  相似文献   

3.
面对飞速发展的信息时代,WEB数据的挖掘日益重要,而传统的搜索引擎难以胜任对数据的挖掘处理。基于XML良好的结构性和层次性,提出了利用DOM树进行WEB挖掘的方法。首先利用Tidy工具库将WEB数据转换成良好结构的XML文件,简化生成DOM树,然后通过遍历解析XML的DOM树结构,提取需要的WEB信息,实现对WEB数据挖掘。实验表明,该方法能够方便地对数据进行结构化存储和信息处理。  相似文献   

4.
在分析目录树的基础上讨论了树的一种存储结构,它可以存储具有任意度的树,在此基础上研究了这种存储结构树的算法,给出利用队列按层遍历及递归调用的算法,相当于对树的广度优先,深度优先遍历,最后给出对目录树遍历操作的实例。  相似文献   

5.
树型数据结构的探讨   总被引:4,自引:0,他引:4  
在分析目录树的基础上讨论了树的一种存储结构,它可以存储具有任意度的树。在此基础上了这种存储结构树的算法,给出利用队列按层遍历及递归调用的算法,相当于对树的广义优先,深度优先遍历,最后给出对目录树遍历操作的实例。  相似文献   

6.
研究了XML路径表达式的相关查询算法,提出了基于标注后缀树的XML路径表达式公共子查询的优化算法,通过冗余消除技术来提高路径表达式的查询效率·在REOA测试集上,通过对设计的查询进行测试,分析了基于标注后缀树的XML路径表达式公共子查询的优化算法的性能·实验结果表明,基于标注后缀树的XML路径表达式冗余消除技术可以极大地提高路径表达式的查询效率·  相似文献   

7.
提出了一种基于八邻域网格聚类的多样性XML近似查询算法.首先给出了支持XML文档间语义距离计算的3种编辑操作代价模型,再利用XML文档间的语义距离建立XML文档的向量模型并设计基于八邻域网格的XML文档聚类算法,进而利用聚类过程中得到的物理和逻辑聚类中心对静态有序选择算法的查询评估策略进行优化,这样做只需定位聚类中心所在组群的局部范围,并在该范围内进行目标查询,而无需遍历整个XML数据库,从而快速返回满足用户需求的查询结果.经汽车外形智能化设计实验表明,所提算法的查询速度比静态有序选择算法平均提高了3~4倍.  相似文献   

8.
针对面向对象XML数据的两种存储模式:集中式和分布式,基于两种存储模式的存储结构信息的路径仓和存储XML数据的数据仓,分别设计并实现了面向对象XML的查询代数.采用支持继承的扩展XML-RL查询语言,使用多态元素、多态引用、独占元素和独占引用四种典型查询,分析了两种存储模式的性能.结果表明查询多态元素和独占元素时,集中式优于分布式,而查询多态引用和独占引用时分布式优于集中式.  相似文献   

9.
BTCS:基于二叉遍历的XML文档编码模式   总被引:5,自引:0,他引:5  
XML文档数据的编码模式与索引技术决定了基于纯XML数据库的XML查询效率,在正则路径表达式实现方面有重要意义.基于树遍历的XML文档编码在更新与结构关系判断方面存在不足.为了解决此类问题,作者作了如下工作:(1)提出一种新的基于二叉树遍历的XML文档编码模式BTCS(Binary Traveling Coding Scheme);(2)实现了BTCS编码算法,支持XML文档更新,提高了编码更新效率;(3)在常数复杂度的时间内快速准确判断XML文档结构树中任意两个结点之间的父子以及祖孙关系,并能计算它们的辈数差(Distance of Genera-tions);(4)通过详细实验证明了BTCS编码模式的良好性能.  相似文献   

10.
XML数据存储方法的研究   总被引:3,自引:0,他引:3  
分析了当前已有的XML数据存储方法,指出了这些方法存在的不足。对如何存储和查询XML数据等问题做了详细的探讨,提出了一种基于对象一关系数据库的XML数据存储方法。实验结果表明,与传统的方法相比,本方法生成的关系表较少且所需的存储空间小,基于本方法的查询所需的联结较少,因此能有效地存储XML数据并提高查询的效率。  相似文献   

11.
为了解决现有的钓鱼网页分析方法,往往基于页面的文本特征,而忽略了页面的结构特征的问题,提出基于文档对象模型(document object model,DOM)结构聚类的钓鱼检测方法,其关键在于如何快速有效地计算网页的相似度。首先对获取的页面进行DOM结构解析,构建DOM树层次标签向量以刻画网页的结构特征;然后重新定义DOM树距离的概念,通过不同DOM树之间的距离来度量网页间的相似度;最后采用划分聚类思想实现网页的聚类。一系列的仿真实验表明,方法具有较高的召回率与精确率,运行时间也较短。  相似文献   

12.
几种微阵列基因表达数据分析方法的比较   总被引:1,自引:0,他引:1  
比较了微阵列基因表达数据处理中的几种方法,包括等级聚类、K-means方法、模糊聚类和自组织树.同时从算法中计算机的时空复杂度和结果的生物学意义两方面,对以上几种方法作了细致的讨论.结果显示,模糊聚类和自组织树都是较理想的方法.  相似文献   

13.
14.
15.
利用三种不同的聚类方法——利用类均值的最小距离聚类、利用类均值的最大距离聚类和利用最大间隔准则聚类,提出了三个基于SVM的决策树多类分类器.为了检验所提算法的有效性和先进性,对AVIRIS遥感图像进行了实验.实验结果表明,本文所提的三种算法明显好于最小距离分类法、线性判别分类法、决策树分类法、OAR-SVM和OAO-SVM.  相似文献   

16.
针对传统自组织聚类方法处理数据在多维空间中存在多样性和从基本或低层次概念上发现强关联规则中的不足,提出了一种基于自组织分级聚类的数据挖掘方法.该方法采用最大似然分类自组织特征网络(MAXNET)聚类过程,利用自下而上聚合层次聚类方法,对有畸变的二值化输入模式作最大似然分类.最后对一个销售电脑商场中,与任务相关的交易数据集进行了分析,描述了从低层次概念到高层次概念的相互关系.并用matlab仿真软件把该方法和传统方法进行比较,表明了该方法的有效性.  相似文献   

17.
在借鉴空间数据挖掘技术的基础上,定义了移动对象轨迹之间的时态距离和平均距离,提出了标准差法和置信区间法两种轨迹聚类算法。两种方法能够找出所有具有相似轨迹的对象对,在不同距离采样点数的基础上配合使用两种方法能够明显降低轨迹聚类算法的时间复杂度。基于标准差法和置信区间法的轨迹聚类算法在仿真数据集和真实数据集进行了验证。表明两种方法能够为其他轨迹聚类算法进行数据筛选,筛选后的数据量将大大减少,从而可提高算法效率。  相似文献   

18.
在迁移小波树的基础上提出了带放大器的迁移小波树(ASWT)结构,并基于该结构设计出了一个能够在线性时间内检测出弹性窗口中感兴趣的聚集的流数据弹性跳变检测算法.该算法不仅能够监测单调聚集(COUNT、SUM、MAX和MIN)跳变,也适应非单调聚集(AVG)跳变检测.输入数据流不受限制,可以是正数流、负数流或者正负数交错流.实验使用上海证券交易所的实时贸易数据监测交易高峰期和股票价格的涨停期,结果表明本算法是较高效的.  相似文献   

19.
为解决有限区域内分布的稀疏不均的、具有一定分布结构数据集的聚类分析难题,在近邻思想、网格化空间划分及万有引力叠加原理的启发下,提出了一种基于单元网格近邻势的聚类方法。该方法是基于近邻势的聚类方法在单元网格层次上的一种可以提高聚类速度的扩展。为有效实现并在时空效率上对这种聚类方法进行尽可能的改进,使用了单元网格、网格密度、多维网格划分法、多维索引树等一些比较重要的概念和方法。仿真实验中, 先使用多个不同类型的人工数据集将提出的算法与几个经典聚类算法在聚类精度、聚类速度等方面进行适当的比 较,采用两副图片在RGB(red, green,blue)色彩空间的像素点集来验证该算法的聚类压缩效果。仿真实验说明了这种方法比一些经典的聚类算法在聚类建设、聚类质量方面具有一定的有效性和优越性  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号