共查询到19条相似文献,搜索用时 957 毫秒
2.
为了解决目前存在大量XML文档无模式定义的问题,提出一种XML文档模式的自动构造算法.该算法以XML数据为输入,输出具有通用意义的文档模式,再根据具体要求转化到所要求的文档定义类型.实验证明,该模式构造算法确实可行,且具有较好的通用性,可应用于模式的自动生成、XML数据模式挖掘等方面. 相似文献
3.
Deep Web查询接口分类是实现Deep Web在线数据库分类访问的主要方法,本文在研究查询接口特征数据抽取和表示的基础上,通过对查询接口所在Web页的位置来构建对应的接口特征XML文档,根据XML文档中的节点位置不同,分别为不同的查询接口特征赋予不同的分类权重因子,以提高有效特征的分类能力,并采用信息增益算法实现最终分类特征的选择,然后采用KNN分类算法实现查询接口分类,实验结果表明此方法的实际可行性. 相似文献
4.
为了实现XML查询到SQL查询的转换,提出了一个基于XQuery查询和JDOM的转换框架和算法.设计了核心组件查询转换器,将XML查询语句定义为XML查询文档,使用JDOM解析XML查询文档,抽取出SQL语句的各个组成部分.该算法简洁并具有较高的通用性. 相似文献
5.
根据XML语言编码特点,给出了基于XML文档数字水印的方案和算法.该算法在没有改变XML文档长度及显示效果的前提下,保证水印不易被察觉并具有良好的抗攻击性能.实验结果表明:该方案具有较好的隐蔽性和鲁棒性,在解决网页的安全保护问题上有一定的应用价值. 相似文献
6.
基于Hole-Filler模型的XML流数据剪切分片技术 总被引:2,自引:0,他引:2
对基于Hole-Filler模型的XML流数据剪切分片问题,首先利用XML文档的Document Object Model(DOM)结构,根据节点扇出度提出了基于DOM的XML流数据剪切分片策略及其算法.然后,在此基础上,对标签结构进行剪切以确定文档的剪切点,提出了基于标签的XML流数据剪切分片算法,有效地减少了节点扇出度与阈值的比较次数.最后,提出了优化的剪切策略,根据阈值与节点扇出度的比值对XML子树加以整合,以减少碎片的产生.实验结果表明,XML剪切算法在剪切时间、分片粒度等方面都有较好的性能. 相似文献
7.
在阐述了XML加密控制策略的基础上,结合煤矿安全综合监控系统的实际应用需求,针对不同工作人员对不同数据的访问请求,提出了按照用户角色划分,在不重构XML数据文档的基础上,对不同用户请求的XML数据实现动态加密。详细分析了用户请求访问数据的流程结构,加密策略及根据用户角色对XML文档进行动态加密的算法实现。实践表明,以XML文档为数据载体,并用XML格式定义加密策略集,实现对不同角色用户数据的动态加密,方便、灵活、易于扩展,有一定的实际应用价值。 相似文献
8.
结合局部编码思想和全局编码思想提出了一种支持动态调整的XML文档树节点编码方案,设计了节点的动态调整算法.在动态调整算法中引入了局部编码块增位的方式,有效地解决了现存编码在动态变化的XML数据的重新编码方面效率较低的问题. 相似文献
9.
XML与数据库的映射技术研究 总被引:2,自引:0,他引:2
XML作为实现数据库间数据交换的载体,如何使XML文档导入数据库以及如何使数据库中的数据转换为XML数据是关键问题所在.论述了XML文档与关系数据库间的映射规则算法、XML文档与面向数据库间的映射规则算法及基于XML异构数据库间的映射规则. 相似文献
10.
11.
针对密集型数据查询要消耗大量内存的缺陷,设计了一种基于流的XM L文档查询算法.该算法在对XM L流的一次单向读取过程中处理XPath,接收查询表达式,将表达式转换为树形自动机,自动机以流的方式接收并处理XM L文档,同时输出当前处理结果.在查询树状态转换过程中附加了缓存操作,用于保存XM L流中暂时无法判断的文档片段.算法测试表明其占用内存空间基本恒定,不会随被查询文档的增大而增加. 相似文献
12.
与传统数据库对XML数据的处理不同,对XML流数据的处理不仅受实时性的约束,还受存储空间的限制.在Hole-Filler模型的基础上,首先利用XML的查询统计信息,定义了路径频率树,提出了基于兄弟关系的XML流数据剪切分片策略及其算法.在此基础上,提出了基于父子关系的XML流数据剪切分片策略及算法.这两个基于路径频率树的剪切算法有效地提高了XML片段的利用率,增强了XML片段的内聚性.实验结果表明,基于路径频率树的XML剪切算法在剪切时间、查询时间、空间消耗等方面都表现出较好的性能. 相似文献
13.
通过对SAX技术的深入分析,提出以SAX流驱动的控制方式操作和解分析XML的数据流,避免了现阶段普遍应用的XML解析器,如DOM、JDOM等,对大规模XML文件一次性读入内存解析时占用较多资源甚至产生流溢出的问题,实例演示了SAX对XML的控制及这两种技术在SCADA中的使用方法。 相似文献
14.
数据流中噪声数据的处理是当前数据流分类挖掘中重要的研究分支,近些年来得到了广泛的关注.本文提出了一种称为FDBCA的数据流分类算法.它使用基于密度的带有噪声的空间聚类(DBSCAN)的改进算法Fast-DB-SCAN(FDBSCAN)处理噪声数据,并利用错误率方差(MSE)来检测概念漂移.同已有的数据流分类算法相比,实验结果表明了FDBCA算法可以提高噪声数据流的分类精度. 相似文献
15.
针对XML数据流可能具有复杂的递归层次结构,提出一种XML数据流小枝匹配算法TwigPM.通过获取查询节点的结构关系,进行有效的剪枝操作,减少了处理时间和数据所占用的内存空间.实验结果表明,算法具有高效性. 相似文献
16.
在分析Web内容挖掘特征的基础上,提出一种基于XML技术的Web内容挖掘模型.利用HITS算法确定权威Web页面,利用HTMLTidy工具将非XML文件经过数据清洗后转换成结构良好的XMI。文档,结合互联网上传统科技论文的自动抽取系统实例,采用文本聚类分类技术进行面向XML文档数据的数据挖掘.实验结果表明,该模型工作良好,可以自动、有效地提取网页内容. 相似文献
17.
现今,XML数据管理的一个重要问题是如何对XML数据进行高效的查询处理。以XML数据流的压缩为目标.提出了一种基于BloomFilter的XML数据流压缩技术,利用Dom4j的Aelfred2解析器对XMLSchema进行解析,构建dom4j树。采用压缩布鲁姆过滤器思想进行算术编码,达到压缩的目的。 相似文献
18.
在大数据环境下,由于隐私保护、数据丢失等原因,数据普遍存在不确定性;数据流系统中数据不断地到达系统,只扫描一遍且不能一次性全部获得;所以要构建一个增量分类模型来处理不确定数据流分类.本文基于VFDT算法提出了WBVFDTu算法,该算法在学习和分类阶段都可快速而有效地分析不确定信息.在学习期间,采用Hoeffding分解定理构造决策树模型;在分类期间,在决策树的叶子节点利用加权贝叶斯分类算法提高模型的分类准确率和算法的执行效率.最终证明该算法能够非常快速地学习不确定数据流,提高分类的准确率. 相似文献
19.
在数据流分类学习过程中,类不平衡和概念漂移是两大挑战问题.在分析传统特征选择算法和代价敏感学习方法的基础上,将代价敏感学习算法的思想引入特征选择算法中,设计并实现了一种基于代价敏感的Relief F剪枝的数据流分类算法,不仅能删除冗余的特征,而且适应动态变化的数据流环境.与经典的算法进行分析比较,结果表明所提算法可显著提升分类效果. 相似文献