期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

基于Huffman编码的XML数据压缩方法 总被引：1，自引：0，他引：1

施鹏李敏于涛赵利强王建林《北京化工大学学报(自然科学版)》2013,40(4):120-124

针对一定网络带宽下生产过程报表系统对大型数据源访问速率不高的问题,提出了一种基于Huffman编码的XML数据压缩方法。通过构造数据处理类获取XML文档中重复率高的节点单元,采用Huffman编码对节点单元进行编码,将编码后文档利用LZMA算法压缩,构建了Huffman-LZMA压缩算法,并将该压缩算法应用于生产过程报表系统设计。实际应用结果表明,该压缩算法对生产过程报表数据源的压缩率达到约88%,有效的节省了网络带宽和存储空间,提高了报表系统的访问速率。相似文献

2.

基于Schema文档的XML文档验证系统的设计

王霜《沈阳师范大学学报(自然科学版)》2010,28(2):229-232

XML(Extensible Markup Language),即可扩展标记语言。为保证文档的有效性,任何应用程序在执行关于XML数据的计算和转换之前,必须对XML文档进行验证。在完成对待验证的XML文档的封闭性检测之后,对XML文档和其相对应的Schema文档的数据结构进行检测,判断一下它们的树结构是否完全同构。再利用DOM技术读取Schema文档树和XML文档树的各节点,判断XML文档树各节点是否符合与之相对应的Schema文档各节点所定义的规则。具体来说,包括:类型定义部件,组部件,属性组部件。该系统可以顺利地检测待验证的XML文档,基于Schema文档规则,在满足封闭性和同构性的前提下,可以判断并指出XML文档的错误信息,并对其进行定位。相似文献

3.

基于模板的XML文档表示技术研究 总被引：1，自引：1，他引：0

黄立冬王新施国兴陆歌皓《云南民族大学学报(自然科学版)》2008,17(4)

大体积XML文档包含大量的冗余数据,因此它在网络上传输时存在有效传输效率低、浪费带宽等问题.针对大体积XML文档在网络上传输所存在的问题,提出了一种基于模板的XML文档表示方法,经实验证明本方法在一定程度上提高了大体积XML文档网络有效传输效率. 相似文献

4.

文档图像在数据库中的存储检索方法研究与实现

王福宝阎瑞华许春蕾《佳木斯大学学报》2009,27(4):532-534

提出一种基于XML的文档图像在原生数据库中存储和检索的新方法,该方法将文档图像切分标记为XML文档,将此类XML文档存储到原生数据库中;利用XML:DB API接口对XML数据进行查询和管理,XSL样式表完成XML数据的显示. 相似文献

5.

基于SAX模型的XML文档更新算法研究

倪德明谭帅潘志宇《中山大学学报(自然科学版)》2005,44(Z2):111-115

XML作为交换资料的标准,广泛应用于分布式系统中,但是在使用XML DOM来处理大型XML文件时,会占用过多的存储器资源并需要更多的CPU时间.提出一种基于SAX模型的XML 文档更新算法,利用SAX模型占用时间和空间少的优点进行文档的更新.形式化地定义了XML文档的更新脚本,使用X-Path来表示所更新的文档节点,在XML文档的SAX扫描过程中,生成XML文档的节点的X-Path,从而判断文档节点是否需要更新,然后通过将更新脚本应用到需更新文档实现文档更新. 相似文献

6.

基于冰冻结构的XML文档聚类研究

李巍孙涛叶苑苑李雄飞李楠《吉林大学学报(信息科学版)》2009,27(6):611-618

为了挖掘XML(Extensible Markup Language)文档在历史变化过程中不经常发生变化的结构所蕴含的知识,给出了发现冰冻结构的方法,使用一组冰冻结构组成的文档向量模型代表一个XML文档,并使用加权Jaccard系数作为相似度,利用基于XML文档历史变化过程中相对稳定的冰冻结构对XML文档进行聚类。经过实验证明,基于冰冻结构能够将XML进行有效的聚类,聚类后每簇中的XML文档具有相似的不经常变化结构。相似文献

7.

数据库中XML文档的存储研究

朱连军董雪《河南教育学院学报(自然科学版)》2009,18(3):35-37

提出了一种利用DTD的结构信息将XML文档映射到数据库中的的方法.在该方法中,不同DTD的XML文档可以保存在相同模式的关系表中,仅需两张表就能存储所有的DTD和XML文档. 相似文献

8.

基于Domino的XML文档存储研究

李隽波《江汉大学学报(自然科学版)》2005,33(3):59-63

Domino和XML结构的相似性使XML文档可以方便有效地存储在Domino表单、域、页面、文件系统中,不需存储的XML数据可以在系统内存中处理.文章采用两种方法实现了XML文档在Domino中的存储:把XML原始数据存储在Notes域中,生成DOM(Document Object Model)树,通过遍历整个DOM树,按节点创建多个Notes文档;或者把XML原始文档调入系统内存,在内存中解析成DOM树,并只对包含所需数据的DOM树节点的子集进行处理,创建Notes文档. 相似文献

9.

基于XFP-tree的XML结构重构策略

刘波 ;杨路明 ;翟学敏 ;邓云龙《中国科技论文在线》2008,(2):85-92

基于海量XML文档查询速度已不能满足日益增长的信息关联和服务请求多样性的需求,本文提出一个重构XML结构的频繁向量选择增量模式树（XFP-tree）算法,该算法以XML键为基础,首先对XML结构进行向量矩阵处理,再通过投影频繁模式树实现对XML结构进行分裂、合并、更改与取消等优化措施,满足XML结构简洁性与查询多样性;结合投影和树结构技术,讨论XML键向量矩阵频繁项集的划分规则,而相应启发式策略的制定与支持度阈值的讨论有利于算法效率的提高。对比其它关联算法,一系列仿真实验表明所提出的算法具有一定的有效性及合理性,是重构XML结构的一种有效方法。相似文献

10.

识别和抽取XML文档中的关系信息及其出现模式 总被引：3，自引：0，他引：3

雷庆吴扬扬《清华大学学报(自然科学版)》2005,45(9):1757-1761

Web中存在着大量描述实体间相互关联的信息,而目前的搜索引擎缺乏知识的处理和理解能力,无法对Web中的关系信息进行识别.该文以XML作为研究对象,提出了一种XML文档中识别和抽取关系信息及其出现模式的方法.该方法按照用户的挖掘请求搜集XML文档;通过计算XML文档的相似度来识别目标文档;建立用户挖掘模式并与目标文档进行模式匹配实现关系数据的抽取.实验结果表明提出的XML相似度计算方法能较好的实现目标文档的识别,同时采用的模式表达和匹配方式也能较准确地从目标文档中抽取出用户所需的关系数据. 相似文献