首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
为了使空间文本数据的处理更加快捷准确,针对基于位置的发布/订阅提出了将R-tree与布尔表达式有效结合的索引结构TR-tree.TR-tree主要由文本索引与空间索引组成,其中文本索引根据订阅中谓词的数量和不同的关键谓词将空间文本数据进行订阅分组和谓词分组.文本索引中使用了操作符列表储存谓词,以达到避免重复储存谓词、减少内存使用的目的.空间索引根据关键谓词与谓词数量构建不同的R-tree,增强了空间修剪的性能.实验结果表明TR-tree具有高效的匹配能力与较好的内存管理性能.  相似文献   

2.
随着XML相关标准和技术的不断推广和应用,网络上出现了大量的XML数据,XML已成为网络数据表示和交换的标准.在海量XML文档中进行精确快速地查询成为当前XML研究的主要方向.由于XML文档自身的半结构化特性,对存储在其中的数据进行查询就需要建立相应的索引并制定特殊的查询算法.对基于文本节点的XML索引进行改进,在原索...  相似文献   

3.
XML在数据交换中的应用越来越广泛,但由于标记引入而使其空间膨胀较大,对传输及存储资源耗费严重。压缩后的XML数据容量明显减少,但怎样基于压缩后的XML数据直接进行高效的查询处理,当前研究工作较少。以反向算术压缩为基本压缩算法,提出针对XML数据库中压缩XML文件的索引结构ArithRegion,基于该索引结构,可高效处理形如//element1/element2/…/elmentm的查询。  相似文献   

4.
一种基于文本节点的XML文档索引   总被引:1,自引:0,他引:1  
XML将逐步取代HTML成为Internet上的主流数据表示及数据交换格式,如何快速准确地对XML文档中的数据进行查询也成为亟待解决的关键问题.因此,需要开发一种适合XML的查询策略以及特殊的索引技术.文章利用一种基于文本节点的XML索引TN—Index,特点是索引文件规模较小,而且可以进行局部查找,这样就实现了XML文档的快速查询.  相似文献   

5.
对XML数据建立有效的索引,是左右XML数据处理性能的重要因素。对XML的索引技术进行研究,提出一种基于Schema的XML数据结构索引,结合Schema的数据字典提出了OB(Orthogonal B tree)树的存储方式,可快速确立元素间关系。与XISS相比明显减少元素访问及路径连接次数,从而缩短路径查询的响应时间。  相似文献   

6.
针对传统文本索引技术空间消耗大、分词不准确等问题,设计并实现了高性能文本索引系统。该系统采用压缩的全文自索引算法,节省了空间开销,避免了自然语言分词方法的影响,配合通配符搜索算法扩展了模糊搜索的功能,在众核CPU高性能处理器上可实现多线程并行处理,提高了处理速度,整个系统的实现是基于Web方式的,可以跨平台运行。实验结果表明,该系统将文本索引的空间消耗降为原文本的50%左右,具有较高的实用价值。  相似文献   

7.
针对传统文本索引技术空间消耗大、分词不准确等问题,设计并实现了高性能文本索引系统。该系统采用压缩的全文自索引算法,节省了空间开销,避免了自然语言分词方法的影响,配合通配符搜索算法扩展了模糊搜索的功能,在众核CPU高性能处理器上可实现多线程并行处理,提高了处理速度,整个系统的实现是基于Web方式的,可以跨平台运行。实验结果表明,该系统将文本索引的空间消耗降为原文本的50%左右,具有较高的实用价值。  相似文献   

8.
对 XML 数据建立有效的索引,是左右 XML 数据处理性能的重要因素.对 XML 的索引技术进行研究,提出一种XML 数据结构索引,结合 Schema 的数据字典提出 OB(Orthogonal B tree)树的存储方武,可快速的确立元素间关系.与 XISS 相比明显减少元素访问及路径连接次数,从而缩短路径查询的响应时间.  相似文献   

9.
XML索引技术已成为一种重要的XML数据管理技术。本文着重介绍两种XML索引技术并作出比较分析。  相似文献   

10.
流行的数据库管理系统通常实现了全文检索子系统,从而方便对数据库表中的文本数据建立全文索引,进而借助于这个索引来检索文本数据.达梦数据库管理系统提供多文本数据检索服务.包括全文索引和全文检索.达梦数据库实现了全文检索系统.但是此系统存在着索引膨胀率过高,索引填充时间较长的问题.全文检索,是一门综合性很强的技术.它牵扯到了很多的技术点,主要有分词技术,数据源提取和文档解析技术,相关度计算技术,存储技术.压缩技术等.  相似文献   

11.
基于Huffman编码的XML数据压缩方法   总被引:1,自引:0,他引:1  
针对一定网络带宽下生产过程报表系统对大型数据源访问速率不高的问题,提出了一种基于Huffman编码的XML数据压缩方法。通过构造数据处理类获取XML文档中重复率高的节点单元,采用Huffman编码对节点单元进行编码,将编码后文档利用LZMA算法压缩,构建了Huffman-LZMA压缩算法,并将该压缩算法应用于生产过程报表系统设计。实际应用结果表明,该压缩算法对生产过程报表数据源的压缩率达到约88%,有效的节省了网络带宽和存储空间,提高了报表系统的访问速率。  相似文献   

12.
XML中的信息隐藏   总被引:3,自引:0,他引:3  
XML作为Internet上的信息交换格式,XML(Extensible Markup Language,可扩展标记语言)一出现, 使得到广泛的应用和支持,它将掀起新一轮数据处理和网络应用开发的革命.XML不是一种普通的文本语言,它用于置标电子文档,是一种使其数据具有结构化的置标语言.利用XML的这一特性,可以将秘密的信息隐藏到XML文本中. 这种方法主要是基于XML不是一种普通的文本文件,而是一种结构化的丈本.通过改变XML的标示字体的物理特性, 或变换DTD声明及其应用能量中的原始XML文档的逻辑结构,将信息隐藏到XML的原始文档中.  相似文献   

13.
XML文档集的结构连接算法研究   总被引:1,自引:0,他引:1  
针对XML文档集进行结构连接时,因数据量大且需要进行文档之间的比较而产生了定位复杂的问题,提出了一种利用栈实现基于缓存的结构连接算法。实验结果表明,该方法有效实现了XML文档集的结构连接计算。  相似文献   

14.
在分析Web内容挖掘特征的基础上,提出一种基于XML技术的Web内容挖掘模型.利用HITS算法确定权威Web页面,利用HTMLTidy工具将非XML文件经过数据清洗后转换成结构良好的XMI。文档,结合互联网上传统科技论文的自动抽取系统实例,采用文本聚类分类技术进行面向XML文档数据的数据挖掘.实验结果表明,该模型工作良好,可以自动、有效地提取网页内容.  相似文献   

15.
分析了DBXML的体系结构.针对其采用的文本存储方式在XML文档的存储、查询和更新效率等方面的问题,提出并实现了基于树结构的存储方式,保证了较大的XML文档的查询和更新效率,并给出了两种方式的对比分析.  相似文献   

16.
As our best knowledge, in the Publish/Subscribe application environment, few research work has been done on the dissemination and routing of compressed XML (extended markup language) data. A high-speed compressed XML data routing and dissemination framework BloomRouter is proposed. In BloomRouter, a Bloom Filter based prefilte ring mechanism is used to filter out compressed XML elements that users do not care; after that an interval tree dis seminator forwards target elements to the corresponding end users by matching the incomming compressed XML elements with indexed users' query regions. Based on this framework, we can efficiently filter/query the compressed incoming XML data, and then route the query result to the corresponding subseriber.  相似文献   

17.
基于文档构件化技术的文档创作是提高文档生产率和文档质量的一条有效途径,可复用文档构件技术是使文档更加成熟的关键点.首先介绍了有关知识管理的相关知识,体现出对知识管理中显性知识———文档进行管理的充要性,并提出文档构造过程中存在的大量重复劳动的问题,提出了基于软件构件与复用理念的构造方式,接着,本文基于XML语言,对“文档构件化”过程中关键部分进行了定义、抽象、Schema设计、解析与组成分析,以及后期的构件存储分析,把文档构件归纳为3类主要构件,并对这3类构件的应用进行了设计.最后,以特殊领域文档为应用实例,设计出实现文档构件化与复用的文档构造模块.  相似文献   

18.
目的解决XML技术在物流数据交换中产生的庞大信息量影响物流数据交换效率的问题。方法通过结合XML文档的层状嵌套结构和自描述特点,使用数据压缩技术。结果提出了一种支持在压缩数据上进行查询的XML数据压缩算法。结论降低了物流系统负荷,提高了物流数据的处理效率。  相似文献   

19.
基于混合映射的XML数据的关系存储和查询   总被引:3,自引:0,他引:3  
XML数据关系存储有很多优点,但必须将XML的树型结构映射为关系表的二维表结构,以基于结构的映射方法为基础,根据XML数据和查询的特点,结合纯XML查询的优点,提出使用混合映射来解决XML数据的存储问题,即文本和枚举仍保留为XML文档,其他部分映射为关系数据.  相似文献   

20.
XML作为信息交换的标准。广泛应用于Internet/Intranet计算环境中.根据SAX模型的特点,提出一种基于SAX模型的XML文档更新算法.使用X—Path表示文档结点,形式化定义XML文档的更新脚本;在XML文档的SAX扫描过程中生成结点的X—Path,然后判断结点是否需要更新,将更新脚本应用到文档上实现文档的更新.采用SAX模型,与DOM模型相比,实现对XML文档的动态更新,在时间和空间上取得比较好的效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号