首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
当处理的半结构数据时,从中挖掘出其隐含的结构显得愈来愈重要了,不仅对于用户而且对于整个系统来说,其重要性也是不言而喻的.算法structure_discovery将聚类算法应用到半结构化数据的结构发现上,将描述同一类对象的共有结构按照相似度聚集到一起形成类,然后从类中发现满足用户兴趣度的结构.与同类算法比较,structure_discovery为增量式算法,同时,聚类技术的使用提高了结构发现效率.  相似文献   

2.
为解决当前可扩展标记语言(XML)绑定框架普遍存在的由XML模式映射生成的数据类的冗余,以及数据类系统规模过大的问题,提出一种从一组相关XML数据文件的数据实体类识别方法.该方法先抽取这一组XML数据文件的XML模式树图,并将其每个节点表示成向量空间中的向量;然后,利用相似度和距离识别该模式节点对应的预定义模式节点类型;最后,按模式节点类型到类的映射规则得到数据类.结果表明:该方法能识别合并对应同一个实体的数据类避免类冗余,将集合类型的XML文件映射成泛型类和集合类减小生成类系统的规模.  相似文献   

3.
流式文档结构识别对于文档自动排版和优化、信息检索等领域有着重要作用.以往针对流式文档结构识别主要集中于学术论文领域,对于其他诸如公文、报告等多类型的文档结构识别研究较少.针对此现状,使用聚类的方法对文档进行分类,在此基础上提出了针对不同文档分类的、基于双向门控循环单元-条件随机场(bidirectional gated recurrent unit-conditional random field,BIGRU-CRF)的文档结构识别方法,以此来解决多类型文档结构识别的问题.实验结果表明,该方法不仅能够提高学术论文结构识别的效果,对其他类型的文档结构也能够进行较好地识别.  相似文献   

4.
XML文件可以利用树状结构来表示,于是把如何将XML文件做聚类看成如何对树状结构的数据作聚类.使用SOM聚类工具搭配上Jaccard 的距离测量公式来对XML 文件做聚类,然后在每个cluster 中利用GST(Graph Search Technique)算法从这些XML文件当中找出他们的最大序列,最后将这些最大序列融合起来成为共同的结构.  相似文献   

5.
集合是数据的逻辑结构中最基本的一种类型,包含的数据元素之间各关系相对其他数据类型简单明了.对于多个集合交运算结果为空的不相交集合,可以通过不同的形式来表示它的存储结构.使用链表和森林的方式来表示不相交集合的存储结构,并在不同表示方式下对涉及到的一些基本操作进行分析讨论,有利于人们在实际应用中提高数据处理效率.  相似文献   

6.
以鄂尔多斯盆地环县地区15口钻井的测井、岩芯、物性测试和试油资料为基础,运用沉积学、基准面旋回层序地层理论方法,研究了鄂尔多斯盆地环县地区延长组长8-长6油层组层序界面级别、类型和特征,并识别出2个长期旋回、8个中期旋回以及若干个短期旋回.解剖了中短期次基准面旋回层序的结构样式,将其分为低可容纳空间向上变"深"非对称型(A<,1>型)、高可容纳空间向上变"深"非对称型(A<,2>型)、以上升丰旋回为主的不完全对称型(C<,1>型)上升半旋回与下降半旋回近乎完全对称型(C<,2>型)和以下降半旋回为主的不完全对称型(G<,3>型)5种类型.不同类型的基准面旋回层序结构对储集砂体物性的控制作用差异明显,长8、长6油层组三角洲前缘河道砂体明显受A型层序控制,而长7油层组浊积砂体则受C型层序控制.试油资料和物性资料表明,在三角洲前缘环境中发育的具A<,1>、A<,2>型层序结构砂体和在浊积扇环境中发育的具C<,2>、C<,3>型层序结构的砂体是深入勘探重点关注的储集砂体.  相似文献   

7.
《平顶山学院学报》2013,(6):115-119
列锦作为汉语一种重要的修辞现象,早在先秦时代的《诗经》中便有运用。之后,随着中国文学的发展,在诗歌、词曲、散文、小说等文体中都有出现,并且在结构形式上有了很大发展变化。纵观汉语列锦辞格结构形式的发展变化,其基本类型大致可以归纳为两大类若干小类:(一)不带结构助词或连词的形式,分为单句式、双句式、多句式;(二)带结构助词或连词的形式,分为带"之"式、带"和"式、带"与"式、带"的"式、带"的"兼"和"式、带"的"兼"与"式、带"的"兼衬字式。前一大类主要出现于古代文学作品中,后一大类主要出现于近现代文学作品中。  相似文献   

8.
xml作为一种数据表示方式,越来越为人们所接受.最近,基于xml/半结构化数据的索引的查询引起了人们的广泛关注.有人提出来用结构索引来支持基于xml/半结构化数据的查询.由于xml/半结构化数据的结构不严格、不规则,结构索引会随着数据的增加或删除而变化,维护结构索引就成了首要问题.本文研究了在xml文档集合上增加多个文档和删除一个文档时结构索引的更新,提出了在这两种情况下的索引维护算法,这两种算法比现在已知的其它算法的性能要更优秀.  相似文献   

9.
邯郸市域土地利用结构与经济结构关系分析   总被引:1,自引:0,他引:1  
运用系统聚类法对邯郸市域各区域土地利用类型结构和经济结构分别进行分区,分析两种类型结构之间的关系,并在此基础上,提出了邯郸市土地利用结构调整的方向和对策,以期促进邯郸市经济发展.  相似文献   

10.
借助于比较分析、多变量聚类与Nelson统计分析等方法,动态研究中部地区城市整体职能结构与类型变动特征,得到如下结论:(1)第二产业内部制造业与建筑业职能下降、能源生产与采掘业职能地位上升,第三产业内部服务管理职能地位迅速上升而流通职能下降,职能层次趋于提高.(2)不同规模组城市职能结构变动程度不同,小城市变动最强,特大城市次之,大中城市最弱;无论是各规模组还是各省域均体现出金融房地产业,科教文卫与行政部门和能源生产与采掘业上升而商业、社会服务业、制造业、交通业下降的态势,仅建筑业在不同组别之间存在差异.(3)城市整体职能类型变动程度较大,小城市跨大类变动的比例最高,特大城市次之,大中城市较少.城市整体和各省域城市类型分布趋向多样化发展.  相似文献   

11.
Web的半结构化数据模型和查询模型   总被引:4,自引:0,他引:4  
通过介绍半结构化数据的特点,说明了半结构化数据适合于描述Web上的数据,并讨论了Web的查询特点以及Web查询模型的研究情况  相似文献   

12.
本文叙述了一个面向复杂环境建模的语义元模型:CEOOM,它是基于扩充的实体-关系模型,并从语义模型和面向对象的方法吸收了许多有用的概念和机制,模型定义了ISAT类型层次和基于类型层次的继承机制,定义ASAT类型层次和角色的概念,定义了ISAR关系层次和一般关系导出机制,并为复杂建模提出了超实体、超模型和模型层次的概念,为概念模型设计中采用自顶向下或由下而上的方法提供了方便,也为企业中各类层次的管理人员获得他们各自所需的信息提供了基础。  相似文献   

13.
半结构化数据正以其灵活性而成为解决Internet环境下互操作语义层面问题的重要工具和网络数据交换格式的标准.从基础理论层面上对版结构化数据进行研究,在考察了进程代数和空间逻辑的有关结果后,从模型和逻辑系统的角度对半结构化数据特别是XML语言进行刻画.在[1]的基础上,在数据模型中加入了受限算子,并提出一种新的空间逻辑——树逻辑,在其中引入了一个新的模态算子,它们的意义在于能够对私有数据的性质进行刻画和表达.此外,通过修正数据模型中的同余关系,使得模型符合数据的有序性,从而使其更为合理.在此基础上证明了树逻辑系统公式可满足性的不可判定性,从而说明针对整个树逻辑系统的模型检测算法是不存在的.同时选择了其中一个子逻辑系统,给出了其模型检测算法,并证明了该算法的正确性.  相似文献   

14.
一种XML数据到结构化数据的转换方法   总被引:2,自引:0,他引:2  
分析半结构化树状层次结构的XML文档的结构特征,描述XML结构与关系数据库的对应关系.给出XML文档的DTD中各主要元素与关系数据模型之间的映射规则,设计转换规则脚本的自动生成算法和数据转换算法.  相似文献   

15.
本文介绍了FCAD系统中三类家具零件几何模型与层次式数据结构的设计考虑。重点讨论了家具中零件—部件—家具的层次原则和刻划这种层次关系的数据结构中的树和链表的表示。还分析了这种层次结构表示方法对提高系统操作(例如隐线消除,视图生成和材积计算等)效率所带来的益处。  相似文献   

16.
为解决多种类、多维数的异构海洋观测数据的读取问题,运用面向对象的思想对NetCDF文件中的元数据和数据进行对象化,提出了包括文件、维度、属性、变量和其类型等的类层次构建方法。以组件技术对其进行封装,并和网格、树以及绘图组件集成为桌面化读取软件,把海洋观测数据以二维表格和图像可视化的方式直观形象的表达出来。该软件运行稳定,系统耦合度低,能够满足当前数据读取的需求。  相似文献   

17.
基于深基坑开挖过程中,不同实体的几何参数、物理参数和力学参数之间的关联性,提出深基坑参数融合数据模型,实现将深基坑的几何模型和力学模型统一在一个框架之下.根据面向对象的编程思想,采用C++语言对各基坑实体进行描述,为模型设计一个能够体现各基坑实体类之间层次关系的数据结构,并开发了深基坑三维建模与风险预警软件.将开发的软件应用于上海市汉中路地铁车站深基坑项目,结果表明,该数据模型很好地实现了不同基坑实体之间的关联,可以有效地预测深基坑施工过程中的潜在风险.  相似文献   

18.
提出了利用数据流分析的方法来恢复基本数据类型,该技术首先利用数据流分析对变量进行重命名,然后使用变量推导规则推导变量的数据类型,得到的数据类型构成一个类型集合,最后根据得到数据类型集合的3种情况,选取合适的类型作为生成C语言程序中变量的数据类型.  相似文献   

19.
多维数据模型是数据仓库和联机分析处理中的一个重要环节。文章提出了一种新的多维数据模型。在该模型中,基于维与事件的关系,描绘了多维事件关系图,并利用非奇异聚集偏序集簇定义了维的结构。结合小灵通客户流失问题,给出了该模型的具体的实现。  相似文献   

20.
具有分层结构的综合评价系统及其模型数据库的研究   总被引:6,自引:0,他引:6  
在对多指标综合评价系统进行分析的基础上,提出了具有分层结构的综合评价系统DLCES的概念,并对其框架结构,数据转换作出分析,给出四元总体的相关模型数据库结构的设计方案。在具体实现上采用模型字典的方法对综合评价系统的多模型结构予以描述,在对模型库结构的处理上采用了层次路径结构方式。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号