首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 125 毫秒
1.
结构化数据到XML数据的语义映射   总被引:6,自引:0,他引:6  
XML的DTD机制不足以表现结构化数据的语义,本文在路径约束的基础上,提出一种新的语义映射机制,引入域的概念描述结构化数据到XML数据的结构映射,将结构化数据的平面结构映射为XML数据的树状结构,通过有域层次的键规则表达式,将结构化数据中分散在各表中的键的定义映射到XML数据中,利用域的概念和模板匹配的原理,引入域关系表达式及其扩展表达式来实现结构化数据以XML数据的语义映射,由此构成的语义映射机制可以和XML数据的模式抽取很好的集成在一起,体现数据的语义约束并为数据库对XML数据存储和查询的优化提供有效信息。  相似文献   

2.
随着数据元标准的建立,数据元在数据集成中有重要作用.当前数据元的语义是通过自然语言解释的,难以满足计算机自动应用数据元的需求.采用本体的思想,提出了一种形式化的数据元语义描述方法,以领域本体的概念为原子概念,以数据元为复合概念,按照数据元的语义特点,建立树形语义描述结构,并定义数据元语义的XML描述方法及图形描述方法.  相似文献   

3.
语义信息集成是目前屏蔽数据之间半结构性、异构性和分布性的主要方法,其目的是为用户提供最大范围的精确数据。以解决信息集成中的语义冲突为目的,采用本体描述全局数据概念、树型结构描述局部数据概念。在此基础上,给出数据的逻辑定义方法,利用相似度计算匹配值来实现数据在语义集成中的匹配,并描述了语义信息集成中的映射算法。最后给出了实验数据和此方法执行结果,验证了此方法的正确性。  相似文献   

4.
刘凤仙  王晓  李波 《科学技术与工程》2013,13(13):3757-3762
语义信息集成是目前屏蔽数据之间半结构性、异构性和分布性的主要方法,其目的是为用户提供最大范围的精确数据。以解决信息集成中的语义冲突为目的,采用本体描述全局数据概念、树型结构描述局部数据概念,在此基础上,给出数据的逻辑定义方法,利用相似度计算匹配值来实现数据在语义集成中的匹配,并描述了语义信息集成中的映射算法。最后,给出了实验数据和算法执行结果,验证了此方法的正确性。  相似文献   

5.
基于本体的数据集成冲突消解   总被引:1,自引:0,他引:1  
文章在深入分析异构数据集成冲突产生原因的基础上,提出一种使用两层本体来消解数据集成中语法和语义冲突的方法;通过使用数据源模型本体和集成映射模型本体,能够在解决语法和语义冲突的同时进行数据划分和安全控制,可提高数据集成的效率和自动化程度。  相似文献   

6.
一种基于语义网技术和本体的数据集成方法   总被引:2,自引:0,他引:2  
研究语义网技术在数据集成中的应用方法。采用规则系统实现对语义网本体语言的扩展,以提高本体语言的表达能力。在此基础上将语义网相关技术系统地应用到数据集成系统的各个方面,包括数据采集、本体构建、本体映射、数据查询和数据持久化。通过一个实例,展示了上述方法的可行性。  相似文献   

7.
针对网格中语义数据的按需访问问题,提出了基于本体的语义数据融合方法OSDF.该方法以数据对象为基本元素,利用数据对象和领域本体之间的映射关系来表达数据对象的语义,使用嵌套关系模型来表达数据对象的模式信息,通过把一个网格节点中集成的所有数据对象作为下一个节点的数据对象来实现数据资源由粗到细的融合.文中定义了OSDF的语义模型,给出了虚拟数据库的查询执行过程和算法,为使用者提供了具有语义支持、服务质量保障的数据访问服务.原型系统验证了OSDF的正确性和可行性.  相似文献   

8.
油气井工程领域中存在大量的XML文档,传统的XML集成方案无法提供面向语义的信息查询,导致数据利用率不高。针对油气井XML文档WeXML语义集成与查询应用需求,提出一种基于抽取规则和本体映射的语义集成方法。首先定义一系列类、属性抽取规则,分别将WeXML Schema中的元素、属性映射为WeOWL本体中的类和属性;然后,利用实例转换算法将WeXML文档转换为本体实例数据;由于WeOWL提供有限的局部语义模型,需要在两者之间建立语义映射,并借助WeOWL中的术语对全局语义模型中的类和属性进行解释,进而提供面向领域全局本体的语义查询。通过构建WeXML数据语义集成原型系统,对提出的转换规则、转换算法和映射规则进行了验证。  相似文献   

9.
随着大数据时代的到来,互联网所承载的信息呈现出异构性强、价值密度低、来源分布广、实时性高等新的特点.因此在信息检索时,与获取相关网页相比,人们更希望获得页面中包含的知识.RDF作为一种新的知识表示和发布形式,以其精确且易于理解的语义结构得到了广泛的认可和应用.但传统基于语法匹配策略的SPARQL查询方法无法发现RDF数据中不同谓词间的隐含语义,不能从语义层面上获取更加完备的查询结果.针对这一问题,设计了一种新的查询方法来扩充传统SPARQL查询模式.首先分析RDF三元组中谓词的语义属性.在此基础上,根据不同谓词间语义属性的标注,对输入SPARQL语句中具有语义属性的谓词进行扩展,从而给出了一种新的一般化的查询策略.最后通过实验验证了这种语义扩展查询方法的可行性和正确性.  相似文献   

10.
针对现有实体对齐方法大多以本体模式匹配为基础,处理异构关联数据集间对齐关系存在局限性且实体链接缺失问题严重的现状,在分析关联数据语义的基础上,提出了一种独立于模式的基于属性语义特征的实体对齐方法,对关联数据集中实体属性根据语义标签特征及统计特征建模,并采用有监督的可变样本集VS-Adaboost算法实现分类器优化。实验结果表明,该方法的时间效率、准确率、查全率较高,F测度效果较好。  相似文献   

11.
设计隐私保护策略本体,提出一个基于智能体和本体的数据集成的架构,包括知识浏览器、全局本体、局部本体、映射和上下文、隐私保护知识库、隐私策略本体、数据挖掘本体、数据挖掘智能体、集成智能体等,可在保护用户隐私的基础上有效地实现分布异构环境的语义数据集成.并介绍了一个反洗钱领域隐私保护数据集成的实例.  相似文献   

12.
网络环境下数据交换方案的设计与实现   总被引:3,自引:0,他引:3  
通过研究网络环境下数据交换的过程和特点,分析比较了现有数据交换方案的局限性,提出一种基于XML和Web服务的动态数据交换方案.构建符合UDDI2.0规范的UDDI中心;基于该中心注册数据服务,使交互数据在网络环境下易于被发现;服务提供方部署和发布Web服务,实现交互数据的动态提供.为提高数据交换效率,扩展了Web服务的发布方式:将交互数据的模式相关信息连同Web服务描述一并发布至注册中心;服务请求方动态设定查询条件,实现数据的动态获取;通过XSLT和数据语义匹配技术,实现异构数据模式映射和数据的转换.采用Java技术实现了原型系统,对所提出的方案进行了验证.  相似文献   

13.
目前生物学研究十分依赖生物数据的有效性和可靠性。为了构建新的生物知识,来自不同数据源的生物数据必须集成。本文首先介绍了主要的语义网技术及其在生物学数据集成中的应用。接着分析了由于生物学数据的特殊性,语义网技术在生物学数据集成中也面临了一些挑战。最后指出了语义网技术在生物学数据集成方面研究的方向。  相似文献   

14.
随着网络技术、通信技术等的不断突破,互联网、移动网、广电网等多种类现代网络及其衍生业务迅速扩张,形成泛在于网络空间的分布式计算环境。为了最大化这些数据的价值,需要利用数据挖掘技术发现其中隐藏的模式或规则,用以指导和辅助生产或运营中的管理决策行为,以提高决策水平及决策收益。然而,受到普遍存在的异构性、私有性和平台兼容性等限制,兼因行业竞争和法律约束等因素(如个人或企业的数据隐私保护问题等),互联于网络的数据源难于进行集中式挖掘,分布式数据挖掘(DDM)技术应运而生。介绍了DDM的定义与框架、适用场景和研究挑战。根据文中给出的DDM高层架构,最终结果的质量与局部数据源的类型、可用性、局部结果的质量及整合方法等密切相关。DDM的实施未必都以站点间纯粹独立挖掘的方式进行,此外,对于数据集中,系统分布式站点多的情况,也可采用DDM。当前,DDM研究领域的挑战主要有:异构与同构挖掘、动态环境下的数据多变性、通信开销、知识整合和语义异构等。当前的DDM系统被分为4类:1)基于Multi-Agent的系统,利用Agent的自治性实现局部挖掘以保护数据私有性;利用Agent的主动性减少用户参与以提高挖掘自动化水平;利用Agent的协作性实现多算法协同挖掘等;2)基于网格的系统,利用网格在资源共享、开放服务和协同工作等方面的优势,提高挖掘的可靠性和协同性;3)基于元学习的系统,通过元学习优化挖掘算法的选择与组合,并对已获知识进行多次学习以提高结果质量;4)基于CDM(collective data mining)框架的系统,将待学习的函数表示为一组基函数的分布式存在,允许各数据源选择不同的学习算法,并以全局结果正确为前提减少网络通信量。进而,对当前DDM研究存在的共性问题进行了归纳:1)结果质量问题,不考虑各个站点数据源间的内在语义联系,各站点独立挖掘本地数据,与其他站点间无语义层面的数据交互或融合,形成纯粹的"分割式"挖掘,最终导致全局结果质量受损;2)挖掘效率问题,如何调度资源以平衡挖掘负载、减少协作挖掘中的通信开销问题。针对结果质量问题,探讨本体与数据挖掘的结合。作为语义网的基础,本体能为对象语义距离度量提供有效支持。当前,在利用本体描述挖掘任务的领域背景方面,利用本体描述DM过程本身方面,都已经有研究人员进行了探索性工作:针对关联规则挖掘中需要从海量规则中遴选有效规则的问题,提出了交互式的、用于删减冗余规则的挖掘后处理方法;针对在给定知识发现过程的输入和输出类型前提下,知识发现工作流的自动构造问题,提出了解决方法。通过阐述可知,为了提升分布式挖掘过程中局部结果和最终结果的质量,策略之一就是将DDM理论和本体理论作融合,以数据源间语义距离的度量为突破口,建立语义距离度量的复合量化体系,通过构建和求解新型DDM模型来实现目标。  相似文献   

15.
为了对微环境监测平台上的传感器所捕获的异构、大量、连续的数据流进行语义注释,从而及时地根据语义上下文推理出新的或隐含的知识,以实现微环境监测平台的实时监测,对SASML映射语言和SDRM算法进行了研究和改进,设计了S-SASML映射语言和SDS2R算法,用于将传感器原始数据流转换为符合SOSA/SSN本体的RDF数据流;并利用线程池技术实现方法的高并发处理,提高了方法的实时性能。改进后的映射语言和算法实现了微环境监测平台对连续、大量的数据流的实时语义注释,不仅解决了动态传感器数据流语义注释的问题,而且避免了高频数据流导致的系统过载现象,具有稳定高效的处理能力,基本满足了微环境监测平台的需求,具有一定的应用价值。  相似文献   

16.
Semantic conflict is the conflict caused by using different ways in heterogeneous systems to express the same entity in reality. This prevents information integration from accomplishing semantic coherence. Since ontology helps to solve semantic problems, this area has become a hot topic in information integration. In this paper, we introduce semantic conflict into information integration of heterogeneous applications. We discuss the origins and categories of the conflict. and present an ontology-based schema mapping approach to eliminate semantic conflicts.  相似文献   

17.
随着电力企业信息化进程的不断推进,大量信息管理系统被应用于各种业务中,造成这些系统间存在异构数据,难以共享,甚至还存在各种语义冲突,影响数据的挖掘和分析.为此,提出了一种利用本体技术对电力企业内部的异构数据源进行融合的综合查询机制,可以有效解决电力企业内部数据源的语法和语义异构问题,把来自于各部门的多个数据源进行整合,为数据分析系统提供统一的数据查询接口.实验表明,该机制能够有效消解异构数据源之间的语义冲突,为数据集成提供基础.  相似文献   

18.
基于模式元素语义关系的模式合并方法研究   总被引:1,自引:0,他引:1  
数据集成问题一直是数据库研究领域的热点之一,而全局模式构建是数据集成中的一项重要任务。通过对模式元素之间语义关系的分析,从数据源系统数据字典入手,利用模式匹配结果,提出了一种基于模式元素语义关系进行模式合并的方法,并给出了基于模式元素语义关系的合并规则及合并算法。最后,通过对已有模式合并方法的比较分析,说明该模式合并方法的可用性和有效性更好。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号