首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
随着公有数据库资源的丰富,广泛分布的用户希望能够按需地、透明地访问和使用这些丰富的数据资源.本文采用SOA(Service Oriented Architecture)思想,提出了一种支持异构数据访问和集成的方法,基于关键字过滤的数据集成策略,减少通信代价,采用分布式聚类技术,实现大数据量信息的概要显示.  相似文献   

2.
针对基于查询接口集成的web集成技术复杂且面向领域这一现象,提出了一种非实时查询Deep Web数据库集成技术.该技术通过在被检索网站安装客户端数据源应用程序,获取所有被检索网站的Deep Web数据源连接信息、Deep Web异构数据库表结构信息以及Deep Web异构数据库表数据.其中表结构和表数据经集成系统解析后以统一的格式集成到本地数据库.实验结果表明,该集成技术可集成所有领域的Deep Web异构数据库,没有领域限制.由于是本地查询查询速度也较快,具有一定的可行性.  相似文献   

3.
异构数据库中数据集成技术研究   总被引:5,自引:0,他引:5  
文章就数字化校园实现中所采用的几种数据集成方式作了介绍,并就数据集成中的重点环节作了简单的介绍,最后根据我校西北民族大学的实际情况提出了相应的解决方案.通过这种方法实现校园数据库集成,能大大提高数据共享能力,同时可加强对数据的管理,为今后学校的决策与分析提供了更好的支持.  相似文献   

4.
异构数据库间数据集成的方法   总被引:6,自引:0,他引:6  
对目前研究的实现异构数据库间数据集成的几种方法进行了评述,旨出利用Power-Builder开发的应用程序,应用灵活,互操作性强,且编程量不大,易于实现多对多的动态数据转换,是一种较好的实现异构数据库集成的方法。  相似文献   

5.
Intranet中Web与数据库集成技术分析   总被引:1,自引:0,他引:1  
着重研究了Intranet中Web与数据库的集成技术,分析比较了CGI,专用网关接口,ActiveX,ASP及JavaApplet等技术的优缺点和应用环境,并提出一个跨平台能力强,动态性和交互性好,可扩展性强的方案,该方案在企业组建Intranet,开发Intranet数据库应用方面具有参考和借鉴价值。  相似文献   

6.
分析了数据集成过程中需要将集中存放的数据进行拆分实际问题,提出了基于字段的纵向拆分、基于记录的横向拆分和基于表的双向拆分等3种数据集成方法,实现了数据集成和资源共享,其思想对于数据集成的过程中需要将各自分布的数据合并起来的实际问题也有很大意义。  相似文献   

7.
为解决异构数据源共享问题,研究了基于中介器/包装器(Mediator/Wrapper)的多源异构数据的集成方法,提出了基于构件的多源异构数据集成体系结构,可以将异构数据源的查询以构件的方式实现。充分利用网构构件的自适应性,通过模块的自主组合来屏蔽底层数据源的差异,使用户可以无缝而且灵活地访问多源异构数据,有效地解决了多源异构数据共享等问题。  相似文献   

8.
大数据系统中数据源多,数据规模大,且数据具有异构异质的特点,为满足各种数据集成需求,如何快速高效地整合数据就显得越来越重要且具有挑战性。数据虚拟化能够灵活地实现各种数据集成需求,介绍数据虚拟化的概念、优势及应用需求,给出一种数据虚拟化系统架构,并对其中的数据虚拟化平面与管理平面以及各层的功能进行了阐述。重点针对数据虚拟化系统中存在的一些关键问题与挑战进行了详细分析,给出了需要进一步研究的课题与方向。  相似文献   

9.
早期信息管理系统间数据无法共享,即所谓的“信息孤岛”现象是数字化校园建设需要解决的一个重要问题。现主要阐述了如何利用Oracle数据整合工具(ODI)来规划数据集成项目结构和对各种信息管理系统的数据库(包括异构数据库)进行数据交换和集成,从而达到不同管理系统数据库间的信息同步和共享。  相似文献   

10.
传统的数据管理技术没有考虑现实中存在的不确定性,很多现有的方法选择最可能符合用户意图的结果,从而消除了不确定性问题,但有时这些不确定信息是有价值的,忽略掉这些信息可能使对用户有用的信息不能返回给用户.因此,笔者阐述了产生不确定性的三个方面的原因,并提出了一个使用用概率数据库和概率映射方法处理不确定性的数据集成方法.  相似文献   

11.
数据标注是Deep Web数据集成系统的重要组成部分.建立了领域标注模型,描述数据标注的思想,根据不同的数据,使用领域知识和决策树两种标注方法,给出标注算法描述,最后以图书领域作为标注对象进行实验.实验结果表明该方法可高效、准确地对Deep Web数据进行标注.  相似文献   

12.
彭媛媛  许建潮 《科技信息》2009,(33):85-85,104
随着近年来Internet的飞速发展,Deepweb已成为网络信息资源的重要组成部分,用户通过查询接口在线访问其后端的Web数据库来动态的获取其中蕴含的海量信息。由于DeepWeb资源分布在各个De印web站点,具有异构、动态、数据量大等特点,使用起来较为不便,因此,面向Deep Web的数据集成系统便应运而生。本文对Deepweb数据集成系统中的数据抽取技术进行了研究,提出了基于xml的Deepweb数据自动抽取方法,并作了详细的技术分析与研究,它能够快速有效地抽取出DeepWeb资源,具有抽取准确度高,抽取粒度细等特点。  相似文献   

13.
目前,Web上存在很多Deep Web网站,而各个网站的数据表现形式有很大的差别.因此要集成这些网站就需要正确抽取其中的数据,并将其中表示同一实体的数据合并.该文提出了一种基于探测查询的方法来自动完成页面的数据抽取及实体识别工作,该方法通过提交查询可以在提取数据的同时确定实体的各个属性,根据实体的各个属性进行实体识别.实验表明,该方法具有较高的实体识别准确率.  相似文献   

14.
不同于Surface W eb的信息获取方式,Deep W eb中大量的数据隐藏在数据库中,无法直接通过静态的URL链接来获得,只能在查询接口中输入关键词来获得站点中的网页.主要对Deep W eb中查询数据库时提交的查询操作进行了研究,发展了一种机器学习方法去自动获取Deep W eb的查询语言,并根据迭代算法寻找到合适的网页.  相似文献   

15.
不同于Surface Web的信息获取方式,Deep Web中用户需通过查询接口才能得到其中的数据.查询接口一般形成属性间复杂的m∶n匹配.为统一相同领域的查询接口,提出了一种基于关联规则的匹配方法,从整体上双重匹配成组属性和同义属性,很好地实现了同一领域中查询接口的整合问题.特别对于大量的数据源时,无论是准确率还是效率都比传统的方法有很大的提高.  相似文献   

16.
如何高效、准确地组织和检索Deep Web蕴含的高质量信息已经成为未来Web挖掘和数据库领域面临的一项崭新课题和挑战,而Deep Web分类则是Deep Web信息检索的基础.该论文综合论述了Deep Web信息集成的研究概况,重点分析了结构化Deep Web分类的主要方法和存在的主要问题,并且讨论了解决这些问题的可能方法;最后对未来工作进行展望.  相似文献   

17.
利用Apriori算法对Deep Web网站中最大频繁关联关系网页进行识别,并对非最大频繁项网页进行剪枝,再遍历Deep Web网站网页,从而获取所有最大频繁关联关系网页。对某房地产Deep Web网站的实验结果验证了该算法的可行性和有效性。  相似文献   

18.
Deep Web数据集成系统中的查询效率优化   总被引:1,自引:0,他引:1  
Deep Web能够提供大量高质量的信息,为了有效地利用这些信息,建立Deep Web数据集成系统是重要手段。Deep Web数据集成系统的查询效率是其应用的关键。本文采用建立本地索引数据库的方式以提高查询效率,在此基础上提出了其相应的更新策略,并给出了算法分析。  相似文献   

19.
Deep Web sources contain a large of high-quality and query-related structured date. One of the challenges in the Deep Web is extracting result schemas of Deep Web sources. To address this challenge, this paper describes a novel approach that extracts both result data and the result schema of a Web database. The approach first models the query interface of a Deep Web source and fills in it with a specifically query instance. Then the result pages of the Deep Web sources are formatted in the tree structure to retrieve subtrees that contain elements of the query instance, Next, result schema of the Deep Web source is extracted by matching the subtree' nodes with the query instance, in which, a two-phase schema extraction method is adopted for obtaining more accurate result schema. Finally, experiments on real Deep Web sources show the utility of our approach, which provides a high precision and recall.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号