共查询到19条相似文献,搜索用时 46 毫秒
1.
2.
如何高效、准确地组织和检索Deep Web蕴含的高质量信息已经成为未来Web挖掘和数据库领域面临的一项崭新课题和挑战,而Deep Web分类则是Deep Web信息检索的基础.该论文综合论述了Deep Web信息集成的研究概况,重点分析了结构化Deep Web分类的主要方法和存在的主要问题,并且讨论了解决这些问题的可能方法;最后对未来工作进行展望. 相似文献
3.
一种基于Web Services的分布异构数据库集成机制 总被引:4,自引:0,他引:4
孙友仓 《山西大学学报(自然科学版)》2007,30(3):340-343
解析了Web Service的体系结构,以石油钻井领域内的信息资源为主要研究对象,提出了一种基于Microsoft.NET的Web Services技术透明集成访问分布异构数据库的机制,分析并给出了该机制中的关键技术及专用XML Web Service和数据集成XML Web Service的实现原理. 相似文献
4.
由于Deep Web查询接口的自动发现是获取Deep Web信息的基础,提出了基于搜索引擎的表单发现方法和基于语义相似度的查询表单判定方法.该文首先定义了查询表单的特征的表示方法,然后自动提取样本查询接口的特征并将其中的文字特征进行组合提交给搜索引擎以实现查询表单的搜索,最后基于语义相似度和字面相似度的方法判定搜索表单和样本表单之间的相似度,并由此判定是否是WDB的查询接口.实验证明该文方法具有良好的可行性和实用性,为深入研究Deep Web提供了良好的条件. 相似文献
5.
Web服务的一种通用集成模型的研究 总被引:8,自引:0,他引:8
提出了一种Web服务集成的通用模型GIMWS,它使用一种面向服务的多层体系结构,该模型将异构Web服务的同化和事务合成分离开,有效地解决了Web服务间的异构问题,扩展了分布事务管理的两阶段提交协议2PC以增强集成得到的Web服务的健壮性和适应性,为大量Web服务的高效集成提供了一种通用机制. 相似文献
6.
Deep Web环境中,用户输入的查询条件过于严格可能会导致查询的失败,通过查询松弛可以提升查询的有效性.为使查询松弛更加科学准确,提出了一种基于经验值的弹性查询松弛方法.首先获取各查询属性的经验值,并确定各属性的重要度;然后给出了基于经验值的弹性查询松弛策略,即按照属性重要度由低到高的顺序,依次在属性的经验值范围内对查询条件进行弹性松弛,使查询松弛后返回的结果尽可能与用户的查询请求相匹配;最后通过实验验证了所提查询松弛方法切实可行. 相似文献
7.
异构数据源的存在给实现不同信息系统间数据的互访带来了很大的不便,异构数据源集成是解决网络条件下“信息孤岛”问题的有效途径。本文对异构数据源集成的问题进行了深入的研究,在研究和比较了各种集成的方法和体系结构之后,重点研究了基于webService的异构数据源集成技术,论述了webService的技术特点和在异构数据源集成上的优势。 相似文献
8.
9.
Deep Web爬虫研究与设计 总被引:10,自引:0,他引:10
随着Web的发展,越来越多的数据可以通过表单提交来获取,这些表单提交所产生信息是由Deep Web后台数据库动态产生的.在这种情况下,信息集成就更加需要Web爬虫来自动获取这些页面以进一步地处理数据.为了帮助用户完成这样的任务,提出一种用于搜集Deep Web页面的爬虫的设计方法.此方法使用一个预定义的领域本体知识库来识别这些页面的内容,同时利用一些来自Web站点的导航模式来识别自动填写表单时所需进行的路径导航.通过对来自不同领域的Deep Web站点的大量实验,验证了此方法是非常有效的. 相似文献
10.
异构数据库中数据集成技术研究 总被引:5,自引:0,他引:5
文章就数字化校园实现中所采用的几种数据集成方式作了介绍,并就数据集成中的重点环节作了简单的介绍,最后根据我校西北民族大学的实际情况提出了相应的解决方案.通过这种方法实现校园数据库集成,能大大提高数据共享能力,同时可加强对数据的管理,为今后学校的决策与分析提供了更好的支持. 相似文献
11.
12.
随着近年来Internet的飞速发展,Deepweb已成为网络信息资源的重要组成部分,用户通过查询接口在线访问其后端的Web数据库来动态的获取其中蕴含的海量信息。由于DeepWeb资源分布在各个De印web站点,具有异构、动态、数据量大等特点,使用起来较为不便,因此,面向Deep Web的数据集成系统便应运而生。本文对Deepweb数据集成系统中的数据抽取技术进行了研究,提出了基于xml的Deepweb数据自动抽取方法,并作了详细的技术分析与研究,它能够快速有效地抽取出DeepWeb资源,具有抽取准确度高,抽取粒度细等特点。 相似文献
13.
A deep Web data integration system for job search 总被引:3,自引:0,他引:3
LIU Wei LI Xian LING Yanyan ZHANG Xiaoyu MENG Xiaofeng 《武汉大学学报:自然科学英文版》2006,11(5):1197-1201
0 IntroductionMore and more databases are becoming Web accessiblethrough form-based search interfaces . We call thiskind of Web data“Deep Web”,the online databases“Web da-tabase”,and the form-based search interfaces“query inter-face”. The survey[1]in April 2004 was esti mated to 450 000online databases .As current crawlers ,suchas Google,cannoteffectively query databases , for such data are invisible tosearch engines ,andthus remainlargely hiddenfromusers .Itis of great i mportance t… 相似文献
14.
郑瑜钒 《杭州师范学院学报(自然科学版)》2006,5(6):482-484
异构信息资源的共享问题是数字图书馆建设中的重要问题,文章在介绍Web Services技术标准的基础上,讨论了基于Web服务的实现异构信息资源共享的解决方案. 相似文献
15.
异构数据库的集成是数据库领域的经典问题,也是当今信息技术的热点。研究和开发异构数据库集成系统,对于消除高校中的信息孤岛,维护各部门间数据的一致性与完整性,促进数据的共享,减少数据的管理成本等都有及其重要的意义。该文阐述了数据库的异构性,提出了异构数据库集成设计时需解决的问题及应遵循的原则,总结了异构数据库集成的主要方法,并对当前异构数据库集成中存在的问题及面临的挑战进行了分析。 相似文献
16.
Deep Web的规模和所包含的信息量都在飞速发展。因此Deep Web数据集成已成为一个新的研究热点,文本对deep web数据集成领域的若干问题进行了总结,并对未来的工作进行了展望。 相似文献
17.
提出一种基于模型匹配的深网(Deep Web)在线专业数据库查询接口特征抽取方法, 该方法通过分析网页结构中特征词的深度自动抽取查询接口特征向量, 同时考虑频度和集中度两种因素定义特征词向量空间中的权值, 并在传统向量模型的基础上加入特征词个数作为一个新的分量, 构建一个数据库查询接口, 使用模型匹配的分类方法对其进行分类. 实验验证了该方法的有效性. 相似文献
18.
LIU Wei LIN Can MENG Xiaofeng 《武汉大学学报:自然科学英文版》2006,11(5):1403-1406
A vision based query interface annotation meth od is used to relate attributes and form elements in form based web query interfaces, this method can reach accuracy of 82%. And a user participation method is used to tune the result; user can answer "yes" or "no" for existing annotations, or manually annotate form elements. Mass feedback is added to the annotation algorithm to produce more accurate result. By this approach, query interface annotation can reach a perfect accuracy. 相似文献