首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 139 毫秒
1.
郭少杰  陈雅冰 《广东科技》2010,19(14):63-65
Deep Web中蕴含了海量的可供访问的信息,并且还在迅速地增长。随着互联网应用的发展,网上的在线数据库大量涌现,Deep Web数据集成成为当前信息领域的一个研究热点。为了方便用户查询数据,对Deep Web技术的应用进行了研究,提出了Deep Web技术在科学数据共享平台中的架构,并阐述了具体的实现。  相似文献   

2.
介绍了基于索引路径的数据抽取算法的不足,从代码角度和用户需求角度2个方面进行考虑,提出了一种进改良措施,有效地提升了数据抽取的准确率,从而大大减少了数据冗余.由于补充了记录、有效数据等定义,使得抽取出的数据仍然保有其在网页中的结构关系,为之后的语义标注工作带来了极大的方便,为深度网页(Deep Web)数据集成奠定了良好的基础.  相似文献   

3.
为了有效地利用Deep Web资源,Deep Web数据集成成为当前研究的热点之一.能否高效地发现Deep Web站点是Deep Web数据集成的基础和关键.在此,提出了一种Deep Web接口发现方法,包括基于领域知识来确定合适的查询提交词和用启发式规则发现领域内Deep Web接口.实验结果表明,该方法达到了较高的准确率和召回率,具有良好的可行性和实用性.  相似文献   

4.
针对基于查询接口集成的web集成技术复杂且面向领域这一现象,提出了一种非实时查询Deep Web数据库集成技术.该技术通过在被检索网站安装客户端数据源应用程序,获取所有被检索网站的Deep Web数据源连接信息、Deep Web异构数据库表结构信息以及Deep Web异构数据库表数据.其中表结构和表数据经集成系统解析后以统一的格式集成到本地数据库.实验结果表明,该集成技术可集成所有领域的Deep Web异构数据库,没有领域限制.由于是本地查询查询速度也较快,具有一定的可行性.  相似文献   

5.
Deep Web查询接口自动识别方法   总被引:1,自引:0,他引:1  
获取Deep Web中信息的主要途径是通过在其提供的查询接口上提交查询来获得,自动识别Deep Web查询接口是Deep Web数据集成系统中需要解决的一个关键问题.通过提取适当的表单结构特征,采用C4.5决策树和朴素贝叶斯相结合的分类算法实现对Deep Web查询接口的自动识别,实验验证了该方案的有效性.  相似文献   

6.
周旭  赵耀  刘海博 《科技信息》2007,(35):53-54
面对越来越多的在线数据库,Deep Web得到人们的广泛重视,Deep Web资源集成是Deep Web研究的重点内容。本文对一个典型的Deep Web资源集成原型系统--WISE-Integrator进行了系统的分析和介绍。该系统对查询接口的描述、接口抽取和接口整合等Deep Web资源集成的主要问题进行了深入的研究,提出一些切实可行的方法,对于该领域的研究人员具有重要的参考价值。  相似文献   

7.
全面准确地标注Deep Web数据是实现Deep Web数据集成系统的关键问题,然而现有的DeepWeb数据语义标注方法还不能很好地解决这一问题.提出一种基于CPN网络的Deep Web数据语义标注方法,通过提取属性值的基本特征,采用CPN网络实现Deep Web数据语义标注.同时,采取了一种有效的方法准确获取Deep Web结果页面中的属性值,为语义标注奠定了良好的基础.与同类成果相比,基于CPN网络的Deep Web数据语义标注方法提高了语义标注的准确率及召回率.  相似文献   

8.
数据标注是Deep Web数据集成系统的重要组成部分.建立了领域标注模型,描述数据标注的思想,根据不同的数据,使用领域知识和决策树两种标注方法,给出标注算法描述,最后以图书领域作为标注对象进行实验.实验结果表明该方法可高效、准确地对Deep Web数据进行标注.  相似文献   

9.
如何高效、准确地组织和检索Deep Web蕴含的高质量信息已经成为未来Web挖掘和数据库领域面临的一项崭新课题和挑战,而Deep Web分类则是Deep Web信息检索的基础.该论文综合论述了Deep Web信息集成的研究概况,重点分析了结构化Deep Web分类的主要方法和存在的主要问题,并且讨论了解决这些问题的可能方法;最后对未来工作进行展望.  相似文献   

10.
随着网络规模的日益扩大,海量的信息被"深藏"于各类在线数据库中,用户只能通过查询接口才能获取其中的数据,这部分内容称之为Deep Web;因此对同一领域的Deep Web数据进行集成是非常必要的。查询接口的集成是其中一个非常关键的子问题。查询接口的集成分为模式匹配和模式集成两个步骤;重点研究集成查询接口中属性布局的确定。Deep Web中查询接口数量巨大,以及动态性与异构性的特点给该问题带来了巨大的挑战。将查询接口的结构建模成一棵树,然后通过挖掘频繁的模式子树来构建集成的查询接口树,使其最大化地满足属性间的结构约束和顺序约束。该算法具有较低的时间复杂度,并具有很好的扩展性,对八个领域的查询接口进行集成的实验结果证明了算法的有效性。  相似文献   

11.
将现有W eb提升为语义W eb的有效方法之一就是标注W eb页。当前W eb上,动态生成页面的规模有静态页面的500倍之多,标注从数据库动态生成的页面是深度标注方法之一。针对数据库生成的W eb页面具有模板和结构化的特征,在对带模板的结构化HTM L文档和本体形式化表示之后,提出了两段式的深度标注框架,即第一阶段解析HTM L文档,抽取结构化信息,第二阶段指定实例与词汇间的映射,标注自动生成。与其他标注方法相比,该方法能明显降低标注过程的工作量。  相似文献   

12.
随着Internet的迅速发展,基于Web的信息交流、共享与协作已成为企业信息化的重要发展方向。本文在解析Web Service的体系结构的基础上,以油气勘探开发领域内的信息资源为主要研究对象,在分析了它的多维度、多层次、结构化特点的基础上,提出了一种基于Microsoft.NET的Web Service技术透明集成访问多维数据信息的架构,分析并给出了该架构中关键的专用XMLWeb Service和数据信息集成XMLWeb Service的实现原理。实践表明,它具有分布异构、健壮、易扩展及简化应用程序开发等特点。  相似文献   

13.
Web数据挖掘是一门新兴的多学科交叉的研究领域,国内外的研究尚处于初级阶段,许多理论和应用问题还有待于进一步完善.虽然本文作了一些有益的尝试,但在新的Web数据挖掘方法、Web文档聚类和分类的方法、个性化/专用化、新的自动提取信息方法、理解语义Web以及Web多媒体数据挖掘等方面仍然需要做进一步的研究工作.  相似文献   

14.
Web挖掘技术的应用之一就是Web搜索引擎。对于搜索引擎中的Web结构挖掘,通过对经典的超链接分析算法的研究,对Web超链结构进行深入分析的基础上,针对HITS算法的缺陷,通过引入权值和调整因子对其进行改进。实验表明,改进后的算法表现更加出色。  相似文献   

15.
龚贞  李斌 《科技信息》2010,(13):63-65
Ruby on Rails作为一种全新的WEB应用开发框架,提供了一套灵活、高效、简洁易用的解决方案,使得Web开发、部署和维护变得更简单和轻松。本文结合成都市铁路局客运卧具管理系统的实际案例,描述了Ruby on Rails便捷的迭代式增量开发和原型系统快速构建。充分展现了Rails框架的敏捷优势。  相似文献   

16.
JavaScript是一个脚本编程语言,在客户机中它可用于编写Web浏览器在Web页面上下文中执行的程序。因此在网页编程中占主导地位。随着LINUX的流行,使用NETSCAPE浏览器的人也越来越多,所以有必要对同一个Web页的JavaScript在这两个测览器上正常运行进行研究。本文主要是针对键盘和鼠标事件的探讨。  相似文献   

17.
基于XML的Web数据交换服务平台的设计与实现   总被引:5,自引:0,他引:5  
依托Web提出了一种以XML文件作为中间结果实现异构平台数据交换的解决方案,满足了电子政务处理过程中对不同形式数据的处理要求.  相似文献   

18.
袁晓月  黎升洪 《江西科学》2004,22(5):337-342
数据密集型Web应用是当前Web工程的热点。介绍了在高层表达Web应用结构的建模方法—WebML。给出了数据结构层、站点视图层和表现风格层所使用的记号和它们的含义。并给出了WebML开发过程和1个示例。  相似文献   

19.
随着Internet迅速发展以及电子商务的兴起,WWW上的信息积累越来越多,如何在这些信息中发现有用的商业信息,成为相关领域专家学者关注的焦点。本文重点讨论了Web数据挖掘技术在电子商务中的应用价值,给出了Web数据挖掘的过程,论文中详细描述了Web数据挖掘的过程中的具体步骤,最后进一步讨论了Web数据挖掘技术在电子商务中的应用前景。  相似文献   

20.
Semantic Web是网络服务和应用开发中的关键技术.本文归纳并分析了Semantic Web技术的研究背景和典型Semantic Web的概念.通过讨论Semantic Web构想的层次框架模型,指出了各层的角色及它们在Semantic Web构架中的作用,着重分析Ontology层的核心作用.通过分析Ontology的应用和相关开发工具以及面临的问题和挑战,提出了一种基于本体对象的智能检索过程.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号