首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
运用XML数据岛技术和文档对象模型技术,给出并详细解释了在IE窗口中显示HTML源代码片段或显示整个HTML文档的源代码的更快捷、结构上更清晰的方案。  相似文献   

2.
在数字图书馆建设过程中,为有效利用早期直接存储于HTML表格中的图书资料信息,提出了一种将HTML表格转换为XML文档的方法。该方法利用HTML表格的格式化信息及其蕴涵的结构信息,对HTML表格的语义层次进行理解,然后将HTML表格数据转储于关系数据库中,最后利用关系数据库对XML文档的支持将数据库文件转换为XML文档。  相似文献   

3.
色菲  王佳  潘超 《科技信息》2007,(34):75-75,52
互联网已成为人们获得信息、取得服务的重要渠道之一。Web上的数据最大特点就是半结构化。由于目前网络上信息的主要组织形式是HTML格式,而HTML标记语言只描述数据的表现形式,不描述数据含义及结构。因此,计算机无法自动识别。而XML是面向语义的语言,它的产生为解决这一问题提供了条件,即XML能够较好地为计算机所识别。因此本文分析了对由XML表示的数据进行数据抽取的过程。  相似文献   

4.
随着HTML格式的出现,Internet得到了迅猛发展,面对着浩瀚如烟的数据,为了从中发现潜在的、有价值的信息,必须对Web信息进行挖掘,但由于HTML语言特点,使得Web信息的组织结构性很差,对于进行Web数据挖掘工作有很大的阻碍,XML语言的出现从根本上解决了这个问题,XML语言具有良好的结构,层次性好,用其对Web页面信息进行组织,有利于进行数据挖掘工作。  相似文献   

5.
基于Web的数据挖掘方法的研究及实现   总被引:3,自引:0,他引:3  
Web上有海量的数据信息,数据挖掘是从大量的数据中发现隐含的规律性内容,充分利用有用数据,废弃无用数据,解决数据的应用质量问题。通过对Web的数据挖掘和XML特点进行分析,讨论了使用XML实现基于Web的数据挖掘方法,提出了一种结合HTML、XML、JAVA的新型数据挖掘技术。  相似文献   

6.
设计基于XML的Web信息采集系统,抽取出HTML页面中半结构化数据后,将清洗、解析后的数据置入My SQL数据库中。通过将类型相似页面的节点信息和字段描述配置于XML文件中,改进了网页对应独立抽取模板的方法,有效地提高了Web信息采集的效率和准确性。实验结果表明,基于XML的Web信息采集系统能够满足信息抽取的需求。  相似文献   

7.
HTML数据内容的抽取与集成   总被引:11,自引:0,他引:11  
在XML基础上,利用HTML Tidy可实现轻量级的Web数据挖掘和转换。转换过程主要解决的是HTML文档及其集合要表达的模式信息的分离。转换步骤是利用HTML Tidy提供的标准类库,净化HTML文档,借助DOM生成树对HTML元素结构做进一步分析,最后通过XSL、XPATH等自动提取转换。  相似文献   

8.
XML数据岛是网页设计中处理XML数据的新技术.介绍了XML数据岛的概念,讨论了Web页中XML数据绑定的原理和实现,并给出了基于XML数据岛和XML数据绑定技术在客户端实现各种数据操作的方法和代码.  相似文献   

9.
XML正在成为Internet上数据描述和交换的标准,它将代替HTML而成为Web上存放数据的主要格式.首先讨论了XML的特点,然后介绍了XML的核心技术:DTD、XSL和XLink.并将XML、SGML和HTML作了相应比较,最后对XML数据库进行了简单介绍.  相似文献   

10.
一种基于XML的Web数据抽取的实现   总被引:2,自引:0,他引:2  
Web数据挖掘的研究越来越广泛,对Web数据的抽取则是研究的前提和必要的步骤.而当前Web信息大多数都是HTML格式的,存在很多缺陷.针对目前研究,简单地介绍了XML及它的特点,并且对HTMLand XML从开放性、可操作性等几个方面做了比较,显示出了XML的优越性.最后利用一个实例简述了基于XML的数据抽取过程.  相似文献   

11.
谭锋 《科技资讯》2011,(7):5-5,7
针对在Web信息抽取系统开发中遇到的关键性技术问题,如Web页的HTML文档下载,HTML到XML格式转换,XML文档清理等,分析和探讨了基于.NET技术的编程实现方法.  相似文献   

12.
李璐 《科技信息》2007,(33):274-274,287
XML是在HTML基础上形成的新一代web语言,它主要是关于数据和信息描述的技术。它在数字图书馆管理、专业导航库建设、情报检索、Web中有广泛应用。  相似文献   

13.
党杨阳 《甘肃科技》2011,27(19):40-42,11
XML( Extensible Markup Language)即可扩展标记语言,它与HTML一样,都是处于SGML,标准通用语言.XML是Internet环境中跨平台的、依赖于内容的技术,是当前处理结构化文档信息的有力工具,是一种简单的数据存储语言.目前XML已经成为表示Web上多样性数据的事实标准,可以预见,Web...  相似文献   

14.
XML的WebGIS实现模型及其数据共享   总被引:3,自引:0,他引:3  
信息共享是Internet应用的本质要求。开放性与共享性也是webGIS的发展方向.文中根据GIS的特点,针对HTML的缺陷,把XML技术引入到WebGIS中,讨论基于XML的WebGIS实现模型。研究利用XML技术在Web上实现GIS数据共享的方法,并给出应用实例.  相似文献   

15.
HTML作为一种简单易用的标记语言,极大地推动了Internet的发展。但是随着Internet应用的展开,HTML已经不能满足人们的需要。作为下一代Internet,XML具有极大的灵活性和扩展性。文章描述了一个基于XML的数据交换的过程,用XML作为数据中介,实现了异构数据的集成的交换。  相似文献   

16.
基于XML技术的J2EE Web应用框架   总被引:1,自引:0,他引:1  
对已有Web应用框架进行分析,提出了一个基于XML的J2EE Web应用框架.该框架在客户层实现了一系列利用XML数据岛技术的HTML组件,在业务层提供了一系列基础服务组件,并利用XML作为应用中各层间的数据交互格式;此外,框架中还针对Web应用中的页面导航、权限控制等公用功能提供相应的子框架.应用实例证明,使用该框架能够使开发人员关注于业务处理,便于进行分工协作,提高开发效率.  相似文献   

17.
XML及其在Web数据挖掘中的作用   总被引:1,自引:0,他引:1  
介绍了Web数据的数据环境和结构,XML简单、开放、扩充的特性及XML与HTML的比较.论述了面向Web的数据挖掘需要解决的问题及XML在Web数据挖掘中所起的作用。  相似文献   

18.
XML与HTML     
HTML和XML都有一个共同的祖先,都是标记语言。HTML主要显示静态的文本,在显示和打印方面仍然起着重要的作用。XML是HTML的扩展,XML规则较严格,XML可自定义标签,这样使得XML更具有表现力和可扩展性,另外XML在数据交换、Web技术等方面更具魅力。  相似文献   

19.
基于MEDL模型提出了一种以内容为导向的,将HTML转换为XML数据的方法.在该方法中,根据网页中值域和属性域的识别,并结合MEDL模型对HTML中的数据进行提取,并将其转换为符合要求的格式.该方法具有提取信息精确、转换格式统一等优点,且具备很好的扩展性,能够为深入开展Web数据挖掘提供很好的支持.  相似文献   

20.
简要介绍了XML、ASP等网络信息传递的相关技术,通过实例讨论了利用XML数据岛实现的动态网页数据集分页方法,给出了主要代码.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号