共查询到20条相似文献,搜索用时 31 毫秒
1.
林继成 《安庆师范学院学报(自然科学版)》2003,9(4):66-68,75
运用XML数据岛技术和文档对象模型技术,给出并详细解释了在IE窗口中显示HTML源代码片段或显示整个HTML文档的源代码的更快捷、结构上更清晰的方案。 相似文献
2.
林晓莉 《科技情报开发与经济》2011,21(20):80-83,92
在数字图书馆建设过程中,为有效利用早期直接存储于HTML表格中的图书资料信息,提出了一种将HTML表格转换为XML文档的方法。该方法利用HTML表格的格式化信息及其蕴涵的结构信息,对HTML表格的语义层次进行理解,然后将HTML表格数据转储于关系数据库中,最后利用关系数据库对XML文档的支持将数据库文件转换为XML文档。 相似文献
3.
4.
随着HTML格式的出现,Internet得到了迅猛发展,面对着浩瀚如烟的数据,为了从中发现潜在的、有价值的信息,必须对Web信息进行挖掘,但由于HTML语言特点,使得Web信息的组织结构性很差,对于进行Web数据挖掘工作有很大的阻碍,XML语言的出现从根本上解决了这个问题,XML语言具有良好的结构,层次性好,用其对Web页面信息进行组织,有利于进行数据挖掘工作。 相似文献
5.
基于Web的数据挖掘方法的研究及实现 总被引:3,自引:0,他引:3
Web上有海量的数据信息,数据挖掘是从大量的数据中发现隐含的规律性内容,充分利用有用数据,废弃无用数据,解决数据的应用质量问题。通过对Web的数据挖掘和XML特点进行分析,讨论了使用XML实现基于Web的数据挖掘方法,提出了一种结合HTML、XML、JAVA的新型数据挖掘技术。 相似文献
6.
《齐齐哈尔大学学报(自然科学版)》2017,(2)
设计基于XML的Web信息采集系统,抽取出HTML页面中半结构化数据后,将清洗、解析后的数据置入My SQL数据库中。通过将类型相似页面的节点信息和字段描述配置于XML文件中,改进了网页对应独立抽取模板的方法,有效地提高了Web信息采集的效率和准确性。实验结果表明,基于XML的Web信息采集系统能够满足信息抽取的需求。 相似文献
7.
HTML数据内容的抽取与集成 总被引:11,自引:0,他引:11
在XML基础上,利用HTML Tidy可实现轻量级的Web数据挖掘和转换。转换过程主要解决的是HTML文档及其集合要表达的模式信息的分离。转换步骤是利用HTML Tidy提供的标准类库,净化HTML文档,借助DOM生成树对HTML元素结构做进一步分析,最后通过XSL、XPATH等自动提取转换。 相似文献
8.
XML数据岛是网页设计中处理XML数据的新技术.介绍了XML数据岛的概念,讨论了Web页中XML数据绑定的原理和实现,并给出了基于XML数据岛和XML数据绑定技术在客户端实现各种数据操作的方法和代码. 相似文献
9.
XML正在成为Internet上数据描述和交换的标准,它将代替HTML而成为Web上存放数据的主要格式.首先讨论了XML的特点,然后介绍了XML的核心技术:DTD、XSL和XLink.并将XML、SGML和HTML作了相应比较,最后对XML数据库进行了简单介绍. 相似文献
10.
一种基于XML的Web数据抽取的实现 总被引:2,自引:0,他引:2
Web数据挖掘的研究越来越广泛,对Web数据的抽取则是研究的前提和必要的步骤.而当前Web信息大多数都是HTML格式的,存在很多缺陷.针对目前研究,简单地介绍了XML及它的特点,并且对HTMLand XML从开放性、可操作性等几个方面做了比较,显示出了XML的优越性.最后利用一个实例简述了基于XML的数据抽取过程. 相似文献
11.
针对在Web信息抽取系统开发中遇到的关键性技术问题,如Web页的HTML文档下载,HTML到XML格式转换,XML文档清理等,分析和探讨了基于.NET技术的编程实现方法. 相似文献
12.
XML是在HTML基础上形成的新一代web语言,它主要是关于数据和信息描述的技术。它在数字图书馆管理、专业导航库建设、情报检索、Web中有广泛应用。 相似文献
13.
XML( Extensible Markup Language)即可扩展标记语言,它与HTML一样,都是处于SGML,标准通用语言.XML是Internet环境中跨平台的、依赖于内容的技术,是当前处理结构化文档信息的有力工具,是一种简单的数据存储语言.目前XML已经成为表示Web上多样性数据的事实标准,可以预见,Web... 相似文献
14.
XML的WebGIS实现模型及其数据共享 总被引:3,自引:0,他引:3
骆炎民 《华侨大学学报(自然科学版)》2005,26(4):432-435
信息共享是Internet应用的本质要求。开放性与共享性也是webGIS的发展方向.文中根据GIS的特点,针对HTML的缺陷,把XML技术引入到WebGIS中,讨论基于XML的WebGIS实现模型。研究利用XML技术在Web上实现GIS数据共享的方法,并给出应用实例. 相似文献
15.
杨晓宇 《科技情报开发与经济》2004,14(4):140-141
HTML作为一种简单易用的标记语言,极大地推动了Internet的发展。但是随着Internet应用的展开,HTML已经不能满足人们的需要。作为下一代Internet,XML具有极大的灵活性和扩展性。文章描述了一个基于XML的数据交换的过程,用XML作为数据中介,实现了异构数据的集成的交换。 相似文献
16.
基于XML技术的J2EE Web应用框架 总被引:1,自引:0,他引:1
对已有Web应用框架进行分析,提出了一个基于XML的J2EE Web应用框架.该框架在客户层实现了一系列利用XML数据岛技术的HTML组件,在业务层提供了一系列基础服务组件,并利用XML作为应用中各层间的数据交互格式;此外,框架中还针对Web应用中的页面导航、权限控制等公用功能提供相应的子框架.应用实例证明,使用该框架能够使开发人员关注于业务处理,便于进行分工协作,提高开发效率. 相似文献
17.
XML及其在Web数据挖掘中的作用 总被引:1,自引:0,他引:1
汤建超 《五邑大学学报(自然科学版)》2003,17(2):35-38
介绍了Web数据的数据环境和结构,XML简单、开放、扩充的特性及XML与HTML的比较.论述了面向Web的数据挖掘需要解决的问题及XML在Web数据挖掘中所起的作用。 相似文献
18.
阮树银 《芜湖职业技术学院学报》2004,6(3):37-38
HTML和XML都有一个共同的祖先,都是标记语言。HTML主要显示静态的文本,在显示和打印方面仍然起着重要的作用。XML是HTML的扩展,XML规则较严格,XML可自定义标签,这样使得XML更具有表现力和可扩展性,另外XML在数据交换、Web技术等方面更具魅力。 相似文献
19.
基于MEDL模型提出了一种以内容为导向的,将HTML转换为XML数据的方法.在该方法中,根据网页中值域和属性域的识别,并结合MEDL模型对HTML中的数据进行提取,并将其转换为符合要求的格式.该方法具有提取信息精确、转换格式统一等优点,且具备很好的扩展性,能够为深入开展Web数据挖掘提供很好的支持. 相似文献
20.
简要介绍了XML、ASP等网络信息传递的相关技术,通过实例讨论了利用XML数据岛实现的动态网页数据集分页方法,给出了主要代码. 相似文献