首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 93 毫秒
1.
一种基于XML的Web数据抽取的实现   总被引:2,自引:0,他引:2  
Web数据挖掘的研究越来越广泛,对Web数据的抽取则是研究的前提和必要的步骤.而当前Web信息大多数都是HTML格式的,存在很多缺陷.针对目前研究,简单地介绍了XML及它的特点,并且对HTMLand XML从开放性、可操作性等几个方面做了比较,显示出了XML的优越性.最后利用一个实例简述了基于XML的数据抽取过程.  相似文献   

2.
运用XML数据岛技术和文档对象模型技术,给出并详细解释了在IE窗口中显示HTML源代码片段或显示整个HTML文档的源代码的更快捷、结构上更清晰的方案。  相似文献   

3.
XML深入剖析   总被引:2,自引:2,他引:2  
介绍了XML并详细阐述了XML的主要特点。通过XML与SGML、HTML、JAVA的比较阐述了XML是对eb一些方面的补充;能够使web上不同来源的结构化数据很容易地被集成、处理、多样显示和分发(数据可以被发送到本地处理)等。作为实例编写了一个采用Microsoft的msxml软件包实现的文档对象模型(DOM)。  相似文献   

4.
XML文档是个层状架构的信息体,可以用作数据源。使用XML数据岛和HTML绑定,能够很好地展示和更新信息。本文主要介绍XML数据岛运用于HTML文档的具体形式。  相似文献   

5.
在数字图书馆建设过程中,为有效利用早期直接存储于HTML表格中的图书资料信息,提出了一种将HTML表格转换为XML文档的方法。该方法利用HTML表格的格式化信息及其蕴涵的结构信息,对HTML表格的语义层次进行理解,然后将HTML表格数据转储于关系数据库中,最后利用关系数据库对XML文档的支持将数据库文件转换为XML文档。  相似文献   

6.
深入浅出XML     
本文深入浅出的介绍XML基本概念,以及与SGML、HTML不同的特点和应用领域,着重通过一个实例对XML与HTML的进行技术探讨分析。最后对XML的发展进行了展望。  相似文献   

7.
谭锋 《科技资讯》2011,(7):5-5,7
针对在Web信息抽取系统开发中遇到的关键性技术问题,如Web页的HTML文档下载,HTML到XML格式转换,XML文档清理等,分析和探讨了基于.NET技术的编程实现方法.  相似文献   

8.
XML正在成为Internet上数据描述和交换的标准,它将代替HTML而成为Web上存放数据的主要格式.首先讨论了XML的特点,然后介绍了XML的核心技术:DTD、XSL和XLink.并将XML、SGML和HTML作了相应比较,最后对XML数据库进行了简单介绍.  相似文献   

9.
HTML数据内容的抽取与集成   总被引:11,自引:0,他引:11  
在XML基础上,利用HTML Tidy可实现轻量级的Web数据挖掘和转换。转换过程主要解决的是HTML文档及其集合要表达的模式信息的分离。转换步骤是利用HTML Tidy提供的标准类库,净化HTML文档,借助DOM生成树对HTML元素结构做进一步分析,最后通过XSL、XPATH等自动提取转换。  相似文献   

10.
党杨阳 《甘肃科技》2011,27(19):40-42,11
XML( Extensible Markup Language)即可扩展标记语言,它与HTML一样,都是处于SGML,标准通用语言.XML是Internet环境中跨平台的、依赖于内容的技术,是当前处理结构化文档信息的有力工具,是一种简单的数据存储语言.目前XML已经成为表示Web上多样性数据的事实标准,可以预见,Web...  相似文献   

11.
XML技术在马铃薯专家系统中的应用   总被引:1,自引:0,他引:1  
比较了SML、HTML、XML的优缺点,介绍了XML在马铃薯专家系统中的应用,通过XML技术的应用,系统实现了内容在线更新、客户端与服务器端的XML/HTML交互,并创建了一组应用于农业领域的中文标记以及相应的XSL样式,从而节省了网络资源,使得系统可以更快地响应用户请求,同时,保证了系统的结构先进性、可扩展性。  相似文献   

12.
XML在数据共享中的应用   总被引:1,自引:0,他引:1  
介绍了XML的特点,分析了Schema的重要性和从数据库中提取数据的过程以及如何实现数据共享.  相似文献   

13.
HTML作为一种简单易用的标记语言,极大地推动了Internet的发展。但是随着Internet应用的展开,HTML已经不能满足人们的需要。作为下一代Internet,XML具有极大的灵活性和扩展性。文章描述了一个基于XML的数据交换的过程,用XML作为数据中介,实现了异构数据的集成的交换。  相似文献   

14.
XML文档检索技术研究   总被引:2,自引:0,他引:2  
网络信息资源急剧增长,如何利用数据检索技术有效的发现和使用资源成为亟待解决的问题.XM L具备许多HTM L没有的优点,更加适合应用于网络检索,探讨了XM L文档检索模型的主要技术问题,并提出了一种基于树查询的索引和部分匹配检索算法.  相似文献   

15.
通过对普通文件(Plain Text)、HTML文件和XML文件结构的分析,以经典的VSM为例,探讨了3种文件在信息检索过程中所采用的不同处理技术.同时针对传统VSM的不足以及HTML文件和XML文件的结构特点.讨论了N-Level VSM对经典VSM的改进.  相似文献   

16.
XML及其应用     
可扩展标记语言XML体积小 ,易于编辑 ,可以进行网络信息交换和网上数据库查询 ,优于另一个十分流行的置标语言HMTL .数学置标语言是XML的应用之一 ,它以文本的形式描述了数学的信息 ,它的设计遵守XML家族的协议 ,因而能够和XML的相关工具紧密协作 .本文还给出了一个创建数学方程的实例 ,并提到了XML的其他一些应用  相似文献   

17.
基于XML的3WICAI设计   总被引:3,自引:1,他引:2  
介绍了XML的特性和应用前景 ,并与HTML作了比较 .介绍了基于自动推理的ICAI的工作原理和特点 ,论证了 3WICAI的可行性与必要性 ,提出了一个基于XML的智能网络教育 (3WICAI)的设计模型 ,并给出了一个XMLDTD的实例 .  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号