共查询到17条相似文献,搜索用时 93 毫秒
1.
一种基于XML的Web数据抽取的实现 总被引:2,自引:0,他引:2
Web数据挖掘的研究越来越广泛,对Web数据的抽取则是研究的前提和必要的步骤.而当前Web信息大多数都是HTML格式的,存在很多缺陷.针对目前研究,简单地介绍了XML及它的特点,并且对HTMLand XML从开放性、可操作性等几个方面做了比较,显示出了XML的优越性.最后利用一个实例简述了基于XML的数据抽取过程. 相似文献
2.
林继成 《安庆师范学院学报(自然科学版)》2003,9(4):66-68,75
运用XML数据岛技术和文档对象模型技术,给出并详细解释了在IE窗口中显示HTML源代码片段或显示整个HTML文档的源代码的更快捷、结构上更清晰的方案。 相似文献
3.
4.
XML文档是个层状架构的信息体,可以用作数据源。使用XML数据岛和HTML绑定,能够很好地展示和更新信息。本文主要介绍XML数据岛运用于HTML文档的具体形式。 相似文献
5.
林晓莉 《科技情报开发与经济》2011,21(20):80-83,92
在数字图书馆建设过程中,为有效利用早期直接存储于HTML表格中的图书资料信息,提出了一种将HTML表格转换为XML文档的方法。该方法利用HTML表格的格式化信息及其蕴涵的结构信息,对HTML表格的语义层次进行理解,然后将HTML表格数据转储于关系数据库中,最后利用关系数据库对XML文档的支持将数据库文件转换为XML文档。 相似文献
6.
7.
针对在Web信息抽取系统开发中遇到的关键性技术问题,如Web页的HTML文档下载,HTML到XML格式转换,XML文档清理等,分析和探讨了基于.NET技术的编程实现方法. 相似文献
8.
XML正在成为Internet上数据描述和交换的标准,它将代替HTML而成为Web上存放数据的主要格式.首先讨论了XML的特点,然后介绍了XML的核心技术:DTD、XSL和XLink.并将XML、SGML和HTML作了相应比较,最后对XML数据库进行了简单介绍. 相似文献
9.
HTML数据内容的抽取与集成 总被引:11,自引:0,他引:11
在XML基础上,利用HTML Tidy可实现轻量级的Web数据挖掘和转换。转换过程主要解决的是HTML文档及其集合要表达的模式信息的分离。转换步骤是利用HTML Tidy提供的标准类库,净化HTML文档,借助DOM生成树对HTML元素结构做进一步分析,最后通过XSL、XPATH等自动提取转换。 相似文献
10.
XML( Extensible Markup Language)即可扩展标记语言,它与HTML一样,都是处于SGML,标准通用语言.XML是Internet环境中跨平台的、依赖于内容的技术,是当前处理结构化文档信息的有力工具,是一种简单的数据存储语言.目前XML已经成为表示Web上多样性数据的事实标准,可以预见,Web... 相似文献
11.
XML技术在马铃薯专家系统中的应用 总被引:1,自引:0,他引:1
比较了SML、HTML、XML的优缺点,介绍了XML在马铃薯专家系统中的应用,通过XML技术的应用,系统实现了内容在线更新、客户端与服务器端的XML/HTML交互,并创建了一组应用于农业领域的中文标记以及相应的XSL样式,从而节省了网络资源,使得系统可以更快地响应用户请求,同时,保证了系统的结构先进性、可扩展性。 相似文献
12.
13.
杨晓宇 《科技情报开发与经济》2004,14(4):140-141
HTML作为一种简单易用的标记语言,极大地推动了Internet的发展。但是随着Internet应用的展开,HTML已经不能满足人们的需要。作为下一代Internet,XML具有极大的灵活性和扩展性。文章描述了一个基于XML的数据交换的过程,用XML作为数据中介,实现了异构数据的集成的交换。 相似文献
14.
XML文档检索技术研究 总被引:2,自引:0,他引:2
网络信息资源急剧增长,如何利用数据检索技术有效的发现和使用资源成为亟待解决的问题.XM L具备许多HTM L没有的优点,更加适合应用于网络检索,探讨了XM L文档检索模型的主要技术问题,并提出了一种基于树查询的索引和部分匹配检索算法. 相似文献
15.
陈桂鸿 《科技情报开发与经济》2009,19(11)
通过对普通文件(Plain Text)、HTML文件和XML文件结构的分析,以经典的VSM为例,探讨了3种文件在信息检索过程中所采用的不同处理技术.同时针对传统VSM的不足以及HTML文件和XML文件的结构特点.讨论了N-Level VSM对经典VSM的改进. 相似文献
16.
可扩展标记语言XML体积小 ,易于编辑 ,可以进行网络信息交换和网上数据库查询 ,优于另一个十分流行的置标语言HMTL .数学置标语言是XML的应用之一 ,它以文本的形式描述了数学的信息 ,它的设计遵守XML家族的协议 ,因而能够和XML的相关工具紧密协作 .本文还给出了一个创建数学方程的实例 ,并提到了XML的其他一些应用 相似文献
17.
基于XML的3WICAI设计 总被引:3,自引:1,他引:2
介绍了XML的特性和应用前景 ,并与HTML作了比较 .介绍了基于自动推理的ICAI的工作原理和特点 ,论证了 3WICAI的可行性与必要性 ,提出了一个基于XML的智能网络教育 (3WICAI)的设计模型 ,并给出了一个XMLDTD的实例 . 相似文献