基于XML描述的WEB信息抽取技术研究 |
| |
引用本文: | 色菲,王佳,潘超.基于XML描述的WEB信息抽取技术研究[J].科技信息,2007(34):75-75,52. |
| |
作者姓名: | 色菲 王佳 潘超 |
| |
作者单位: | 长春工业大学计算机科学与工程学院 吉林长春130012 |
| |
摘 要: | 互联网已成为人们获得信息、取得服务的重要渠道之一。Web上的数据最大特点就是半结构化。由于目前网络上信息的主要组织形式是HTML格式,而HTML标记语言只描述数据的表现形式,不描述数据含义及结构。因此,计算机无法自动识别。而XML是面向语义的语言,它的产生为解决这一问题提供了条件,即XML能够较好地为计算机所识别。因此本文分析了对由XML表示的数据进行数据抽取的过程。
|
关 键 词: | 数据抽取 XML 半结构化数据 |
本文献已被 CNKI 维普 等数据库收录! |
|