基于XML描述的WEB信息抽取技术研究 The Web information extraction technology research based on XML description期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于XML描述的WEB信息抽取技术研究

引用本文：	色菲,王佳,潘超. 基于XML描述的WEB信息抽取技术研究[J]. 科技信息, 2007, 0(34): 75-75,52

作者姓名：	色菲王佳潘超

作者单位：	长春工业大学计算机科学与工程学院吉林长春130012

摘要：	互联网已成为人们获得信息、取得服务的重要渠道之一。Web上的数据最大特点就是半结构化。由于目前网络上信息的主要组织形式是HTML格式,而HTML标记语言只描述数据的表现形式,不描述数据含义及结构。因此,计算机无法自动识别。而XML是面向语义的语言,它的产生为解决这一问题提供了条件,即XML能够较好地为计算机所识别。因此本文分析了对由XML表示的数据进行数据抽取的过程。
关键词：	数据抽取 XML 半结构化数据
The Web information extraction technology research based on XML description

Shai Fei Wang Jia Pan Chao. The Web information extraction technology research based on XML description[J]. Science, 2007, 0(34): 75-75,52

Authors:	Shai Fei Wang Jia Pan Chao

Affiliation:	Shai Fei Wang Jia Pan Chao

Abstract:

Keywords:	Data Extraction XML Semi-Structured Data
本文献已被 CNKI 维普等数据库收录！