首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于XML描述的WEB信息抽取技术研究
引用本文:色菲,王佳,潘超.基于XML描述的WEB信息抽取技术研究[J].科技信息,2007(34):75-75,52.
作者姓名:色菲  王佳  潘超
作者单位:长春工业大学计算机科学与工程学院 吉林长春130012
摘    要:互联网已成为人们获得信息、取得服务的重要渠道之一。Web上的数据最大特点就是半结构化。由于目前网络上信息的主要组织形式是HTML格式,而HTML标记语言只描述数据的表现形式,不描述数据含义及结构。因此,计算机无法自动识别。而XML是面向语义的语言,它的产生为解决这一问题提供了条件,即XML能够较好地为计算机所识别。因此本文分析了对由XML表示的数据进行数据抽取的过程。

关 键 词:数据抽取  XML  半结构化数据
本文献已被 CNKI 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号