首页 | 本学科首页   官方微博 | 高级检索  
     检索      

Web的半结构化数据抽取的方法及其实现
引用本文:杨晓宇.Web的半结构化数据抽取的方法及其实现[J].太原师范学院学报(自然科学版),2003,2(3):36-39.
作者姓名:杨晓宇
作者单位:山西机电职工学院,大众分院,山西,太原,030024
摘    要:Web数据存在方式的特殊性使Web数据控制变得十分复杂,把现有的Web页面转换成XML可以使那些熟悉Web最常用技术的开发人员能快速而便捷地获取他们所需的以Web方式发布的信息.描述了从目前存在的最大信息来源-万维网-抽取信息的方法和实现过程.

关 键 词:半结构化数据  Web  数据控制  XML  信息抽取  数据抽取技术  数据抽取系统
文章编号:1672-2027(2003)03-0036-04
修稿时间:2003年7月22日

The Means and Realization of Partly-Structured Data Extract on Web
Yang Xiaoyu.The Means and Realization of Partly-Structured Data Extract on Web[J].Journal of Taiyuan Normal University:Natural Science Edition,2003,2(3):36-39.
Authors:Yang Xiaoyu
Abstract:The particularity of Web data's existent mo de complicates it's control, and the transformation from existing Web page to XML may make developers who are proficient at common Web technology access the infor mation rapidly and conveniently, which has been released on Web. The means and r ealization of information acquirement from Web largely existing information sour ce were described.
Keywords:partly-structured data  XML  data extract  clas s methods of XML Helper
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号