首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于 DOM 的 Web 信息抽取规则的构造与实现
引用本文:杨敬伟,杨文柱,高悦.基于 DOM 的 Web 信息抽取规则的构造与实现[J].河北大学学报(自然科学版),2007,27(2):209-212.
作者姓名:杨敬伟  杨文柱  高悦
作者单位:1.河北大学,科技处,河北,保定,071002; 2.河北大学,数学与计算机学院,河北,保定,071002; 3.信息产业部,电信研究院,北京,100037
摘    要:为了实现对Web信息的查询重、构和再利用,人们采用了Web信息抽取技术.本文主要讨论基于 DOM 的 Web 信息抽取,研究如何构造抽取规则,才能提高信息抽取的准确度、提高抽取规则的适应能力,并给出了抽取规则的生成过程.

关 键 词:DOM  Web信息抽取  抽取规则  
文章编号:1000-1565(2007)02-0209-04
修稿时间:2006年5月20日

Rules Construction and Implementation in DOM-based Web Information Extraction
YANG Jing-wei,YANG Wen-zhu,GAO Yue.Rules Construction and Implementation in DOM-based Web Information Extraction[J].Journal of Hebei University (Natural Science Edition),2007,27(2):209-212.
Authors:YANG Jing-wei  YANG Wen-zhu  GAO Yue
Abstract:Web information extraction techniques were applied to Web information query,reconstruction and reuse.In this paper,we mainly discussed DOM-based Web information extraction,studied how to construct extraction rules to improve precision ratio of extraction and adaptation of extraction rules,and the rules' generation procedure is also presented.
Keywords:DOM  Web information extraction  extraction rule
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《河北大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《河北大学学报(自然科学版)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号