首页 | 本学科首页   官方微博 | 高级检索  
     检索      

以本体为指导的Web网页信息抽取方法
引用本文:程文涛,师雪霖.以本体为指导的Web网页信息抽取方法[J].北京化工大学学报(自然科学版),2011,38(4):134-139.
作者姓名:程文涛  师雪霖
作者单位:北京化工大学 信息科学与技术学院,北京,100029;北京化工大学 信息科学与技术学院,北京,100029
摘    要:针对Web网页中事物描述信息的特点,提出了一种通过本体指导网页信息抽取的方法。首先建立抽取对象的本体模型,并为本体属性概念添加定位信息映射模型,通过映射模型定位和分离样本页中包含语义信息的数据块,结合路径分析算法生成抽取规则,之后利用抽取规则对同类网页中的事物描述信息进行抽取,最后以资源描述框架(RDF)数据格式储存信息。抽取性能测试实验表明,抽取结果具有较高的准确率,与无规则抽取方法相比,具有更高的抽取效率。

关 键 词:信息抽取  本体  语义  资源描述框架  Web
收稿时间:2011-02-24

Web page information extraction guided by ontology
CHENG WenTao,SHI XueLin.Web page information extraction guided by ontology[J].Journal of Beijing University of Chemical Technology,2011,38(4):134-139.
Authors:CHENG WenTao  SHI XueLin
Institution:College of Information Science and Technology, Beijing University of Chemical Technology, Beijing 100029, China
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《北京化工大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《北京化工大学学报(自然科学版)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号