首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于探测查询的Deep Web实体识别
引用本文:李石生,刘海博,路小英,王亮.基于探测查询的Deep Web实体识别[J].江西师范大学学报(自然科学版),2008,32(2):166-170.
作者姓名:李石生  刘海博  路小英  王亮
作者单位:1. 河北大学,数学与计算机学院,河北,保定,071000
2. 河北农业大学,信息科学与技术学院,河北,保定,071001
基金项目:河北省科技攻关项目 , 河北省教育厅科研项目 , 保定市科技攻关计划项目
摘    要:目前,Web上存在很多Deep Web网站,而各个网站的数据表现形式有很大的差别.因此要集成这些网站就需要正确抽取其中的数据,并将其中表示同一实体的数据合并.该文提出了一种基于探测查询的方法来自动完成页面的数据抽取及实体识别工作,该方法通过提交查询可以在提取数据的同时确定实体的各个属性,根据实体的各个属性进行实体识别.实验表明,该方法具有较高的实体识别准确率.

关 键 词:Deep  Web  数据抽取  实体识别
文章编号:1000-5862(2008)02-0166-05
修稿时间:2007年12月1日

Deep Web Entity Identification Based on Probing Query
LI Shi-sheng,LIE Hai-bo,LU Xiao-ying,WANG Liang.Deep Web Entity Identification Based on Probing Query[J].Journal of Jiangxi Normal University (Natural Sciences Edition),2008,32(2):166-170.
Authors:LI Shi-sheng  LIE Hai-bo  LU Xiao-ying  WANG Liang
Abstract:There are many Deep Web sites on the Web,and the display forms are differ in thousands way.Therefore,we need extract internal data and merge the same entity if we would like to integrate these Web-sites. This paper proposes a method which can automatically achieve data extraction of page layout and entity identification process, based on transmitting query.In addition,this method can contribute on picking up data and finding out each attribute to identify the entity through detecting query at the same time.The experiments indicates that the accuracy is good.
Keywords:Deep Web  data extraction  entity identification
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号