识别和抽取XML文档中的关系信息及其出现模式 Recognizing and extracting relations and patterns from XML documents期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

识别和抽取XML文档中的关系信息及其出现模式

引用本文：	雷庆,吴扬扬.识别和抽取XML文档中的关系信息及其出现模式[J].清华大学学报(自然科学版),2005,45(9):1757-1761.

作者姓名：	雷庆吴扬扬

作者单位：	华侨大学,计算机科学系,泉州,362021

基金项目：	国务院侨办科研基金资助项目(03QZR5);福建省科技计划资助项目(2004I014)

摘要：	Web中存在着大量描述实体间相互关联的信息,而目前的搜索引擎缺乏知识的处理和理解能力,无法对Web中的关系信息进行识别.该文以XML作为研究对象,提出了一种XML文档中识别和抽取关系信息及其出现模式的方法.该方法按照用户的挖掘请求搜集XML文档;通过计算XML文档的相似度来识别目标文档;建立用户挖掘模式并与目标文档进行模式匹配实现关系数据的抽取.实验结果表明提出的XML相似度计算方法能较好的实现目标文档的识别,同时采用的模式表达和匹配方式也能较准确地从目标文档中抽取出用户所需的关系数据.
关键词：	关系信息 XML相似度模式匹配数据抽取
文章编号：	1000-0054(2005)S1-1757-05
修稿时间：	2005年5月20日
Recognizing and extracting relations and patterns from XML documents

LEI Qing,WU Yangyang.Recognizing and extracting relations and patterns from XML documents[J].Journal of Tsinghua University(Science and Technology),2005,45(9):1757-1761.

Authors:	LEI Qing WU Yangyang

Abstract:

Keywords:
本文献已被万方数据等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏