首页 | 本学科首页   官方微博 | 高级检索  
     检索      

识别和抽取XML文档中的关系信息及其出现模式
引用本文:雷庆,吴扬扬.识别和抽取XML文档中的关系信息及其出现模式[J].清华大学学报(自然科学版),2005,45(9):1757-1761.
作者姓名:雷庆  吴扬扬
作者单位:华侨大学,计算机科学系,泉州,362021
基金项目:国务院侨办科研基金资助项目(03QZR5);福建省科技计划资助项目(2004I014)
摘    要:Web中存在着大量描述实体间相互关联的信息,而目前的搜索引擎缺乏知识的处理和理解能力,无法对Web中的关系信息进行识别.该文以XML作为研究对象,提出了一种XML文档中识别和抽取关系信息及其出现模式的方法.该方法按照用户的挖掘请求搜集XML文档;通过计算XML文档的相似度来识别目标文档;建立用户挖掘模式并与目标文档进行模式匹配实现关系数据的抽取.实验结果表明提出的XML相似度计算方法能较好的实现目标文档的识别,同时采用的模式表达和匹配方式也能较准确地从目标文档中抽取出用户所需的关系数据.

关 键 词:关系信息  XML相似度  模式匹配  数据抽取
文章编号:1000-0054(2005)S1-1757-05
修稿时间:2005年5月20日

Recognizing and extracting relations and patterns from XML documents
LEI Qing,WU Yangyang.Recognizing and extracting relations and patterns from XML documents[J].Journal of Tsinghua University(Science and Technology),2005,45(9):1757-1761.
Authors:LEI Qing  WU Yangyang
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号