首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于关键字距离模型的XML文档检索方法
引用本文:王鹏.基于关键字距离模型的XML文档检索方法[J].科学技术与工程,2011,11(6):1241-1245.
作者姓名:王鹏
作者单位:1. 西北工业大学计算机学院,西安,710072
2. 西北工业大学计算机学院,西安,710072;河南科技大学电信学院,洛阳,471003
基金项目:国家高技术研究发展计划(863计划);国家自然科学基金项目(面上项目,重点项目,重大项目)
摘    要:在信息检索中,关键词之间的距离反映了其对信息描述的集中程度,并对检索结果与用户需求的相关度产生影响。通过对XML数据固有的结构信息进行深入分析,确定了被检索数据的信息对象和信息分支的概念,并考虑以上因素建立语义距离模型。通过该模型的计算,能够更准确地计算出查询结果的相关度。实验结果证明:在真实数据集上,查询质量方面优于现有的主流算法(EASE、SLCA),同时具有较高的查询效率。

关 键 词:XML  关键距离  检索  排序
收稿时间:2010/11/29 0:00:00
修稿时间:2010/11/29 0:00:00

Effective Keyword Proximity Search over XML documents
wangpeng.Effective Keyword Proximity Search over XML documents[J].Science Technology and Engineering,2011,11(6):1241-1245.
Authors:wangpeng
Institution:WANG Peng1,CHEN Qun1,LOU Ying1,2(School of Computer Science,Northwestern Polytechnical University1,Xi'an 710072,P.R.China,Electronic Information Engineering College,University of Technology of Henan2,Luoyang 471003,P.R.China)
Abstract:Keywords proximity reflects the degree of information concentration and affects the relevance between search results and information needs. In this paper, with deeply analyzing the inherent structure information of XML data, we propose the concepts of information object and information branch. We then establish the keyword proximity model based on these concepts. With the model, we can measure the semantic distance of keywords for computing more relevant results. Our extensive experiments on real datasets demonstrate effectiveness and efficiency of the proposed approach.
Keywords:XML  keyword proximity  search  ranking
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《科学技术与工程》浏览原始摘要信息
点击此处可从《科学技术与工程》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号