首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于句法特征的冗长查询处理技术
引用本文:姚兰,林鸿飞,林原,马云龙.基于句法特征的冗长查询处理技术[J].北京大学学报(自然科学版),2013,49(2):213.
作者姓名:姚兰  林鸿飞  林原  马云龙
作者单位:大连理工大学信息检索研究室, 大连 116024;
基金项目:国家自然科学基金,863计划,教育部留学回国人员科研启动基金和高等学校博士学科点专项科研基金
摘    要:将传统的“词袋”思想进行扩展, 把文档看成由句子组成的“句袋”, 通过依存句法分析得到“句袋”与查询中词间的依存关系。利用两者依存关系的匹配程度, 计算冗长查询和初次检索返回文档之间的相似度, 对初始检索结果进行重排序。通过在TREC标准数据集上的实验, 证明该方法能够较有效地解决查询的冗长导致偏离查询主题和低召回率情况下相关文档排序靠后的问题。特别是对于低召回率的情况, 检索结果的MAP值和P@N都有显著提高。

关 键 词:依存关系  冗长查询  结果重构  查询扩展  
收稿时间:2012-03-01

A Parsing Approach for Verbose Queries
YAO Lan,LIN Hongfei,LIN Yuan,MA Yunlong.A Parsing Approach for Verbose Queries[J].Acta Scientiarum Naturalium Universitatis Pekinensis,2013,49(2):213.
Authors:YAO Lan  LIN Hongfei  LIN Yuan  MA Yunlong
Institution:Information Retrieval Laboratory, Dalian University of Technology, Dalian 116024;
Abstract:The authors extended the traditional “bag of words” idea. Every document was regarded as “bag of sentences”. The dependency relationship of the words was obtained from the “bag of sentences” and verbose queries by dependency parsing. According to the matching degree of the dependence relationship, the similarity scores between verbose queries and documents was obtained. Finally, the initial results were re-ranked. Experiment on a standard TREC corpus shows that new approach can improve retrieval effectiveness for verbose query and the low recall rate. For the low recall rate, the MAP and P@N have a significantly improvement.
Keywords:dependency relationship  verbose queries  result reconfiguration  query expansion  
本文献已被 万方数据 等数据库收录!
点击此处可从《北京大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《北京大学学报(自然科学版)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号