首页 | 本学科首页   官方微博 | 高级检索  
     检索      

检索主题难易度评价
引用本文:吕学强,赖治国,孙斌,俞士汶.检索主题难易度评价[J].清华大学学报(自然科学版),2005,45(9):1833-1837.
作者姓名:吕学强  赖治国  孙斌  俞士汶
作者单位:北京大学,计算语言学研究所,北京,100871;北京信息科技大学,北京,100101;北京大学,计算语言学研究所,北京,100871
基金项目:国家"八六三"高技术项目(2002AA117010-8);国家自然科学基金资助项目(60203022)
摘    要:TREC2004 Robust任务有一项新要求,就是要把检索主题按照从易到难的顺序排列.针对新的要求,提出了基于单词歧义性大小的检索主题难易度模型.根据WordNet和它附带的Brown语料库构造了单词义项分布词典,再把检索主题中的单词按歧义性大小分为7类,通过计算平均单词容易度来度量检索主题的难度.实验结果表明,该模型有一定的预测能力.最后用此模型预测了TREC2004 Robust任务的250个检索主题的难易度.

关 键 词:信息检索  文本检索会议  鲁棒性任务  检索主题难易度  义项分布
文章编号:1000-0054(2005)S1-1833-05
修稿时间:2005年5月20日

Evaluation of topic difficulty
L Xueqiang,LAI Zhiguo,SUN Bin,YU Shiwen.Evaluation of topic difficulty[J].Journal of Tsinghua University(Science and Technology),2005,45(9):1833-1837.
Authors:L Xueqiang  LAI Zhiguo  SUN Bin  YU Shiwen
Institution:L(U) Xueqiang,LAI Zhiguo,SUN Bin,YU Shiwen
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号