首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种词汇共现算法及共现词对检索系统排序的影响
引用本文:陈翀,彭波,闫宏飞,王继民.一种词汇共现算法及共现词对检索系统排序的影响[J].清华大学学报(自然科学版),2005,45(9):1857-1860.
作者姓名:陈翀  彭波  闫宏飞  王继民
作者单位:北京大学,信息科学技术学院,北京,100871
基金项目:国家自然科学基金重点资助项目(60435020);教育部博士点基金项目(20030001076)
摘    要:为了探讨共现词对检索系统排序相关性的影响,提出一种新的共现词汇算法--FDC.算法中考虑了词汇在文档中的共现频度、相对距离和共文档率.从天网搜索引擎查询日志中选取部分查询词,用本算法和潜在语义索引(LSI)方法分别求其共现词汇,并以相同的评分策略改变原始排序结果.Discounted cumulative gain(DCG)评估结果表明,本算法获得的共现词在99%的置信度下对原始排序的相关性有改进;而LSI方法获得的共现词对排序相关性也表现出同样显著的改进效果.结果显示共现词汇能改进检索系统结果排序的相关性,并且不依赖于特定算法.

关 键 词:共现词汇  排序  相关性  信息检索
文章编号:1000-0054(2005)S1-1857-04
修稿时间:2005年5月20日

A term co-occurrence algorithm and the effect of co-occurrence terms on result ranking for information retrieval
CHEN Chong,PENG Bo,YAN Hongfei,WANG Jimin.A term co-occurrence algorithm and the effect of co-occurrence terms on result ranking for information retrieval[J].Journal of Tsinghua University(Science and Technology),2005,45(9):1857-1860.
Authors:CHEN Chong  PENG Bo  YAN Hongfei  WANG Jimin
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号