首页 | 本学科首页   官方微博 | 高级检索  
     检索      

文本信息检索的代数模型综述
引用本文:王修力,马利平.文本信息检索的代数模型综述[J].吉林大学学报(信息科学版),2007,25(3):299-299.
作者姓名:王修力  马利平
作者单位:[1]上海交通大学外国语学院,上海200030 [2]山东济南广播电视大学信息学院,济南250001 [3]中国冶金地质勘查工程总局山东局,济南250014
摘    要:为了比较各模型的性能,研究进一步改进文本信息检索各类模型的可能方法,综合已有的试验及发表的研究报告,概述文本信息检索模型中一类模型——代数模型概念和研究现状,并分析了目前文本信息检索的相关性、相似度、召回率、准确率等概念。结果表明,这几个模型尽管来源于神经网络、向量空间等不同的思想,广义向量空间模型、潜在语义标引模型的计算复杂度比向量空间模型高,但此类模型依据评测在准确率和召回率上相近,经典向量空间模型相对而言,有简单、复杂度低和可作为检索框架,而不仅仅是检索模型的特点。为便于研究者研究、改进、评测信息检索的代数模型,介绍并评价了权威的TREC(The Text Retrieval Conference)和两个代表性的研究系统smart和lemur。

关 键 词:文本信息检索  相关性  相似度  代数模型  召回率  准确率
本文献已被 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号