文本信息检索的代数模型综述 |
| |
引用本文: | 王修力,马利平.文本信息检索的代数模型综述[J].吉林大学学报(信息科学版),2007,25(3):299-299. |
| |
作者姓名: | 王修力 马利平 |
| |
作者单位: | [1]上海交通大学外国语学院,上海200030 [2]山东济南广播电视大学信息学院,济南250001 [3]中国冶金地质勘查工程总局山东局,济南250014 |
| |
摘 要: | 为了比较各模型的性能,研究进一步改进文本信息检索各类模型的可能方法,综合已有的试验及发表的研究报告,概述文本信息检索模型中一类模型——代数模型概念和研究现状,并分析了目前文本信息检索的相关性、相似度、召回率、准确率等概念。结果表明,这几个模型尽管来源于神经网络、向量空间等不同的思想,广义向量空间模型、潜在语义标引模型的计算复杂度比向量空间模型高,但此类模型依据评测在准确率和召回率上相近,经典向量空间模型相对而言,有简单、复杂度低和可作为检索框架,而不仅仅是检索模型的特点。为便于研究者研究、改进、评测信息检索的代数模型,介绍并评价了权威的TREC(The Text Retrieval Conference)和两个代表性的研究系统smart和lemur。
|
关 键 词: | 文本信息检索 相关性 相似度 代数模型 召回率 准确率 |
本文献已被 维普 等数据库收录! |
|