首页 | 本学科首页   官方微博 | 高级检索  
     

文本信息检索的代数模型综述
引用本文:王修力,马利平. 文本信息检索的代数模型综述[J]. 吉林大学学报(信息科学版), 2007, 25(5): 569-576
作者姓名:王修力  马利平
作者单位:山东济南广播电视大学,信息学院,济南,250001;山东正元地球物理勘测有限公司,济南,250014
摘    要:为了比较各类模型的性能,研究进一步改进文本信息检索各类模型的可能方法,综合已有的试验和研究报告,概述了文本信息检索模型中一类模型——代数模型概念和研究现状,并分析了目前文本信息检索的相关性、相似度、召回率、准确率等概念。结果表明,这几个模型尽管来源于神经网络、向量空间等不同的思想,广义向量空间模型、潜在语义标引模型的计算复杂度比向量空间模型高,但此类模型依据评测在准确率和召回率上相近,经典向量空间模型相对而言,有简单、复杂度低和可作为检索框架,而不仅仅是检索模型的特点。为便于研究者研究、改进、评测信息检索的代数模型,评价了权威的TREC(The Text Retrieval Conference)和两个代表性的研究系统Smart和Lemur。

关 键 词:文本信息检索  相关性  相似度  代数模型  召回率  准确率
文章编号:1671-5896(2007)05-0569-08
收稿时间:2007-01-15

Algebraic Models of Text Retrieval Model: Overview
WANG Xiu-li,MA Li-ping. Algebraic Models of Text Retrieval Model: Overview[J]. Journal of Jilin University:Information Sci Ed, 2007, 25(5): 569-576
Authors:WANG Xiu-li  MA Li-ping
Abstract:As the importance of the text retrieval increase,many models have been presented.To compare the performance of models and search for the possible approach to improve the models,the article outlines one kind of IR model the algebraic models and the situations of contemporary research,based on the experiments and research of the domain,analysis's relevance,similarity,algebraic model,recall,precision,concluding that the algebraic models are all similar in their recall and precision and the space vector model is simple,low-complexity,and a retrieval frame rather than only a retrieval model although these models are resulted from different ideas.The TREC(Text Retrieval Conference) and some software for experiment and research are introduced and evaluated briefly for researcher to study and develop the algebraic model.
Keywords:text information retrieval  relevance  similarity  algebraic model  recall  precision
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号