首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
基于向量空间模型的信息检索系统的研究与实现   总被引:2,自引:0,他引:2  
赵耀红 《长春大学学报》2009,19(8):25-27,31
基于向量空间模型的信息检索系统具有良好的性能。本文阐述了向量空间模型的基本概念和思想,提出了一个基于向量空间模型的信息检索系统的体系结构模型,进一步讨论了该系统实现的关键技术和实现方法。  相似文献   

2.
为了提高信息检索系统检索性能,针对信息检索系统中普遍使用的向量空间模型(VSM)所固有的缺陷,提出一种新的基于分类和扩展向量空间模型CE-BVSM(Classifier and Expand-Based Vector Space Model)。该模型对传统的空间向量法进行了改进,引入分词技术、朴素贝叶斯分类器和专业词库,重新定义了资源特征向量和查询索引项的内容,参考关键词出现的频率及其在所描述的资源中所起的作用等因素来计算特征索引项和资源向量的权重值。在此基础上,又对查询索引项使用了基于专业词库的扩展策略。实验证明该模型使检索能够在相对精确的范围内进行,提高检索查准率和查全率,改善了信息检索系统的性能。  相似文献   

3.
基于向量空间的信息检索系统的评价方法   总被引:1,自引:0,他引:1  
针对基于向量空间的信息检索系统给出了两种计算方法:基于文献--关键词矩阵和文献查询--评价者矩阵的计算方法.查全率和查准率在衡量基于向量空间的信息检索系统时,存在不足之处,根据基于向量空间的信息检索系统输出的检索结果的特点,提出了一种新的评价方法:偏移距离法.  相似文献   

4.
针对当前定量化的地理信息检索模型无法有效处理自然语义导致检索结果不理想的问题, 以语义匹配为原则, 以定性表达为基础, 以推理方法为手段, 提出基于定性空间推理的定性地理信息检索的方法及其形式化模型, 实现Web文档信息内容与查询请求的定性表达和信息提取, 支持基于语义的检索匹配和结果排序, 并进行原型系统的实验验证。这种定性检索方法符合人类常识性认知和表述习惯的方式, 基于定性知识表达和推理决策技术的地理信息检索问题解决方法可以提高现代地理信息检索技术的有效性。  相似文献   

5.
一种基于同义词词典的模糊查询扩展方法   总被引:2,自引:0,他引:2  
在信息检索系统中,查询扩展是一种非常有效的改进检索性能的方法. 为此,提出一种基于同义词词典的模糊查询扩展方法. 该方法中的同义词词典是基于著名的语义词典WordNet中的同义词集合建立的,同义词之间的贴近度[0, 1]使用Tanimoto系数获得. 利用该词典,能够进行较好的查询扩展. 将该方法与向量空间模型结合应用于文本信息检索系统中,所构造的检索模型相当于一种简单的语义模型,并且可以根据阈值来控制查询扩展的程度. 所得试验结果表明,使用该查询扩展方法的信息检索系统较常规信息检索系统的检索性能有一定改善.  相似文献   

6.
P2P信息检索的研究大多集中于资源搜索机制,而P2P存储系统是一个多结构数据存储系统,系统中有多个数据源,数据有各种表示形式,不同的用户对相同的现实世界的实体可能会使用不同的描述数据,有不同的表示,这样必然会产生语义异构的问题.首次将体裁互文性概念拓展到信息空间,设计和实现了一个基于体裁互文性的P2P信息检索模型,探讨了基本概念和性质,并以原型系统的数据为样本,对理论进行了验证.实验表明本文所设计方法在Bpref信息检索典型评价指标上取得了较好的效果.  相似文献   

7.
为了比较各类模型的性能,研究进一步改进文本信息检索各类模型的可能方法,综合已有的试验和研究报告,概述了文本信息检索模型中一类模型——代数模型概念和研究现状,并分析了目前文本信息检索的相关性、相似度、召回率、准确率等概念。结果表明,这几个模型尽管来源于神经网络、向量空间等不同的思想,广义向量空间模型、潜在语义标引模型的计算复杂度比向量空间模型高,但此类模型依据评测在准确率和召回率上相近,经典向量空间模型相对而言,有简单、复杂度低和可作为检索框架,而不仅仅是检索模型的特点。为便于研究者研究、改进、评测信息检索的代数模型,评价了权威的TREC(The Text Retrieval Conference)和两个代表性的研究系统Smart和Lemur。  相似文献   

8.
基于本体的Web智能信息检索系统   总被引:1,自引:0,他引:1  
利用领域本体知识库对用户的查询信息进行语义扩展,提出了一个Web环境下的智能信息检索系统,并讨论了该系统的体系结构,解决了传统的基于关键字的信息检索只能从句法上对关键字进行分析、而忽视关键字本身语义信息所造成的错检和漏检,以及无法根据信息资源中的语义关系进行检索的问题。与传统检索方法相比,该系统原型的试验结果表明,检索效率有了很大的提高。  相似文献   

9.
个性化Web信息代理的研究与开发   总被引:3,自引:0,他引:3  
介绍了在Web信息检索过程中通过个性化信息代理(Agent)实现个性化信息反馈的工作、提出了信息Agent模型,涉及元搜索引擎的实现和个性化偏好模型的建立,且通过主动服务代理实现个人偏好查询结果的推送.提高了在Web信息检索过程中系统随用户关注程度和关注领域不断变化而调整信息反馈的能力,并在此设计基础上实现了一个原型系统.  相似文献   

10.
为了比较各模型的性能,研究进一步改进文本信息检索各类模型的可能方法,综合已有的试验及发表的研究报告,概述文本信息检索模型中一类模型——代数模型概念和研究现状,并分析了目前文本信息检索的相关性、相似度、召回率、准确率等概念。结果表明,这几个模型尽管来源于神经网络、向量空间等不同的思想,广义向量空间模型、潜在语义标引模型的计算复杂度比向量空间模型高,但此类模型依据评测在准确率和召回率上相近,经典向量空间模型相对而言,有简单、复杂度低和可作为检索框架,而不仅仅是检索模型的特点。为便于研究者研究、改进、评测信息检索的代数模型,介绍并评价了权威的TREC(The Text Retrieval Conference)和两个代表性的研究系统smart和lemur。  相似文献   

11.
Web信息抽取与语义检索框架   总被引:1,自引:1,他引:0  
提出了一种Web信息抽取与语义检索框架,采用定制本体模型,针对Web网页特点设计了抽取与语义标引策略,并在检索过程中引入语义推理机制,从而改善了信息检索的效果.最后介绍了基于Jena实现的该框架的原型系统.  相似文献   

12.
随着信息科学技术的不断进步,图书馆也将信息技术引入到管理的过程中来,建立了图书资料信息检索系统,给大量的图书管理工作带来了很大的便利,为了进一步扩充图书资料信息检索技术的应用范围和功能,现将多媒体技术与科技图书资料信息检索技术结合起来,扩大了信息空间,实现了信息资源利用的最大化。  相似文献   

13.
传统的跨语言信息检索存在翻译映射准确度低和查询扩展后语义偏离等问题。为此提出结合统计学和 本体论的方法构建多语言信息检索模型,通过使用统计翻译解决翻译映射歧义问题,使用多本体BabelNet 等减 少语义关联度损失。由于本体包含大量概念联系,因此使用本体作为语义层表示设计了语义权重算法,并将其 构建在BM25F 统计信息检索模型上作为用户反馈的排序算法。最后根据建立的模型设计实现了多语言信息检 索原型系统,并用基于爬虫技术获取的数据测试集对模型进行测试,实验结果表明,该模型平均查准率高于传 统的基于机器翻译的信息检索模型。  相似文献   

14.
信息检索系统中信息模型的建立方法研究   总被引:1,自引:0,他引:1  
在信息检索引擎中,信息模型的建立方法对信息检索的速度起着重要的作用。在总结了布尔模型、向量空间模型、概率模型3类信息模型建立方法的基础上,提出了新的用户模型建立方法。该方法可在自适应信息检索系统中根据用户的特征,实现“检索正确的信息,在正确的时间,采用正确的方式,推送给正确的人”,大大提高了信息检索的智能化程度。  相似文献   

15.
针对跨模态信息检索的策略和核心问题,从提升检索性能的角度,分析了多视角对称非负矩阵分解方法用于跨模态检索的优势,提出了一种新的基于对称非负矩阵分解的跨模态检索框架。首先在Wikipedia、Pascal公开数据集上习得一致的子空间表示;然后基于该子空间,设计了一种实时样本在子空间中的投影方法。与典型相关分析、语义匹配和偏最小二乘回归相比,在MAP和PR曲线这2个指标上,本文所提出的方法具有最优的性能表现,表明了该方法应用于跨模态信息检索任务中的潜力。  相似文献   

16.
可扩展的分布式信息检索的设计与实现   总被引:2,自引:0,他引:2  
为了弥补集中式信息检索系统在覆盖率、更新率、访问权限控制、专业性及网络负载等方面存在的缺陷,设计并实现了一个可扩展性强的分布式信息检索系统,采用统计信息及查询日志描述各节点的信息资源,提出基于日志的CORI算法进行资源选择.实验结果显示,维护该系统所需的存储空间、更新时间及网络传输量等仅为集中式信息检索系统的1%左右,系统的可扩展性较强.提出的基于日志的CORI算法较传统CORI算法在查全率-查准率指标上提高了9.8%,在Kendall'S τ距离指标上提高了8.1%,是一种有效的资源选择算法,提高了分布式信息检索系统的检索性能.  相似文献   

17.
针对如何根据用户的检索状况来提高信息检索的反应速度及查询的准确性的问题,利用向量空间模型信息检索与路径相似度蚁群算法中利用同一方式——相似度来决定下一步方向的共同特点,提出将一种基于路径相似度的蚁群算法应用于信息检索的方法。采用这种算法在性能和收敛性速度上优于常规算法。  相似文献   

18.
遵循标准化的数据格式及系统接口,采取了多项提高系统性能的措施,整合了新华社内部分散的数据资源,并形成了一个高效的信息检索及服务平台.  相似文献   

19.
基于语义Web的旅游信息系统设计   总被引:1,自引:0,他引:1  
设计了一个旅游信息系统,并在系统中成功运用了语义Web技术.使用UML建立了旅游领域的Ontology,并以几个旅游门户网站为信息源建立了旅游领域的语义Web数据库.提出了语义Web技术和传统搜索引擎相结合的信息检索方法,设计了检索语义信息的算法.实现了描述逻辑知识库问题解答的优化,设计了用户和知识库交互的方式.本系统是一个语义Web技术的商业应用原型.  相似文献   

20.
基于Agent的Web网页自适应检索模型   总被引:10,自引:1,他引:9       下载免费PDF全文
分析了Agent和一般信息检索模型的特征 ,根据Web网页信息检索的特点 ,综合布尔逻辑模型和向量空间模型的优点 ,提出了一种基于Agent的智能、主动、自适应超文本网页信息检索模型 .  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号