共查询到20条相似文献,搜索用时 0 毫秒
1.
一种基于同义词词典的模糊查询扩展方法 总被引:2,自引:0,他引:2
在信息检索系统中,查询扩展是一种非常有效的改进检索性能的方法. 为此,提出一种基于同义词词典的模糊查询扩展方法. 该方法中的同义词词典是基于著名的语义词典WordNet中的同义词集合建立的,同义词之间的贴近度[0, 1]使用Tanimoto系数获得. 利用该词典,能够进行较好的查询扩展. 将该方法与向量空间模型结合应用于文本信息检索系统中,所构造的检索模型相当于一种简单的语义模型,并且可以根据阈值来控制查询扩展的程度. 所得试验结果表明,使用该查询扩展方法的信息检索系统较常规信息检索系统的检索性能有一定改善. 相似文献
2.
针对现有专利检索中的用户意图理解及查询扩展不足问题,提出了一种基于自动查询扩展的专利文档检索方法。首先结合专利文档特点,采用基于改进TF-IDF公式的专利领域词表提取方法,构建专利领域词表。在检索阶段,对查询输入串进行分析得到查询关键词汇,同领域词表相结合,确定查询所在领域及查询扩展难度。利用基于伪相关反馈的自动查询扩展技术,根据伪相关文档的术语分布差异分析,生成查询扩展项并排序,最后将扩展项与原始查询条件相结合,重新组成查询条件,完成专利查询。实验结果表明,该方法具有较高的召回率和平均准确率。 相似文献
3.
何靖 《山东大学学报(理学版)》2006,41(3):13-17
提出了一种基于简单语法分析的问答系统查询生成方法,利用对问题的词性标注,形成初始化布尔查询,根据查询结果文档集对查询迭代调整,最终产生合理的布尔查询. 通过TREC2004和TREC2005的QA TRACK数据集上的实验,表明该方法在没有增加很大复杂度(平均迭代2.5次)的情况下大大提高了平均查准率,覆盖率和重复率. 相似文献
4.
针对伪相关反馈模型反馈文档信息质量差和扩展词选择不适产生的漂移现象等问题,提出了一种基于约束的半监督聚类查询扩展方法。该方法对初检结果的前k个文档进行人工标注,分成相关文档与不相关文档两类;并利用一种半监督聚类算法对初检结果的前”个文档进行分析,提取出与查询相关的文档作为反馈文档。该方法通过对少量标注文档与查询相关性的学习,能够较准确地估计出大量未知文档与查询的相关性,提高反馈文档的质量,从而有效提高检索的查全率和查准率。实验结果表明,该方法比传统的伪相关反馈和基于无监督聚类的伪相关反馈有更优的检索性能。 相似文献
5.
一种基于内容的视频信息检索技术的研究 总被引:3,自引:0,他引:3
在多媒体技术迅速发展的今天,作为多媒体信息中最复杂的视频信息,用传统的文件检索方法已无法满足用户的查询要求,而新的基于内容的检索技术将更好地满足视频信息的查询和检索.文章从基于内容的检索中用户的查询要求出发,将视频流划分成多个视频段,用对象和事件来表达每个视频段的视频内容,并在考虑时态特性的基础上,提出新的索引结构和查询算法,以有效地支持基于内容的检索和查询。 相似文献
6.
区别于传统的信息检索,地理信息检索通过一个查询范围词来限制用户的兴趣区域.目前的技术一般是把该查询范围词作为一个过滤器,将在该范围之外的文档排除在查询结果外.但是,词在地理空间的频率分布并不是均匀的,因此词在排序结果中的重要性应该随着查询范围的变化而有所改变.为此,提出了一种新的基于语言模型的地理信息查询模型,把查询范围引入到传统的语言模型中.在该模型中,引入了一个local model来描述查询词的地理分布特性.实验结果表明,新的检索模型优于TF-IDF与传统的语言模型. 相似文献
7.
基于本体的服装领域语义web检索方法 总被引:1,自引:0,他引:1
针对服装电子商务领域用户的语义查询需求,依据国内外相关标准,建立了服装分类本体模型.在此基础上给出了语义web检索系统框架,设计并实现了查询信息的语义检索,包括同义词检索、实例查询、细化查询、联想查询、智能推理等功能.实验表明,基于本体的语义检索系统具有较好的查全率和查准率,实现智能查询. 相似文献
8.
描述了一种基于本体的信息检索模型,通过构造领域本体来有效提高系统对自然语言文本的理解能力,具体介绍了查询模型中三个抽象层的设计及使用,最后利用聚合函数对查询结果进行合并与评价,使用户最终得到与检索要求内容匹配度较高的文档。 相似文献
9.
Internet的普及和发展 ,使互联网中的信息量与日俱增 ,人们普遍采用搜索引擎进行各种信息检索 ,但效率及精确度偏低 .从用户的角度及检索机制上 ,比较客观地分析了目前造成这种现象的原因 ,并从多方面给出了提高信息检索精度的几种策略 .实验结果表明 ,检索效果有一定的提高 相似文献
10.
文本观点检索旨在检索出与查询主题相关并且表达用户对主题观点的文档。由于用户查询时输入通常很短,难以准确表示查询的信息需求。知识图谱是结构化的语义知识库,通过知识图谱中的知识有助于理解用户的信息需求。因此,提出了一种基于知识图谱的文本观点检索方法。首先由知识图谱获取候选查询扩展词,并计算每个候选词扩展词分布、共现频率、邻近关系、文档集频率,然后利用4类特征通过SVM分类得到扩展词,最后利用扩展词对产生式观点检索模型进行扩展,实现对查询的观点检索。实验表明,在微博和推特两个数据集上,与基准工作对比,所提出的方法在MAP、NDCG等评价指标上均有显著的提升。 相似文献
11.
基于Markov网络的检索模型 总被引:2,自引:0,他引:2
基于Markov网络的信息检索模型提出一种贝叶斯网络推广的检索模型,该模型利用词项在文档集中的共现信息来构造Markov网络,通过该索引项子Markov网络来加载附加查询证据源,计算文档与查询之间的相关性概率,由此概率进行文档排序. 实验结果表明,本文提出的Markov网络模型比其他传统的检索方法具有更优的检索性能. 相似文献
12.
Recently,attention has been focused on spatial query language which is used to query spatial databases. A design of spatial query language has been presented in this paper by extending the standard relational database query language SQL. It recognizes the significantly different requirements of spatial data handling and overcomes the inherent problems of the application of conventional database query languages. This design is based on an extended spatial data model,including the spatial data types and the spatial operators on them. The processing and optimization of spatial queries have also been discussed in this design. In the end,an implementation of this design is given in a spatial query subsystem. 相似文献
13.
YUANJie XIEKun-qing MAXiu-jun ZHANGMin SUNLe-bin 《重庆邮电学院学报(自然科学版)》2004,16(5):165-172
Recently, attention has been focused on spatial query language which is used to query spatial databases. A design of spatial query language has been presented in this paper by extending the standard relational database query language SQL. It recognizes the significantly different requirements of spatial data handling and overcomes the inherent problems of the application of conventional database query languages. This design is based on an extended spatial data model, including the spatial data types and the spatial operators on them. The processing and optimization of spatial queries have also been discussed in this design. In the end, an implementation of this design is given in a spatial query subsystem. 相似文献
14.
一种新的高效大型音乐数据库查询算法 总被引:5,自引:0,他引:5
在基于哼唱的音乐信息检索领域中,查询处理算法一直是一个重要的研究课题。根据人对乐曲相似理解的实验结果,设计了新的基于单侧连续匹配的可容错的近似匹配的算法.此算法采用n—gram的顺序hash索引,加快了可容错的查询处理速度.还设计了一系列包括各种类型和各种数量错误的查询的实验,来比较该算法和其他两种常用算法的查询处理速度和容错能力.当测试数据集为78000首网上收集的MIDI乐曲段,包含各种错误的查询为1000个时,该算法取得79%的前3位命中率和87%的前10位命中率.这些结果表明,该方法的性能高于现有的算法.表2,参8。 相似文献
15.
SHIShu-dong LIZhi-tang 《武汉大学学报:自然科学英文版》2004,9(4):425-428
We cleveloped a high-speed information retrieval system. The system hased on the IXP 2800 is one of the dedicute device. The velocily of the information retrieval is 6.8 Gb/s. The protocol support Telnet, FTP, SMTP, POP3 etc. various networks protocols. The information retrieval supports the key word and the natural language process. This paper explains the hardware system, software system and the index of the performance. 相似文献
16.
分析了基于RDBMS开发的图书馆书目查询系统的不足及其原因,提出一种利用全文检索技术与代理技术来完善该书目查询系统检索功能不足的方法,并介绍了用该方法的详细设计与实现过程.同时对该方法的性能进行了对比与分析.该方法可用于解决图书馆书目模糊查询,以及旅游地址模糊查询、网上书城模糊检索等一类问题.图1,表2,参7. 相似文献
17.
为了解决传统检索技术无法为用户提供个性化服务和检索效率低的问题,提出了一种基于领域本体的个性化文本信息检索模型,阐述了该模型的结构和关键算法,并验证了算法的可行性。实验结果表明:基于领域本体的个性化文本信息检索能有效提高信息检索的准确率和效率。 相似文献
18.
随着Internet的普及,Web信息量爆炸性的增长,数以亿计的Web页面形成了内容丰富而庞杂的WWW资源,如何从海量的数据中高效、高质量地检索到用户所感兴趣的信息资源是当前我国Internet资源挖掘的热点问题之一. 将基于模糊逻辑的聚类算法FK prototype引入到Web信息搜索中,改良了传统方法一刀切的
分类处理方式,从而有效地提高了Web文档的检索质量. 相似文献
19.
基于DICOM标准的PACS系统是世界医学信息技术发展的潮流.文章具体分析元数据检索、文本检索和基于内容的图像检索的优缺点,认为有必要在牙科PACS中综合使用三种检索方式以提高信息检索效率和准确度.在基于内容的图像检索中,为了提高在庞大的特征库中进行相似性检索的效率,需要研究快速索引结构.文章通过分析R树、四叉树和聚类索引等几种快速索引结构,初步设计出适合牙科PACS系统的索引机制. 相似文献
20.
随着互联网的普及和Web资源的日益丰富,从网上获取基于药品本体的信息成为人们常用的方式,但用户在检索信息时经常会出现找不到或者查不准的情况。针对这样的问题,提出了一种基于本体的信息检索系统,并将相似度等算法融合其中,从而大大提高了查询的效果。 相似文献