首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
One of important reasons caused low precision was presented, which was due to inaccurate express of the query. So a new method of automatic query expansion based on tolerance rough was put forward. In the algorithm, the uncertain connection between query terms and retrial documents was described as term tolerance class. The upper approximation set of query sentence was considered as query expansion. The new additional terms were also given weight numbers. The results of experiment on collection of Google 5 000 Web pages showed that the approach was effective on query expansion and high search precision was gained.  相似文献   

2.
To eliminate the mismatch between words of relevant documents and user's query and more serious negative effects it has on the performance of information retrieval,a method of query expansion on the basis of new terms co-occurrence representation was put forward by analyzing the process of producing query. The expansion terms were selected according to their correlation to the whole query. At the same time, the position information between terms were considered. The experimental result on test retrieval conference (TREC) data collection shows that the method proposed in the paper has made an improvement of 5%~19% all the time than the language modeling method without expansion. Compared to the popular approach of query expansion, pseudo feedback, the precision of the proposed method is competitive.  相似文献   

3.
针对现有专利检索中的用户意图理解及查询扩展不足问题,提出了一种基于自动查询扩展的专利文档检索方法。首先结合专利文档特点,采用基于改进TF-IDF公式的专利领域词表提取方法,构建专利领域词表。在检索阶段,对查询输入串进行分析得到查询关键词汇,同领域词表相结合,确定查询所在领域及查询扩展难度。利用基于伪相关反馈的自动查询扩展技术,根据伪相关文档的术语分布差异分析,生成查询扩展项并排序,最后将扩展项与原始查询条件相结合,重新组成查询条件,完成专利查询。实验结果表明,该方法具有较高的召回率和平均准确率。  相似文献   

4.
基于Dempster-Shafer理论的查询扩展模型   总被引:3,自引:0,他引:3  
查询扩展是提高信息检索召回率的有效方法,已有许多研究者提出了诸多扩展方法,但大多数方法均是简单地把扩展的词添加到查询中.这样如若不加区分原查询词和扩充词,则扩展后的查询就可能偏离原查询的语义.该文基于Dempster-Shafer证据理论,提出了一个查询扩展的计算模型,该模型把原始查询项看作主证据,扩展项为原始查询项的辅助证据,为了能组合这两类证据,该文给出了两个带权重的Dempster-Shafer组合规则,实验表明该方法能有效地提高检索效率.  相似文献   

5.
在汉语问答系统中,当用自然语言问句进行文档检索时,由于问句比查询词包含更多的语义信息,因此必须进行查询词扩展以提高信息检索的性能.通过分析已有的查询扩展方法,提出了基于集合论的查询扩展新方法.它结合了3种传统的查询扩展方法:语义词典法、自动相关反馈法和问题类型词.实验结果表明该方法在Web检索方面是有效并且优于传统的方法.  相似文献   

6.
全局分析方法是一种常用而能有效改善信息检索效果的查询扩展方法。通过计算词间相似度构造M arkov网络模型;然后由此模型加强候选词集中的词相关性描述,并提取了在Markov网络中词间的团结构;通过在查询中加入查询词所在团中的其他候选词进行查询扩展。实验表明基于Markov网络团的信息检索模型的检索效果优于基于一般的相似性矩阵查询扩展的检索效果;基于团提取方法的查询扩展的检索效果优于普通的基于提取方法的查询扩展检索效果。  相似文献   

7.
目前困扰查询扩展的主要问题是主题漂移.为了降低主题漂移对查询扩展优化的影响,提出了一种基于任务上下文信息的查询扩展方法,旨在通过任务上下文中的信息来选择合适的查询扩展词添加到查询中,使得查询的结果更加精确.实验结果表明,该方法有效降低了主题漂移对查询扩展精度的影响.  相似文献   

8.
当搜索日志存在查询词稀疏性和时效性问题时,基于搜索日志的查询扩展方法无法保证查询扩展的质量,无法满足具有时效性查询请求的需求.提出了基于搜索日志与局部上下文的查询扩展方法,通过发掘搜索日志中用户查询词和相关文档的关联关系,抽取查询扩展词,并用局部上下文从相关文档集中提取出频率较大,同时具有时效性的查询扩展词.通过对查询扩展词的查询性能和时效性的计算,该方法为原始查询补充更高质量的查询扩展词.实验结果表明,该方法能够有效地提升准确率和召回率,使原始查询获得更好的查询性能.  相似文献   

9.
In Chinese question answering system, because there is more semantic relation in questions than that in query words, the precision can be improved by expanding query while using natural language questions to retrieve documents. This paper proposes a new approach to query expansion based on semantics and statistics Firstly automatic relevance feedback method is used to generate a candidate expansion word set. Then the expanded query words are selected from the set based on the semantic similarity and seman- tic relevancy between the candidate words and the original words. Experiments show the new approach is effective for Web retrieval and out-performs the conventional expansion approaches.  相似文献   

10.
利用局部分析法,提出一种基于词语之间同义关系的查询扩展方法.该方法利用原始查询术语实现初次查询,然后利用局部分析法得到查询术语在初次查询结果集中的同义词,并实现查询扩展.实验结果表明,该方法能有效提高检索性能.  相似文献   

11.
针对伪相关反馈模型反馈文档信息质量差和扩展词选择不适产生的漂移现象等问题,提出了一种基于约束的半监督聚类查询扩展方法。该方法对初检结果的前k个文档进行人工标注,分成相关文档与不相关文档两类;并利用一种半监督聚类算法对初检结果的前”个文档进行分析,提取出与查询相关的文档作为反馈文档。该方法通过对少量标注文档与查询相关性的学习,能够较准确地估计出大量未知文档与查询的相关性,提高反馈文档的质量,从而有效提高检索的查全率和查准率。实验结果表明,该方法比传统的伪相关反馈和基于无监督聚类的伪相关反馈有更优的检索性能。  相似文献   

12.
文本观点检索旨在检索出与查询主题相关并且表达用户对主题观点的文档。由于用户查询时输入通常很短,难以准确表示查询的信息需求。知识图谱是结构化的语义知识库,通过知识图谱中的知识有助于理解用户的信息需求。因此,提出了一种基于知识图谱的文本观点检索方法。首先由知识图谱获取候选查询扩展词,并计算每个候选词扩展词分布、共现频率、邻近关系、文档集频率,然后利用4类特征通过SVM分类得到扩展词,最后利用扩展词对产生式观点检索模型进行扩展,实现对查询的观点检索。实验表明,在微博和推特两个数据集上,与基准工作对比,所提出的方法在MAP、NDCG等评价指标上均有显著的提升。  相似文献   

13.
为提高信息检索的准确率和全面性, 在对语义检索技术和领域本体的构建进行充分研究的基础上, 在网络教育资源的检索工作中应用了本体语义的概念, 提出对用户输入的查询条件进行基于本体的查询扩展算法,设计实现了使用Lucene 对扩展后的查询条件进行检索的语义检索模型。实验结果表明, 该检索模型的综合查全率为81郾5%, 综合查准率为83郾1%, 这两项指标均优于传统的关键字检索方法。  相似文献   

14.
利用支持向量回归确定相关Web查询   总被引:1,自引:0,他引:1  
对用户输入的查询请求,如果搜索引擎系统能给出一个相关查询列表,将有助于用户进行查询修正,进而检索到用户所需要的信息.文中提出了一种利用支持向量回归确定相关Web查询的新方法.对一个给定的Web查询,首先从用户的使用记录中抽取候选查询的5个量化指标:被查询的次数、被查询的用户量、用户在反馈结果中的点击次数、与给定查询间的共有词项个数和点击相同网址(URL)的个数;然后用手工标记部分训练数据,进而建立支持向量回归模型,根据相关度的大小确定相关Web查询.实验结果表明该方法具有较高的准确度.  相似文献   

15.
一种新的高效大型音乐数据库查询算法   总被引:5,自引:0,他引:5  
在基于哼唱的音乐信息检索领域中,查询处理算法一直是一个重要的研究课题。根据人对乐曲相似理解的实验结果,设计了新的基于单侧连续匹配的可容错的近似匹配的算法.此算法采用n—gram的顺序hash索引,加快了可容错的查询处理速度.还设计了一系列包括各种类型和各种数量错误的查询的实验,来比较该算法和其他两种常用算法的查询处理速度和容错能力.当测试数据集为78000首网上收集的MIDI乐曲段,包含各种错误的查询为1000个时,该算法取得79%的前3位命中率和87%的前10位命中率.这些结果表明,该方法的性能高于现有的算法.表2,参8。  相似文献   

16.
基于动态知识库搜索引擎的技术   总被引:2,自引:0,他引:2  
“词的不匹配”是全文信息检索中存在的一个基本问题.为解决此问题,已提出过一些查询扩展方法.现提出一种新的基于动态知识库的搜索引擎原型——DKIRS检索系统.它利用用户检索的结果及用户的反馈信息动态地构造知识库,然后基于知识库对初始查询进行扩展,再利用扩展后的查询进行信息检索。  相似文献   

17.
提出了一种面向异质可扩展标记语言(XML)文档的近似查询算法(TPQR).利用模式重写策略,通过对XML模式之间语义相似度及节点映射关系的求解,将原始查询树改写为多种XML模式下的重写查询树,从而解决了XML数据的多样性带来的查询语义缺失问题.将经变异操作序列得到的变异查询树精确地嵌入在XML数据树之中,即可将XML近似查询问题转变为多棵变异查询树的精确查询问题.在汽车外形智能化设计的实验中比较了TPQR算法和静态有序选择算法,结果表明,在查准率、查全率上,前者比后者分别提高了5%~10%和10%~30%.  相似文献   

18.
一种基于同义词词典的模糊查询扩展方法   总被引:2,自引:0,他引:2  
在信息检索系统中,查询扩展是一种非常有效的改进检索性能的方法. 为此,提出一种基于同义词词典的模糊查询扩展方法. 该方法中的同义词词典是基于著名的语义词典WordNet中的同义词集合建立的,同义词之间的贴近度[0, 1]使用Tanimoto系数获得. 利用该词典,能够进行较好的查询扩展. 将该方法与向量空间模型结合应用于文本信息检索系统中,所构造的检索模型相当于一种简单的语义模型,并且可以根据阈值来控制查询扩展的程度. 所得试验结果表明,使用该查询扩展方法的信息检索系统较常规信息检索系统的检索性能有一定改善.  相似文献   

19.
The existing query expansion(QE) methods cannot find the most users-requested source code version at times due to the over-expansion resulting from noises. To solve this problem, we propose a QE method based on evolving contexts(EC) that are added/deleted terms and their dependent terms during code evolution. On expanding a query, we appended the added terms as relevant terms, and excluded the deleted terms as noisy terms. We also developed a QE-integrating framework based on the Support Vector Machine(SVM) Ranking, called QESR, to simultaneously integrate multiple QE methods. Our experiment shows that QESR outperforms the state-of-the-art QE methods CodeHow and Query Expansion based on Crowd Knowledge(QECK) by 13%-16% in terms of precision when the first query result is inspected.  相似文献   

20.
提出了站点完整度概念,并实现了其在站点设计中的应用;设计了在广域网环境下的基于实现站点系统完整度的数据库查询模型,同时给出了在该模型下将模糊查询与超媒体检索相结合的实现方法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号