首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 156 毫秒
1.
基于Markov网络的信息检索扩展模型   总被引:6,自引:0,他引:6  
为了解决信息检索性能较差的问题,查询扩展将索引项之间的关系以及文档之间的相似度引入到检索中,这个过程可以通过构造知识网络来进行.Markov网络是一种有效的知识关联图形表示方法,可以从实例数据训练获得.本研究提出并实现了基于Markov网络的信息检索扩展模型,通过对文档集的学习,构造了关于索引项和文档的Markov网络,将有利于检索的信息加入到检索中.实验表明,基于Markov网络的信息检索扩展模型优于BM25模型.  相似文献   

2.
基于Markov网络的检索模型   总被引:2,自引:0,他引:2  
基于Markov网络的信息检索模型提出一种贝叶斯网络推广的检索模型,该模型利用词项在文档集中的共现信息来构造Markov网络,通过该索引项子Markov网络来加载附加查询证据源,计算文档与查询之间的相关性概率,由此概率进行文档排序. 实验结果表明,本文提出的Markov网络模型比其他传统的检索方法具有更优的检索性能.  相似文献   

3.
传统的查询扩展技术大都依据单个查询词的相关性来扩展查询词,忽略了查询词之间的相关性以及查询扩展词的不同重要程度,使得扩展效果不佳。针对此问题,提出了一种基于PageRank算法的查询扩展模型,该模型在Markov网络检索模型的基础上,从查询本身出发,将所有与查询相关的词组成Markov查询关联子网,在此子网上应用PageRank算法来计算候选扩展词的权重,由权重序来确定扩展词的选取,排名前列的扩展词进入检索阶段,消除噪音,提高检索效率。在标准数据集上的实验结果表明,本文提出的模型能有效地改善检索效果。  相似文献   

4.
针对传统基于关键字的信息检索系统查全率和查准率都不高的缺点,提出了一种基于语义Web的智能信息检索模型,此模型在语义Web的环境下,利用本体技术,将最初的检索词通过查询扩展模块得到更完善的检索词集,然后利用扩展的检索词集进行检索。将基于关键字匹配的信息检索系统提升为基于本体知识库扩展查询的智能检索系统,从而提高了查全率与查准率,满足了人们对信息检索系统的要求。最后给出了模型的一种实施方案。  相似文献   

5.
在汉语问答系统中,当用自然语言问句进行文档检索时,由于问句比查询词包含更多的语义信息,因此必须进行查询词扩展以提高信息检索的性能.通过分析已有的查询扩展方法,提出了基于集合论的查询扩展新方法.它结合了3种传统的查询扩展方法:语义词典法、自动相关反馈法和问题类型词.实验结果表明该方法在Web检索方面是有效并且优于传统的方法.  相似文献   

6.
用户查询与文档之间语义匹配但词法不匹配现象是影响信息检索效果的重要原因之一。鉴于语义检索受限于本体自身的质量,为了降低其对检索效果的影响,通过分析目前语义查询扩展的研究现状,在已有概念相似度计算算法研究基础上进行改进和融合,提出了一种基于本体的信息检索查询扩展方法,并主要对基于本体技术的概念相似度计算算法进行修正,得到了组合向量空间模型QCR(Q,Ci)=∑k=1,…,Kwk-Sim_Rel(qK,Ci),作为引入查询扩展后的查询结果相关度评价方法。这种方法中,通过建立本体模型并计算本体中概念间的语义相似度来确定扩展查询词,它可以根据用户输入的名称,检索出相关文档并由用户自由设置相似度阈值,并将普通主题检索与语义检索合并,在本体乏力时返回普通检索结果,这在一定程度上弥补了垂直检索系统发展的不足。
  相似文献   

7.
文本观点检索旨在检索出与查询主题相关并且表达用户对主题观点的文档。由于用户查询时输入通常很短,难以准确表示查询的信息需求。知识图谱是结构化的语义知识库,通过知识图谱中的知识有助于理解用户的信息需求。因此,提出了一种基于知识图谱的文本观点检索方法。首先由知识图谱获取候选查询扩展词,并计算每个候选词扩展词分布、共现频率、邻近关系、文档集频率,然后利用4类特征通过SVM分类得到扩展词,最后利用扩展词对产生式观点检索模型进行扩展,实现对查询的观点检索。实验表明,在微博和推特两个数据集上,与基准工作对比,所提出的方法在MAP、NDCG等评价指标上均有显著的提升。  相似文献   

8.
用户查询与文档之间语义匹配但词法不匹配现象是影响信息检索效果的重要原因之一。鉴于语义检索受限于本体自身的质量,为了降低其对检索效果的影响,通过分析目前语义查询扩展的研究现状,在已有概念相似度计算算法研究基础上进行改进和融合,提出了一种基于本体的信息检索查询扩展方法,并主要对基于本体技术的概念相似度计算算法进行修正,得到了组合向量空间模型QCR(Q,Ci)=∑k=1,…,Kwk*Sim_Rel(qK,Ci),作为引入查询扩展后的查询结果相关度评价方法。这种方法中,通过建立本体模型并计算本体中概念间的语义相似度来确定扩展查询词,它可以根据用户输入的名称,检索出相关文档并由用户自由设置相似度阈值,并将普通主题检索与语义检索合并,在本体乏力时返回普通检索结果,这在一定程度上弥补了垂直检索系统发展的不足。  相似文献   

9.
用户查询与文档之间语义匹配但词法不匹配现象是影响信息检索效果的重要原因之一.鉴于语义检索受限于本体自身的质量,为了降低其对检索效果的影响,通过分析目前语义查询扩展的研究现状,在已有概念相似度计算算法研究基础上进行改进和融合,提出了一种基于本体的信息检索查询扩展方法,并主要对基于本体技术的概念相似度计算算法进行修正,得到了组合向量空间模型QCR(Q,Ci)=∑k=1.….K wk*Sim_Rel(qK,Ci),作为引入查询扩展后的查询结果相关度评价方法.这种方法中,通过建立本体模型并计算本体中概念间的语义相似度来确定扩展查询词,它可以根据用户输入的名称,检索出相关文档并由用户自由设置相似度阈值,并将普通主题检索与语义检索合并,在本体乏力时返回普通检索结果,这在一定程度上弥补了垂直检索系统发展的不足.  相似文献   

10.
针对信息检索模型检索性能的问题,将本体及本体语义相似度度量方法运用于基于贝叶斯网络的信息检索模型中,通过利用领域本体表达信息的规范性及本体语义推理的准确性对查询需求进行扩展,提高查询的性能。给出了信息检索模型和概念语义相似度计算及查询检索方法与过程,实验证明该方法在一定程度上能够提高检索系统的性能。  相似文献   

11.
当搜索日志存在查询词稀疏性和时效性问题时,基于搜索日志的查询扩展方法无法保证查询扩展的质量,无法满足具有时效性查询请求的需求.提出了基于搜索日志与局部上下文的查询扩展方法,通过发掘搜索日志中用户查询词和相关文档的关联关系,抽取查询扩展词,并用局部上下文从相关文档集中提取出频率较大,同时具有时效性的查询扩展词.通过对查询扩展词的查询性能和时效性的计算,该方法为原始查询补充更高质量的查询扩展词.实验结果表明,该方法能够有效地提升准确率和召回率,使原始查询获得更好的查询性能.  相似文献   

12.
针对现有专利检索中的用户意图理解及查询扩展不足问题,提出了一种基于自动查询扩展的专利文档检索方法。首先结合专利文档特点,采用基于改进TF-IDF公式的专利领域词表提取方法,构建专利领域词表。在检索阶段,对查询输入串进行分析得到查询关键词汇,同领域词表相结合,确定查询所在领域及查询扩展难度。利用基于伪相关反馈的自动查询扩展技术,根据伪相关文档的术语分布差异分析,生成查询扩展项并排序,最后将扩展项与原始查询条件相结合,重新组成查询条件,完成专利查询。实验结果表明,该方法具有较高的召回率和平均准确率。  相似文献   

13.
0 IntroductionSearchingthe webis not always sosuccessful as users expect .Most of the retrieved sets of documents in a web searchmeet the search criteria but do not satisfy the user’s needs. Onecrucial reasonis that users generallylack of specificityin the for-mulation of the queries.Some causes of this are that most of theti mes ,the user does not knowthe vocabulary of thetopic,or que-ryterms do not come to user’s mind at the query moment .One possible solutiontothis problemis the process …  相似文献   

14.
One of important reasons caused low precision was presented, which was due to inaccurate express of the query. So a new method of automatic query expansion based on tolerance rough was put forward. In the algorithm, the uncertain connection between query terms and retrial documents was described as term tolerance class. The upper approximation set of query sentence was considered as query expansion. The new additional terms were also given weight numbers. The results of experiment on collection of Google 5 000 Web pages showed that the approach was effective on query expansion and high search precision was gained.  相似文献   

15.
In Chinese question answering system, because there is more semantic relation in questions than that in query words, the precision can be improved by expanding query while using natural language questions to retrieve documents. This paper proposes a new approach to query expansion based on semantics and statistics Firstly automatic relevance feedback method is used to generate a candidate expansion word set. Then the expanded query words are selected from the set based on the semantic similarity and seman- tic relevancy between the candidate words and the original words. Experiments show the new approach is effective for Web retrieval and out-performs the conventional expansion approaches.  相似文献   

16.
基于Dempster-Shafer理论的查询扩展模型   总被引:3,自引:0,他引:3  
查询扩展是提高信息检索召回率的有效方法,已有许多研究者提出了诸多扩展方法,但大多数方法均是简单地把扩展的词添加到查询中.这样如若不加区分原查询词和扩充词,则扩展后的查询就可能偏离原查询的语义.该文基于Dempster-Shafer证据理论,提出了一个查询扩展的计算模型,该模型把原始查询项看作主证据,扩展项为原始查询项的辅助证据,为了能组合这两类证据,该文给出了两个带权重的Dempster-Shafer组合规则,实验表明该方法能有效地提高检索效率.  相似文献   

17.
To eliminate the mismatch between words of relevant documents and user's query and more serious negative effects it has on the performance of information retrieval,a method of query expansion on the basis of new terms co-occurrence representation was put forward by analyzing the process of producing query. The expansion terms were selected according to their correlation to the whole query. At the same time, the position information between terms were considered. The experimental result on test retrieval conference (TREC) data collection shows that the method proposed in the paper has made an improvement of 5%~19% all the time than the language modeling method without expansion. Compared to the popular approach of query expansion, pseudo feedback, the precision of the proposed method is competitive.  相似文献   

18.
针对伪相关反馈模型反馈文档信息质量差和扩展词选择不适产生的漂移现象等问题,提出了一种基于约束的半监督聚类查询扩展方法。该方法对初检结果的前k个文档进行人工标注,分成相关文档与不相关文档两类;并利用一种半监督聚类算法对初检结果的前”个文档进行分析,提取出与查询相关的文档作为反馈文档。该方法通过对少量标注文档与查询相关性的学习,能够较准确地估计出大量未知文档与查询的相关性,提高反馈文档的质量,从而有效提高检索的查全率和查准率。实验结果表明,该方法比传统的伪相关反馈和基于无监督聚类的伪相关反馈有更优的检索性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号