首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 421 毫秒
1.
有效处理冲突证据的融合方法   总被引:7,自引:0,他引:7  
为解决Dempster-Shafer证据理论在对高度冲突的证据进行融合时可能导致与直观结果相悖的问题,该文提出了一种有效处理冲突证据的融合方法。该方法综合了Dempster-Shafer证据理论所具有的收敛性好及加性融合方法所具有的可靠性高的优点,首先通过对证据进行冲突检验,然后对冲突证据进行加性合成,消除证据之间的冲突。仿真试验结果表明该算法能更好地排除干扰,得出符合实际的组合结果,与典型算法相比,该方法在收敛性和可靠性方面体现了优越性。  相似文献   

2.
为解决Dempster-Shafer证据理论在对高度冲突的证据进行融合时可能导致与直观相悖的结果的问题,该文提出了一种有效处理冲突证据的融合方法。该方法综合了Dempster-Shafer证据理论所具有的收敛性好及加性融合方法所具有的可靠性高的优点,首先通过对证据进行冲突检验,然后对冲突证据进行加性合成,消除证据之间的冲突。仿真试验结果表明该算法能更好地排除干扰,得出符合实际的组合结果,与典型算法相比,该方法在收敛性和可靠性方面体现了优越性。  相似文献   

3.
在Dempster-Shafer(D-S)证据理论中,传统D-S组合规则在证据高度冲突时存在失效问题,会产生与常理相悖的结论.为此,文中提出了一种改进的处理冲突证据的融合方法,即通过计算各证据到命题平均支持度的偏差,来检测和消除冲突证据,并对最后结果进行修正,以合成来自不同识别框架的证据.计算实验结果表明,该方法能有效处理冲突,得到符合实际的组合结果,相对于其他典型算法,该方法在收敛性和可靠性上有明显改进.  相似文献   

4.
针对基于关键词匹配的搜索引擎存在的问题,提出一种基于语义词典的局部查询扩展方法,首先利用共现分析法和语义相似度选取扩展词,再对原始查询词和扩展词加权,最后计算文档相似度从而获得排序后的扩展查询结果.该方法克服了其它局部扩展方法将大量无关词加入查询的问题.实验表明,该方法有效地提高了查询结果的查准率.  相似文献   

5.
传统的查询扩展技术大都依据单个查询词的相关性来扩展查询词,忽略了查询词之间的相关性以及查询扩展词的不同重要程度,使得扩展效果不佳。针对此问题,提出了一种基于PageRank算法的查询扩展模型,该模型在Markov网络检索模型的基础上,从查询本身出发,将所有与查询相关的词组成Markov查询关联子网,在此子网上应用PageRank算法来计算候选扩展词的权重,由权重序来确定扩展词的选取,排名前列的扩展词进入检索阶段,消除噪音,提高检索效率。在标准数据集上的实验结果表明,本文提出的模型能有效地改善检索效果。  相似文献   

6.
当搜索日志存在查询词稀疏性和时效性问题时,基于搜索日志的查询扩展方法无法保证查询扩展的质量,无法满足具有时效性查询请求的需求.提出了基于搜索日志与局部上下文的查询扩展方法,通过发掘搜索日志中用户查询词和相关文档的关联关系,抽取查询扩展词,并用局部上下文从相关文档集中提取出频率较大,同时具有时效性的查询扩展词.通过对查询扩展词的查询性能和时效性的计算,该方法为原始查询补充更高质量的查询扩展词.实验结果表明,该方法能够有效地提升准确率和召回率,使原始查询获得更好的查询性能.  相似文献   

7.
基于D-S证据理论的纹理图像分类方法   总被引:2,自引:0,他引:2  
在阐述Dempster-Shafer证据理论的基础上,给出了基于Dempster-Shafer证据理论的多源信息融合的方法,并将Dempster-Shafer证据理论的信息融合技术应用于遥感图像纹理的分类.图像灰度均值特征和图像灰度共生矩阵的熵特征作为纹理图像的不同特征被提取,并构成该理论中的证据,利用一定的决策规则,选择融合证据作用下最大的假设.实验结果表明,基于Dempster-Shafer证据理论的多特征融合分类识别图像纹理的新方法是切实有效的和可行的,分类结果要优于仅仅利用单个特征进行分类的结果,能极大地提高图像纹理的识别分类能力.  相似文献   

8.
为能在搜索引擎返回的结果集上构建贴近用户意图的主题层,并在文档词与主题间建立映射,将社会化标注引入经典的LDA模型,构建一种基于主题-标签-文档词之间关系的三层主题模型,并将其用于伪相关反馈查询扩展词的选取.实验结果表明,该模型提取的查询扩展词能描述标签的语义,模型用于伪相关反馈后,提取的扩展词能覆盖查询条件,在多数情况下结果列表的NDCG值高于基本伪相关反馈和结果集聚类方法.  相似文献   

9.
一种基于相关证据的数据融合算法   总被引:1,自引:0,他引:1  
根据Dempster-Shafer证据理论和相关证据合成方法,将证据合成算法应用于神经网络分类器中,以提高分类器的分类精度。在UCI数据库的分类中的应用结果,证明了该方法的有效性。  相似文献   

10.
利用局部分析法,提出一种基于词语之间同义关系的查询扩展方法.该方法利用原始查询术语实现初次查询,然后利用局部分析法得到查询术语在初次查询结果集中的同义词,并实现查询扩展.实验结果表明,该方法能有效提高检索性能.  相似文献   

11.
针对伪相关反馈模型反馈文档信息质量差和扩展词选择不适产生的漂移现象等问题,提出了一种基于约束的半监督聚类查询扩展方法。该方法对初检结果的前k个文档进行人工标注,分成相关文档与不相关文档两类;并利用一种半监督聚类算法对初检结果的前”个文档进行分析,提取出与查询相关的文档作为反馈文档。该方法通过对少量标注文档与查询相关性的学习,能够较准确地估计出大量未知文档与查询的相关性,提高反馈文档的质量,从而有效提高检索的查全率和查准率。实验结果表明,该方法比传统的伪相关反馈和基于无监督聚类的伪相关反馈有更优的检索性能。  相似文献   

12.
针对现有专利检索中的用户意图理解及查询扩展不足问题,提出了一种基于自动查询扩展的专利文档检索方法。首先结合专利文档特点,采用基于改进TF-IDF公式的专利领域词表提取方法,构建专利领域词表。在检索阶段,对查询输入串进行分析得到查询关键词汇,同领域词表相结合,确定查询所在领域及查询扩展难度。利用基于伪相关反馈的自动查询扩展技术,根据伪相关文档的术语分布差异分析,生成查询扩展项并排序,最后将扩展项与原始查询条件相结合,重新组成查询条件,完成专利查询。实验结果表明,该方法具有较高的召回率和平均准确率。  相似文献   

13.
文本观点检索旨在检索出与查询主题相关并且表达用户对主题观点的文档。由于用户查询时输入通常很短,难以准确表示查询的信息需求。知识图谱是结构化的语义知识库,通过知识图谱中的知识有助于理解用户的信息需求。因此,提出了一种基于知识图谱的文本观点检索方法。首先由知识图谱获取候选查询扩展词,并计算每个候选词扩展词分布、共现频率、邻近关系、文档集频率,然后利用4类特征通过SVM分类得到扩展词,最后利用扩展词对产生式观点检索模型进行扩展,实现对查询的观点检索。实验表明,在微博和推特两个数据集上,与基准工作对比,所提出的方法在MAP、NDCG等评价指标上均有显著的提升。  相似文献   

14.
逆向Skyline查询能够应用到诸如决策支持、用户偏好支持以及市场行为分析等方面。由于参考对象q的存在,在执行逆向Skyline查询的过程中数据空间被划分成许多分区。然而,存在的算法都没有考虑这个问题的影响,直接使用原始数据集建立索引结构。本文提出了一种新的逆向Skyline查询方法CRSQ,它考虑了这个问题。CRSQ首先根据查询对象q对数据进行聚类,然后建立R-tree索引,最后利用高效修剪策略修剪索引搜索空间。实验结果表明CRSQ算法是有效的,它相对于没有聚类技术的算法获得了50%以上的性能提高。  相似文献   

15.
0 IntroductionSearchingthe webis not always sosuccessful as users expect .Most of the retrieved sets of documents in a web searchmeet the search criteria but do not satisfy the user’s needs. Onecrucial reasonis that users generallylack of specificityin the for-mulation of the queries.Some causes of this are that most of theti mes ,the user does not knowthe vocabulary of thetopic,or que-ryterms do not come to user’s mind at the query moment .One possible solutiontothis problemis the process …  相似文献   

16.
One of important reasons caused low precision was presented, which was due to inaccurate express of the query. So a new method of automatic query expansion based on tolerance rough was put forward. In the algorithm, the uncertain connection between query terms and retrial documents was described as term tolerance class. The upper approximation set of query sentence was considered as query expansion. The new additional terms were also given weight numbers. The results of experiment on collection of Google 5 000 Web pages showed that the approach was effective on query expansion and high search precision was gained.  相似文献   

17.
The existing query expansion(QE) methods cannot find the most users-requested source code version at times due to the over-expansion resulting from noises. To solve this problem, we propose a QE method based on evolving contexts(EC) that are added/deleted terms and their dependent terms during code evolution. On expanding a query, we appended the added terms as relevant terms, and excluded the deleted terms as noisy terms. We also developed a QE-integrating framework based on the Support Vector Machine(SVM) Ranking, called QESR, to simultaneously integrate multiple QE methods. Our experiment shows that QESR outperforms the state-of-the-art QE methods CodeHow and Query Expansion based on Crowd Knowledge(QECK) by 13%-16% in terms of precision when the first query result is inspected.  相似文献   

18.
To eliminate the mismatch between words of relevant documents and user's query and more serious negative effects it has on the performance of information retrieval,a method of query expansion on the basis of new terms co-occurrence representation was put forward by analyzing the process of producing query. The expansion terms were selected according to their correlation to the whole query. At the same time, the position information between terms were considered. The experimental result on test retrieval conference (TREC) data collection shows that the method proposed in the paper has made an improvement of 5%~19% all the time than the language modeling method without expansion. Compared to the popular approach of query expansion, pseudo feedback, the precision of the proposed method is competitive.  相似文献   

19.
伪相关反馈(pseudo-relevance feedback)是一种可有效提升查询性能的查询扩展技术。对这项技术而言,如何选取参数来平衡原始查询和扩展词的比重以达到最优的查询效果是一个非常重要的问题。在以往的反馈模型中,该平衡参数在所有数据集上需要设置成固定的经验值。但是,由于数据集之间的差异性,该平衡参数应该随着数据集的变化而改变。通过分析数据集的统计特征来发掘其与最优平衡参数之间的关系,进而指导最优参数的选择,主要分析了文档长度离散度、低频词项在数据集和查询扩展词中的比重等特征。通过分析在6个标准TREC数据集上的实验结果得出结论:特殊词项的比例越高,文档长度离散度越大,越需要给原始查询更大的比重。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号