首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 593 毫秒
1.
一个基于同义词证据扩展的信念网络检索模型   总被引:1,自引:0,他引:1  
归并不同证据资源扩展用于信息检索的信念网络是当前一个重要的研究方向。以同义词为证据扩展基本信念网络模型,得到一个扩展的信念网络检索模型。实验证明,扩展模型的检索性能优于基本模型。  相似文献   

2.
文本聚类作为一种自动化程度较高的无监督机器学习方法,能够实现对文本信息的有效组织、摘要和导航,近年来已经广泛应用在信息检索领域。笔者针对使用向量空间模型进行聚类时对于同义词和多义词的处理存在的缺陷,提出了基于本体的文本聚类模型。首先使用WordNet词典对文档中的词进行语义标注,得到文档的概念集合;然后对每个文档的概念集合进行概念聚类,生成文档的概念主题;最后通过计算主题的相似度完成文本聚类。该模型减少了相似度计算量,改善了聚类结果和聚类性能。  相似文献   

3.
基于Markov网络的检索模型   总被引:2,自引:0,他引:2  
基于Markov网络的信息检索模型提出一种贝叶斯网络推广的检索模型,该模型利用词项在文档集中的共现信息来构造Markov网络,通过该索引项子Markov网络来加载附加查询证据源,计算文档与查询之间的相关性概率,由此概率进行文档排序. 实验结果表明,本文提出的Markov网络模型比其他传统的检索方法具有更优的检索性能.  相似文献   

4.
为了提高信息检索系统检索性能,针对信息检索系统中普遍使用的向量空间模型(VSM)所固有的缺陷,提出一种新的基于分类和扩展向量空间模型CE-BVSM(Classifier and Expand-Based Vector Space Model)。该模型对传统的空间向量法进行了改进,引入分词技术、朴素贝叶斯分类器和专业词库,重新定义了资源特征向量和查询索引项的内容,参考关键词出现的频率及其在所描述的资源中所起的作用等因素来计算特征索引项和资源向量的权重值。在此基础上,又对查询索引项使用了基于专业词库的扩展策略。实验证明该模型使检索能够在相对精确的范围内进行,提高检索查准率和查全率,改善了信息检索系统的性能。  相似文献   

5.
信念网络信息检索模型提供了一个可以组合不同证据的基本框架,通过组合证据可有效提高检索效果.科技文献之间的引用关系是一种有价值的信息.本文把这种引用关系量化为文献关注度和文献价值度,并将其作为证据扩展基本信念网络模型.考虑到文档内容证据、关注度和价值度对查询结果排序的影响不同,引入了2个系数α和β来调整3种证据在排序中的作用大小.实验通过样本训练确定了α和β的最优值,验证了扩展模型的有效性,并分析了扩展模型用and和or方式组合证据的优劣.  相似文献   

6.
一种基于同义词词典的模糊查询扩展方法   总被引:2,自引:0,他引:2  
在信息检索系统中,查询扩展是一种非常有效的改进检索性能的方法. 为此,提出一种基于同义词词典的模糊查询扩展方法. 该方法中的同义词词典是基于著名的语义词典WordNet中的同义词集合建立的,同义词之间的贴近度[0, 1]使用Tanimoto系数获得. 利用该词典,能够进行较好的查询扩展. 将该方法与向量空间模型结合应用于文本信息检索系统中,所构造的检索模型相当于一种简单的语义模型,并且可以根据阈值来控制查询扩展的程度. 所得试验结果表明,使用该查询扩展方法的信息检索系统较常规信息检索系统的检索性能有一定改善.  相似文献   

7.
通过分析新闻图像检索的应用特点,提出了一种多反馈、累积的图像检索方法.在贝叶斯分类模型的基础上,构造图像特征的分类方法,进一步得到图像的分类概率;设计多个反馈指标上的概率综合公式及先验概率的累积修正方法.实验结果表明,所提出的算法是有效的,并具有较好的性能.  相似文献   

8.
针对当前方法设计的图书馆文献信息资源推荐检索平台存在的检索效率低和召回率低的问题,提出图书馆文献信息资源智能推荐检索平台设计方法。通过平台架构、检索接口、平台功能设计构成图书馆文献信息资源智能推荐检索平台的框架,其中平台架构设计包括信息库连接和可视化信息,根据数学工具和语言完成图书馆文献信息资源智能推荐检索平台中检索接口设计,平台功能包括资源显示、资源检索、信息编辑和空间分析。将隐式方法与显示方法相结合构建用户兴趣模型,在用户兴趣模型的基础上通过冷启动阶段和推荐阶段完成图书馆文献信息资源的智能推荐和检索。实验结果表明,所提方法可在较短的时间内完成图书馆文献信息资源的推荐和检索,且检索得到的资源完整度较高,验证所提方法的检索效率高、召回率高。  相似文献   

9.
基于多查询数据融合和正相关反馈的检索算法   总被引:4,自引:0,他引:4  
为提高信息检索系统的性能,提出了一种多查询数据融合与正相关反馈相结合的检索算法.算法的核心思想是:利用基于向量表示的余弦相似度测度计算查询与文档之间的相似度,采用多查询数据融合技术将多个检索结果融合,以及从上一次检索结果中取出前M个相关文档和初始查询一起构成新的查询,将新查询提交给系统并继续下一次的检索,如此反复,直到获得满意的结果.实验结果表明,该算法相对于仅使用了多查询数据融合技术的算法和仅使用了正相关反馈技术的算法,其平均准确率分别提高42.6%和23.17%.  相似文献   

10.
提出一种新的基于WordNet和文本集语义参数IC的计算方法,通过综合考虑概念在WordNet中语义信息以及数据集中的概率信息,即概念的自信息,同时利用新的参数考虑概念对在WordNet中的共享信息,设计了一种通用的概念语义相似性计算方法,该方法简化了传统语义相似性算法,并解决了语义相似性计算领域的相关问题,可以应用在信息抽取、信息检索、文档分类及本体学习中.领域通用的数据集RB数据实验结果表明,该方法在计算语义相似度问题上有效。  相似文献   

11.
针对维吾尔语Web文档的有效检索问题,提出一种基于相关反馈和文档相似度的检索词加权方法.首先,对维吾尔语文档进行预处理,获得相应的词干集.然后,当用户输入多个检索词时,执行初始检索,并基于局部相关反馈思想提取出排名靠前的N个文档.接着,利用TF-IDF算法计算检索词与反馈文档之间的词频相似度,通过余弦距离计算文档之间的相似度,并以此对检索词进行两次加权.最后,根据加权后的检索词进行文档检索.实验结果表明:该方法能够准确地检索出用户所需的文档,并将其靠前排序.  相似文献   

12.
针对现有微博推荐方法或模型不便组合证据的不足,提出一种微博推荐新方法.将信念网络用于微博推荐,构建一个基本信念网络推荐模型,并在基本模型中融合用户交互微博证据,提出一个微博推荐扩展模型.模型中的节点表示微博、用户和兴趣特征词,有向弧表示节点之间的关系,通过计算用户与微博的覆盖程度来得到用户与待评估微博的相关度.在微博数据集上的实验结果表明:扩展模型较基本模型在F值上至少提高了约4.9%;与已有的推荐方法相比,新模型在组合证据提高推荐性能方面更有效.  相似文献   

13.
一种基于主题的文档检索模型   总被引:2,自引:1,他引:1  
现有信息检索模型难以从主题层次上准确判别文档相似性,为此,本文提出了一个基于主题的文档检索模型(TDRM).TDRM为所有文档建立公共主题空间,把每个文档表示为主题空间上的一个向量,并用向量夹角余弦定义文档相似度.TDRM模型借助Latent Dirichlet Allocation的主题生成方法估计每个文档的主题分布.实验结果证明,与基于词频统计的向量空间模型相比,TDRM模型在相关文档检索方面有更高的检索精度.  相似文献   

14.
由于用户查询信息不足而导致传统向量空间模型检索结果不够准确,针对此问题,提出了一种基于文档关系改进的向量空间模型.改进模型将初始检索结果中排名靠前的高相关文档组成基准集,通过计算初始检索结果集中每篇文档与基准集的相似度,来修正原模型中文档与查询的相似度,实现对检索结果的重排序,从而实现对向量空间模型的改进.实验结果表明:与传统向量空间模型相比,改进模型使得相关文档排名更合理,在保证召回率的条件下提高了准确率.  相似文献   

15.
一种新的证据组合规则   总被引:11,自引:1,他引:11  
通过对证据组合问题进行深入的理论分析,提出一种新的基于局部冲突、局部分配和一致性部分进行合取规则的证据组合方法,同时利用证据的可信度来修正证据结构.在确定证据的可信度时,给出一种通用的计算模型.与很多改进的组合方法相比,该方法不仅适用于冲突情况,而且也适用于证据间比较一致的情况.数值仿真表明,所提出方法能加快收敛速度,同时降低决策风险.  相似文献   

16.
文章对实现网络环境下藏文信息资源共建与共享的社会环境及舆论环境、丰富的藏文文献资料和较为成熟的技术保障等方面进行了可行性分析论证,并提出要加大资金投入;加强藏文文献信息资源共享的标准化、规范化建设;加强组织机构建设;建立功能完备的藏文信息检索系统;调整藏文文献信息收藏体系,注重"有效收藏"等对策和建议。  相似文献   

17.
To efficiently retrieve relevant document from the rapid proliferation of large information collections, a novel immune algorithm for document query optimization is proposed. The essential ideal of the immune algorithm is that the crossover and mutation of operator are constructed according to its own characteristics of information retrieval. Immune operator is adopted to avoid degeneracy. Relevant documents retrieved am merged to a single document list according to rank formula. Experimental results show that the novel immune algorithm can lead to substantial improvements of relevant document retrieval effectiveness.  相似文献   

18.
基于感兴趣区域和神经网络的图像检索   总被引:3,自引:0,他引:3  
提出一种感兴趣区域的图像检索方法,该方法首先采用遗传FCM算法对图像进行分割,然后提取分割后的区域特征进行检索;为了缩小低层特征和高层语义之间的语义鸿沟,最后提出一种基于神经网络的相关反馈方法,实验表明,该方法具有较好的检索性能,系统具有较高的查全率和查准率.  相似文献   

19.
作为一项新兴的信息检索评价指标,可读性在文档相关性、实用性以及质量评估中占据重要地位。其中,如何为用户提供相关可读的文档已成为垂直搜索领域一个亟待解决的问题。为了有效解决这个问题,提出了一种基于本体结构的可读性计算模型。该模型以用户的阅读抽象过程为背景,分别从语篇表面层次和概念层次对文本进行可读性计算,从而引入了3个可读性指标,即概念势、概念域和文档连贯性。具体地是将单个指标或者指标组合计算所得可读性得分融入传统垂直检索模型中,对文档初次检索结果进行重排。在医学领域中,用户实验结果表明基于本体概念序列信息的可读性指标相对于传统的非序列化指标可以更加有效地预测文档的真实可读性水平。系统实验结果进一步说明了基于可读性的重排序模型可以兼顾文档的相关性和可读性,提升垂直领域信息检索性能。  相似文献   

20.
一种提高文本聚类算法质量的方法   总被引:1,自引:0,他引:1  
针对基于VSM(vector space model)的文本聚类算法存在的主要问题,即忽略了词之间的语义信息、忽略了各维度之间的联系而导致文本的相似度计算不够精确,提出基于语义距离计算文档间相似度及两阶段聚类方案来提高文本聚类算法的质量.首先,从语义上分析文档,采用最近邻算法进行第一次聚类;其次,根据相似度权重,对类特征词进行优胜劣汰;然后进行类合并;最后,进行第二次聚类,解决最近邻算法对输入次序敏感的问题.实验结果表明,提出的方法在聚类精度和召回率上均有显著的提高,较好解决了基于VSM的文本聚类算法存在的问题.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号