首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 703 毫秒
1.
针对位置语言模型没有考虑词与词之间语义关系的问题, 提出一种结合语义的位置语言模型。首先采用高斯核函数来度量词与词之间的位置关系; 然后提出一种平滑互信息的技术来度量词与词之间的语义关系, 证明了平滑互信息能够有效解决大量词对之间无法通过互信息来计算转移概率的问题; 还证明了位置语言模型是结合语义位置语言模型的一个特例; 最后将结合语义的位置语言模型应用于信息检索, 得到一个基于该模型的检索模型。实验结果表明, 基于该模型的检索模型在性能方面要优于基于位置语言模型的检索模型。  相似文献   

2.
针对位置语言模型没有考虑词与词之间语义关系的问题,提出一种结合语义的位置语言模型。首先采用高斯核函数来度量词与词之间的位置关系;然后提出一种平滑互信息的技术来度量词与词之间的语义关系,证明了平滑互信息能够有效解决大量词对之间无法通过互信息来计算转移概率的问题;还证明了位置语言模型是结合语义位置语言模型的一个特例;最后将结合语义的位置语言模型应用于信息检索,得到一个基于该模型的检索模型。实验结果表明,基于该模型的检索模型在性能方面要优于基于位置语言模型的检索模型。  相似文献   

3.
将广义覆盖粗糙集理论及其计算运用到信息检索模型.通过建立查询式和库中文档之间的联系的要点构造了基于覆盖粗糙集理论的的两类信息检索模型,并给出了一些相关的上、下近似算子扩展定义.  相似文献   

4.
基于Markov网络的检索模型   总被引:2,自引:0,他引:2  
基于Markov网络的信息检索模型提出一种贝叶斯网络推广的检索模型,该模型利用词项在文档集中的共现信息来构造Markov网络,通过该索引项子Markov网络来加载附加查询证据源,计算文档与查询之间的相关性概率,由此概率进行文档排序. 实验结果表明,本文提出的Markov网络模型比其他传统的检索方法具有更优的检索性能.  相似文献   

5.
决策粗糙集基于严格的不可分辨等价关系,只能适用于离散型数据,文中研究了一种新的模糊决策粗糙集模型及相应的属性约简算法.该模型将不可分辨等价关系放松为高斯核模糊T-等价关系,从模糊隶属度角度定义了条件概率,能够直接对数值型数据进行属性约简.利用UCI标准数据集,将该模型与Pawlak经典粗糙集、决策粗糙集在属性约简能力上进行比较,仿真实验结果表明,该模型具有较好的性能.  相似文献   

6.
粗糙集理论是一种处理不确定性问题的有力工具,它假定知识是一种对对象进行分类的能力,分类是推理、学习与决策中的关键问题,传统粗糙集所基于的是不分明关系,这往往使得分类过细,因而笔者探讨一种基于模糊相似矩阵的分类方式,把传统的等价关系弱化为模糊等价关系,从而可得到更具表达力的粗糙集模型。  相似文献   

7.
粗糙拟阵是同时推广了粗糙集和拟阵的数学工具,它既可以被理解为是借助拟阵研究粗糙集,也可以被当作是通过粗糙集来研究拟阵.粗糙拟阵能够利用粗糙集和拟阵各自的优势处理和分析数据.通过等价关系上可定义集的性质,研究了基于等价关系的上粗糙拟阵和下粗糙拟阵.事实上,基于等价关系的上粗糙拟阵同时也是基于这个等价关系的下粗糙拟阵.因此给出了基于等价关系的粗糙拟阵的概念.类比拟阵中基的概念,定义了基于等价关系的粗糙拟阵的基,并且研究了这些基的性质.根据基的性质得到一个论域上所有的粗糙拟阵.特别地,讨论了论域的任何一个子集与该论域上的粗糙拟阵之间的某种对应关系.  相似文献   

8.
提出了一种基于字面相关性匹配和语义相关性匹配的深度神经网络模型,用来计算信息检索中查询和文档的匹配得分。字面相关性匹配模型基于查询和文档之间的词共现矩阵,主要考虑查询和文档的字面匹配信息以及匹配词的位置信息;语义相关性匹配模型基于预训练的词向量,进一步通过卷积神经网络提取查询和文档之间不同位置的语义匹配信息,最后的匹配得分是这两个子模型的叠加。损失函数采用hinge loss,通过最大化正负样本之间的分数差来更新参数。实验结果表明,模型在验证集上的NDCG@3和NDCG@5分别可以达到0.790 4和0.818 3,相对于BM25以及单个的字面匹配或者语义匹配模型来说都有很大的提升,这也验证了字面匹配和语义匹配对于信息检索的重要性。  相似文献   

9.
区别于传统的信息检索,地理信息检索通过一个查询范围词来限制用户的兴趣区域.目前的技术一般是把该查询范围词作为一个过滤器,将在该范围之外的文档排除在查询结果外.但是,词在地理空间的频率分布并不是均匀的,因此词在排序结果中的重要性应该随着查询范围的变化而有所改变.为此,提出了一种新的基于语言模型的地理信息查询模型,把查询范围引入到传统的语言模型中.在该模型中,引入了一个local model来描述查询词的地理分布特性.实验结果表明,新的检索模型优于TF-IDF与传统的语言模型.  相似文献   

10.
基于Markov网络的信息检索扩展模型   总被引:6,自引:0,他引:6  
为了解决信息检索性能较差的问题,查询扩展将索引项之间的关系以及文档之间的相似度引入到检索中,这个过程可以通过构造知识网络来进行.Markov网络是一种有效的知识关联图形表示方法,可以从实例数据训练获得.本研究提出并实现了基于Markov网络的信息检索扩展模型,通过对文档集的学习,构造了关于索引项和文档的Markov网络,将有利于检索的信息加入到检索中.实验表明,基于Markov网络的信息检索扩展模型优于BM25模型.  相似文献   

11.
基于等价关系的信息熵及概率分配函数
  总被引:1,自引:0,他引:1  
Pawlak在1982年提出的粗糙(Rough)集是基于等价关系的理论, 粗糙集的发展推动了人们对等价关系的研究.等价关系上的信息熵具有最为简单、规范的性质.本文研究基于等价关系上的信息熵及概率分配函数,讨论基于等价关系上的信息熵的基本性质,为等价关系的信息熵的各种应用提供理论基础,比如等价关系的信息熵在信息系统的约简方面可能发挥重要作用.文章主要从两方面进行论证:①等价关系的粗细对信息熵的影响,这点通过8个命题来说明;②等价关系与证据理论之间的联系.证据理论主要是通过概率分配函数、信任函数及似然函数来表述,从某种意义上说粗集理论继承和发展了证据理论.另外,本文的讨论均在有限论域U={u1,u2,...,u|U|} 上进行,用具体的例子来说明抽象的数学命题,使之更容易理解.  相似文献   

12.
针对已有的不完备信息系统粗糙集扩充模型没有考虑属性的权重的缺点,提出基于加权阈值容差关系的粗糙集扩充模型.该模型根据给出的不完备信息系统信息量计算权重,不需引入系统外知识,权重确定比较客观;同时引入阈值来调整加权阈值容差类判定的严格程度,兼顾了人的主观要求,并能预先排除因自身不满足阈值条件而不可能与任何其他对象划为同一加权阈值容差类的对象,但不影响类的完整性.实例对比分析表明,与其他模型相比,基于加权阈值容差关系的粗糙集扩充模型符合不完备信息系统应用客观实际,具有更强的适应能力.  相似文献   

13.
不完备信息系统中Rough集的扩充模型   总被引:2,自引:0,他引:2  
经典的Rough集理论所处理的信息系统必须是完备的.为了能够分析处理不完备的信息系统,需要建立新的扩充Rough集模型.对现有的几种比较有影响的Rough集扩展模型进行了分析研究,提出了一种带约束的相似关系Rough集模型,并将这些扩充模型之间的关系进行了分析比较.结果显示,基于约束相似关系的扩充Rough集模型优于基于容差关系的扩充Rough集模型和基于相似关系的扩充Rough集模型,使得对象的划分更加合理,符合人们在处理数据时的直观感觉.  相似文献   

14.
借鉴邻域粗糙集处理连续型数据的优势,为解决传统谱聚类算法需要人工选取参数的问题,提出基于自适应邻域互信息与谱聚类的特征选择算法。首先,定义各对象在属性下的标准差集合与自适应邻域集,给出自适应邻域熵、平均邻域熵、联合熵、邻域条件熵、邻域互信息等不确定性度量,利用自适应邻域互信息对特征与标签的相关性进行排序。然后,结合共享近邻自适应谱聚类算法,将相关性强的特征聚到同一特征簇内,使不同特征簇内的特征强相异。最后,使用最小冗余最大相关技术设计特征选择算法。在10个数据集上选择特征个数与分类精度的实验结果,验证了所提算法的有效性。  相似文献   

15.
相容关系的改进及其属性约简   总被引:1,自引:0,他引:1  
针对经典粗糙集理论处理不完备信息系统存在的局限性,作者从扩展粗糙集理论的适用范围出发,引入不完备信息系统对象的先验概率并结合量化相容关系的思想,提出了改进的相容关系模型.以该模型为基础研究了不完备信息系统的属性约简.通过严格的数学证明,给出了属性约简算法.该算法以空集为起点求取系统的约简,不需要计算核,节约了时间,减少了占用空间,简化了求解过程.通过实例验证该改进相容关系模型及其属性约简算法.  相似文献   

16.
S-粗信息矩阵与它的两类形式   总被引:2,自引:2,他引:0  
利用粗信息矩阵,提出了S-粗信息矩阵概念,给出了S-粗信息矩阵的结构和特征。S-粗信息矩阵具有两类形式:单向S-粗信息矩阵,单向对偶S-粗信息矩阵,双向S-粗信息矩阵。给出了S-粗信息矩阵与粗信息矩阵、S-粗集、Z.Pawlak粗集的关系定理。  相似文献   

17.
为了解决传统依据关键字、概念和属性值等检索技术没有考虑不同主体中情报信息间的语义关系,无法提供令用户满意的情报检索结果问题,通过语义Web方法研究了多功能情报信息自适应检索技术。设计基于语义Web的多功能情报信息自适应检索模型,检索模型包括人机交互层、知识处理层以及知识存储层。在知识存储层建立本体语义模型。在知识处理层,从检索的多功能情报信息关键词中推断和其语义有关的概念,依据概念有关词汇对原始查询进行扩展,对语义相似度进行计算。在人机交互层,将用户反馈情况看作判断检索结果优劣的衡量因素,依据相似关键词获取相似结果集,按照反馈因子完成对所有相似结果的排序,把排序结果发送给用户,实现多功能情报信息自适应检索。结果表明,所提方法能够同时保证召回率与精度;排序误差率低;检索结果和用户查询结果最相符,检索结果准确,可令用户满意。可见所提方法检索性能强。  相似文献   

18.
基于互信息的中文姓名识别方法   总被引:4,自引:0,他引:4  
提出并实现了一个基于互信息的中文姓名识别方法,该方法充分挖掘姓名和其上下文信息的关联程度以及姓名用字之间关联程度的信息,引入互信息对其进行定量的描述;提出中文姓名的上下文互信息、内部互信息等概念,并对其建立了动态评价函数,开放测试结果表明,该方法有效地提高了中文姓名识别的效果,保证了较高的精确率和召回率。  相似文献   

19.
邻域粗糙集是经典粗糙集的一个扩展模型,研究其不确定性度量模型具有重要意义。在邻域粗糙集理论中,当前不确定性度量方面的研究工作主要专注于度量知识空间的粒度大小或边界域尺寸。在邻域系统中,对于目标概念为模糊时的情形,其不确定性不仅来自于邻域粒的边界域,还来自于正域和负域,当前的不确定性度量方法较少考虑这种情形。为此,构建了邻域粗糙模糊集模型,从粒计算的角度出发,进一步提出了多粒度邻域粗糙模糊集模型;针对多粒度邻域粗糙模糊集具有乐观性与悲观性的特点,借鉴Vague集中支持度和反对度的思想,设计了基于模糊度的多粒度模糊熵的不确定性度量方法,不仅符合人类的认知习惯,而且可以有效刻画整个邻域知识空间的结构信息。  相似文献   

20.
针对模糊信息系统,提出了用模糊相容关系代替经典粗糙集中的不可分辨关系来构造扩展粗糙集的方法.定义了模糊信息系统中的模糊相容关系,给出了模糊相容关系下粗糙集的表示方法及性质,证明了模糊相容关系下粗糙集模型的不同表示形式,并讨论了在模糊相容关系下模糊变精度粗糙集模型及其性质.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号