首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
提出了一种新的语义相似度计算方法。该算法结合了被评估概念的高度、路径长度和公共细化度(specificity);改进了基于路径的语义相似度算法,利用本体结构,引入基于信息量算法的思想,使得新算法能够获取更多的语义信息,同时又不需要对于文本数据进行预处理;考虑本体中簇的粒度对本体的相似度计算有一定影响,在公式中添加概念在本体中的高度信息,达到低层次的概念间共享的信息要比高层次的概念间共享的信息更多。为了评估所提出的新方法,在实验中,用标准的生物医学系统命名法-临床术语(systematized nomenclature of medicine-clinical terms,SNOMED CT)作为输入本体,用已标注好的概念对集合作为数据集。实验结果表明,所提出的方法不仅保留了基于路径算法的简洁性,还优于现有语义相似度算法,证明了所提出方法的有效性。  相似文献   

2.
基于本体粗糙集的程序代码相似度度量方法   总被引:2,自引:0,他引:2  
结合本体粗糙集理论,融合粗糙集理论分类处理能力与本体论数据描述能力,提出了一种基于本体粗糙集的个体相似度计算方法,并将其应用于程序代码相似度上。实验结果显示该方法在程序代码相似度度量上具备较好的实际效果,同时也揭示了属性度量和结构度量方法应用上的关系。  相似文献   

3.
针对本体映射特别是大尺度的异构本体映射由于语义异质性导致的映射精度和效率较低的问题,提出一种基于节点语义相似度的本体映射方法.首先,研究基于网络的本体解析和表示、本体自动分块、相似子本体快速识别、基于节点语义的子本体映射等关键技术;其次,以本体对齐评估倡议评估数据集中会议本体集进行实验,结果表明,该方法在性能上优于传统映射方法,在精度上高于基于片段的映射方法.  相似文献   

4.
介绍了本体的相关知识和3种不同的领域本体语义相似度算法,针对这3种算法的视角和优缺点提出了改进的基于领域本体的语义相似度计算方法。该方法综合考虑语义距离、概念特征和信息量中多种语义相似度计算影响因素,较真实地反映了概念间的语义关系。  相似文献   

5.
首先,分析相似度计算的几类方法,然后提出一个改进的基于本体的相似度计算方法。方法同时考虑了与被评估概念相关的所有上下位关系,本体中的有向边和概念属性。经实验验证,该方法简单有效。  相似文献   

6.
7.
语义相似度计算在自然语言理解与处理、信息检索、知识获取、机器翻译等领域具有重要作用.近年来,随着知识本体和知识图谱研究的深入,面向复杂关系处理的结构化知识表达手段更为丰富和强大,从而推动了基于本体的语义相似度计算方法的快速发展.基于本体的语义相似度计算大致分为基于距离的方法、基于信息量的方法、基于属性的方法和混合式方法 4种代表性方法.回顾了上述方法的发展脉络,分析了各自的基本思想和主要实现方法,并对其优缺点进行了系统比较.最后总结了语义相似度的评测方法,并在此基础上,展望了基于本体的语义相似度计算方法的发展方向.  相似文献   

8.
由于装备信息的敏感性,军事领域的跨语言实体匹配问题会面临缺乏标注好的平行语料、依赖机器翻译质量等问题。从这些问题出发,提出了一种跨语言舰船实体匹配算法。首先归纳匹配规则,通过融合机器翻译和词典短语释义取得语言转换结果,设计了检测后缀相同字符串的相似度度量suffix-matter优化候选集,提高了算法的效率。还设计了捕捉字符和发音特征的混合相似度度量MixSim协助寻找匹配的实体。利用从互联网上爬取各国舰船活动事件的新闻报道和简式舰船数据进行实验,结果表明算法取得了较好的效果,而且证明了两种相似度度量在字符串比对中的有效性。  相似文献   

9.
一种改进的基于相似度的本体映射方法   总被引:1,自引:0,他引:1  
本体映射是解决本体异构的通用方法.发现来自不同本体的元素间的关系的过程可以转化为它们之间的语义相似度的计算, 本文从名称、结构、实例、属性四个方面改进相似度计算方法,并给出融合的相似度计算公式,通过实验说明新相似度计算方法在实际应用中是有效的.  相似文献   

10.
语义相似度计算广泛应用于自然语言处理中,但现有语义相似度计算方法没有充分挖掘本体结构中概念间的关系.笔者针对当前概念相似度计算的片面性和不完善性等不足,提出一种计算概念间语义相似度和相关度的混合方法.从有向边包含的特征属性对语义距离进行扩展,结合概念深度,将语义距离转换成语义相似度,通过引入概念间相关度计算,使最终概念语义相似度计算更加精确.并将该方法与人的主观判断结果进行比较,验证了该方法的可行性和有效性.  相似文献   

11.
在信息检索领域,基于不精确的语义信息进行查询,需要用户多次进行筛选,降低了查询效率,因此,语义相似度计算的精确性至关重要.目前,人们主要利用概念词的距离、内容、属性等信息进行语义相似度计算,其中综合距离,信息内容和概念词属性等因素的混合式语义相似度计算方法是比较热门的方法,但该方法进行语义相似度计算时,权值的确定是根据专家的经验,人为的进行确定,具有一定的主观性,影响了语义相似度计算的准确性和客观性.因此,本文提出了一种新的混合式语义相似度计算方法,采用模糊优化的思想确定混合式语义相似度计算方法中的权值,避免了主观性,使语义相似度的计算更准确,查询结果更符合人们的需求.  相似文献   

12.
Web数据挖掘是将数据挖掘技术和理论应用于对WWW资源进行挖掘的一个新兴的研究领域,文章利用了一种时间相似系数(利用夹角余弦)的计算方法,结合雅可比系数和CM系数,通过综合考虑上述三个系数,把它作为Web访问者行为的相似度度量准则,同时,又采用层次聚类算法,最后实验结果很好。  相似文献   

13.
领域本体概念相似度已被广泛应用于医学诊断知识库,为克服概念交互过程中所存在的概念度量准确率较低以及领域概念相似度语义融合不充分等问题,提出面向医学领域的概念语义本体相似度度量理论与方法。立足于领域本体结构特征,首先分解了概念层次结构所包含的语义信息,提出基于属性的计算模型,然后在结构层次中求出概念间的最小不可约集合,通过对集合中的语义模型引入调节因子,提高领域概念的融合效率。算法分析以及实例证明该方法能有效提高本体概念融合的准确性。  相似文献   

14.
15.
异构数据集成领域大量应用了本体研究方法来解决数据语义异构问题,其中有不少的语义相似度计算方法.因此,在WordNet环境下的语义相似度计算方法上,提出了Wup语义相似度计算模型框架用以解决两个局部本体之间的语义问题,并提出了构建全局本体的语义分析方法.  相似文献   

16.
异构数据集成领域大量应用了本体研究方法来解决数据语义异构问题,其中有不少的语义相似度计算方法.因此,在WordNet环境下的语义相似度计算方法上,提出了Wup语义相似度计算模型框架用以解决两个局部本体之间的语义问题,并提出了构建全局本体的语义分析方法.  相似文献   

17.
语义相似性度量能够提高信息检索的准确性和效率,已成为文本处理中的一个核心任务.为解决一词多义等词汇歧义问题,提出一种基于低维向量组合的语义向量模型.该模型引入了知识库与语料库的多语义特征的融合,主要的语义融合对象包括连续的分布式词向量和从WordNet结构中的语义特征信息.首先利用深度学习技术中的神经网络语言模型,预先从文本语料中学习得到连续的低维词向量;然后从知识库WordNet中抽取多种语义信息和关系信息;再将多语义信息融入词向量进行知识扩展和强化,生成语义向量,从而实现基于向量空间的语义相似性度量方法.在基准测试集上的实验结果表明,该方法优于基于单一信息源(知识库WordNet或文本语料)的语义相似性度量方法,其皮尔森相关系数比基于原始词嵌套向量的方法提高了7.5%,说明在向量特征层面上的多语义信息的融合有助于度量词汇间的语义相似性.  相似文献   

18.
顾及到地理领域语义相似度计算模型考虑因素过于单一、主观性较强等问题,针对本体模型的结构特点,提出一种计算节点密度的新方法,并从模型概念间的关系类型、节点密度、节点深度等方面分析本体概念相似度的计算,将其归并为距离因素.基于本体层次网络结构计算语义信息量,该方法不依赖于专家经验,具有客观性.结合语义距离、信息量、属性等影响相似度的因素,提出一种计算概念问语义相似度的综合算法,该算法考虑到不同的影响因子在语义相似度计算中的重要程度不同,从而赋予地理本体关系不同的权值.通过对土地利用分类中实体的语义相似度进行实例验证,表明提出的算法能有效改善语义相似度计算的准确性和有效性,能够获得更符合认知的信息检索结果.  相似文献   

19.
在分析现有本体映射技术的基础上,采用基于本体图结构和启发式规则的本体映射方法实现了本体间一对一映射,最后通过选取实验对象进行测试,证明了本映射机制的可行性.  相似文献   

20.
知网是一个英汉双语本体,含有丰富的语义知识.在综合考虑了知网中义原重合度、义原差度、层次深度等因素的基础上,提出了一种新颖的义原相似度计算方法,并在义原相似度计算的基础上,通过改进的匈牙利算法来计算基于知网的概念相似度,最后通过实验验证算法的有效性,与基于WordNet的方法相比,文中提出的基于知网的相似度计算一样可以取得较好的精确度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号