首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 171 毫秒
1.
异构数据集成领域大量应用了本体研究方法来解决数据语义异构问题,其中有不少的语义相似度计算方法.因此,在WordNet环境下的语义相似度计算方法上,提出了Wup语义相似度计算模型框架用以解决两个局部本体之间的语义问题,并提出了构建全局本体的语义分析方法.  相似文献   

2.
为解决电力信息系统中存在的异构问题,基于信息总线理论,采用层次化结构设计,提出了"企业信息总线"(EI-Bus)的EAI中间件模型,实现了基于规则的柔性机制,并提供可配置的流程定义.针对系统集成中的语义异构,引入电力系统领域本体进行知识表达,提出综合概念相似度和描述相似度的计算方法来实现本体映射,从语义层次上解决多源异构信息的互操作特性.  相似文献   

3.
异构数据集成领域大量应用了本体研究方法.该文针对混合本体模型映射存在的不足提出了自适应混合本体模型,通过计算各种不同相似度获得相似度综合的计算方法.提出了自适应映射的定义和计算方法用以解决本体之间是否要进行映射的问题.  相似文献   

4.
针对本体映射特别是大尺度的异构本体映射由于语义异质性导致的映射精度和效率较低的问题,提出一种基于节点语义相似度的本体映射方法.首先,研究基于网络的本体解析和表示、本体自动分块、相似子本体快速识别、基于节点语义的子本体映射等关键技术;其次,以本体对齐评估倡议评估数据集中会议本体集进行实验,结果表明,该方法在性能上优于传统映射方法,在精度上高于基于片段的映射方法.  相似文献   

5.
顾及到地理领域语义相似度计算模型考虑因素过于单一、主观性较强等问题,针对本体模型的结构特点,提出一种计算节点密度的新方法,并从模型概念间的关系类型、节点密度、节点深度等方面分析本体概念相似度的计算,将其归并为距离因素.基于本体层次网络结构计算语义信息量,该方法不依赖于专家经验,具有客观性.结合语义距离、信息量、属性等影响相似度的因素,提出一种计算概念问语义相似度的综合算法,该算法考虑到不同的影响因子在语义相似度计算中的重要程度不同,从而赋予地理本体关系不同的权值.通过对土地利用分类中实体的语义相似度进行实例验证,表明提出的算法能有效改善语义相似度计算的准确性和有效性,能够获得更符合认知的信息检索结果.  相似文献   

6.
为了解决现有句子相似度算法未考虑句子语义信息的问题,提出了一种基于词法、句法和语义的句子相似度计算方法.将句子相似度分为词法层、句法层、语义层3个层次.在词法层,通过构建句子的词汇相似度矩阵和数字序列相似度矩阵来计算词法相似度;在句法层,使用概念词汇转化成的RDF三元组相似度来计算句法相似度;在语义层,基于本体树状结构中最短路径表示的语义距离来计算语义相似度.然后,提出句子语义相似度计算模型,采集图书领域句子对作为测试集,构建图书领域本体作为知识源.实验结果表明,所提方法具有更高的准确率和召回率,其F-度量值达0.649 9,与余弦相似度算法、基于编辑距离的算法和基于TF-IDF的算法相比分别提高约12%、17%和16%.  相似文献   

7.
混合语义模型的产品知识文档检索   总被引:1,自引:0,他引:1  
为解决产品知识文档检索过程中遇到的问题,提出一种基于混合语义模型的检索方法.该方法将传统的用户查询需求扩展为用户偏好、语境和用户查询混合而成的语义集合,并对知识文档和用户需求进行基于本体的模糊概念表达.对于知识文档,选择领域本体的叶节点来构造文本概念向量,根据概念在本体图中的深度、携带的信息量,及出现在文档与语料库中的频度来计算权重.同样采用本体表达知识语境与查询语义,建立用户偏好模型.针对检索模型的不同组成,阐述了相应的相似度计算方法,采用概念的语义距离计算用户当前语境和文档语境之间的相似度,用余弦法计算查询语义、用户偏好与文档的相似度.最后用实验验证了该方法的检索效果优于传统的向量空间方法.  相似文献   

8.
一种改进的基于相似度的本体映射方法   总被引:1,自引:0,他引:1  
本体映射是解决本体异构的通用方法.发现来自不同本体的元素间的关系的过程可以转化为它们之间的语义相似度的计算, 本文从名称、结构、实例、属性四个方面改进相似度计算方法,并给出融合的相似度计算公式,通过实验说明新相似度计算方法在实际应用中是有效的.  相似文献   

9.
语义信息集成是目前屏蔽数据之间半结构性、异构性和分布性的主要方法,其目的是为用户提供最大范围的精确数据。以解决信息集成中的语义冲突为目的,采用本体描述全局数据概念、树型结构描述局部数据概念。在此基础上,给出数据的逻辑定义方法,利用相似度计算匹配值来实现数据在语义集成中的匹配,并描述了语义信息集成中的映射算法。最后给出了实验数据和此方法执行结果,验证了此方法的正确性。  相似文献   

10.
提出一种新的基于WordNet和文本集语义参数IC的计算方法,通过综合考虑概念在WordNet中语义信息以及数据集中的概率信息,即概念的自信息,同时利用新的参数考虑概念对在WordNet中的共享信息,设计了一种通用的概念语义相似性计算方法,该方法简化了传统语义相似性算法,并解决了语义相似性计算领域的相关问题,可以应用在信息抽取、信息检索、文档分类及本体学习中.领域通用的数据集RB数据实验结果表明,该方法在计算语义相似度问题上有效。  相似文献   

11.
12.
本文对广义向量空间模型进行了改进,并利用《知网》义原提出了一种基于义原空间的文本相似度计算方法。此方法根据TF-IDF权重,将文中特征项转化为义原空间中的向量,通过求义原向量之间的夹角余弦值的方式,实现文本相似度的计算。最后进行文本聚类对比实验,结果表明,该方法可以很好地解决舆情分析中的语义漂移问题,使得网络舆情分析的效果有了较大提高。  相似文献   

13.
语义相似度计算广泛应用于自然语言处理中,但现有语义相似度计算方法没有充分挖掘本体结构中概念间的关系.笔者针对当前概念相似度计算的片面性和不完善性等不足,提出一种计算概念间语义相似度和相关度的混合方法.从有向边包含的特征属性对语义距离进行扩展,结合概念深度,将语义距离转换成语义相似度,通过引入概念间相关度计算,使最终概念语义相似度计算更加精确.并将该方法与人的主观判断结果进行比较,验证了该方法的可行性和有效性.  相似文献   

14.
为弥补传统的基于文本相似函数(如编辑距离、语音距离等)的方法在重复记录的识别方面的不足,对记录内部单个字段的语义以及字段之间的语义进行了研究;采用字段名与统计分析相结合的方法来识别字段内部的语义,采用语义规则库来识别字段之间的层次语义和依赖关系;将语义引入到优先队列算法中,提出了改进的优先队列法(IPQM),在计算记录之间的相似度时,显式考虑字段之间的层次语义关系,对不同的字段类型调用不同的相似度计算方法.同时将语义规则库引入到数据清理框架,在预处理阶段利用语义来处理等价类型错误,在处理阶段利用IPQM来计算记录之间的相似度.实验结果表明该框架提高了数据清理的质量,遗漏率低于7%,误判率不超过3%.  相似文献   

15.
Long-document semantic measurement has great significance in many applications such as semantic searchs, plagiarism detection, and automatic technical surveys. However, research efforts have mainly focused on the semantic similarity of short texts. Document-level semantic measurement remains an open issue due to problems such as the omission of background knowledge and topic transition. In this paper, we propose a novel semantic matching method for long documents in the academic domain. To accurately represent the general meaning of an academic article, we construct a semantic profile in which key semantic elements such as the research purpose, methodology, and domain are included and enriched. As such, we can obtain the overall semantic similarity of two papers by computing the distance between their profiles. The distances between the concepts of two different semantic profiles are measured by word vectors. To improve the semantic representation quality of word vectors, we propose a joint word-embedding model for incorporating a domain-specific semantic relation constraint into the traditional context constraint. Our experimental results demonstrate that, in the measurement of document semantic similarity, our approach achieves substantial improvement over state-of-the-art methods, and our joint word-embedding model produces significantly better word representations than traditional word-embedding models.  相似文献   

16.
为了解决不同数据源集成时的语义冲突,实现语义共享,首先必须要进行语义相关属性识别.针对不同类型的语义相关属性及其实例的表达形式,提出了一种更加具有通用性的语义相关属性识别方法--属性相似性计算模型,该模型能够计算数值型属性、字符型属性、标称型属性等三种不同类型属性之间的相似性,为判断不同属性是否相关提供了量化依据.结果表明,所提出的属性相似性计算方法不仅可以有效计算属性的相似性,而且允许相关属性的实例值存在表达冲突,拼写错误等情况,因此,该方法具有较好的容错性和通用性.  相似文献   

17.
Introduction ThecurrentHTML basedWebismainlydesignedfor humanstobrowseanduse.Themajorityofthewebpages areinhumanreadableformatonly,somachinescannot understandandprocessthisinformation,andmuchofthe potentialofthewebhassofarremaineduntapped.The traditionalwebhasreacheditscrucialpoint.TimBerners Lee,inventoroftheweb,hascoinedthetermSemantic Webtodescribetheapproachthataugmentthewebwith languagesthatmakethemeaningofwebpagesexplicit[1].Thevisioninthesemanticwebcanberegardedasdata interoperation…  相似文献   

18.
介绍了本体的相关知识和3种不同的领域本体语义相似度算法,针对这3种算法的视角和优缺点提出了改进的基于领域本体的语义相似度计算方法。该方法综合考虑语义距离、概念特征和信息量中多种语义相似度计算影响因素,较真实地反映了概念间的语义关系。  相似文献   

19.
提出了一种基于不同语义单元度量的句子相似度计算方法.将句子按词块分割为对应的公共词块和非公共词块,利用外部语义资源进行同义词替换和语义消歧处理.分别用词、词块和字为语义单元度量句子相似度,以不同的权重调节各语义单元对句子相似度的贡献.实验结果表明,该方法综合考虑的因素更加全面,有较高的准确率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号