首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
进行GO(gene ontology)语义相似性度量是解决生物学数据集成中语义异构问题的重要方法. 传统方法主要是基于距离的度量和基于信息量的度量.文中提出了一种基于语义路径覆盖的度量方法,并实现了其中Combine算法.该算法首先计算出每个节点的信息量,然后分别计算两个节点的语义路径的交的节点信息量之和以及这两个节点语义路径的并的节点信息量之和,将这两者之间的比率作为相似性度量值.实验结果表明该算法具有较高的相关系数.  相似文献   

2.
以软件重用为背景提出基于语义和结构的UML类图检索.构建了UML类图的重用模型,定义了存储UML类图的重用库结构.提出将本体的概念语义距离应用到UML类图的语义相似性度量和使用图表示UML类图的结构进行结构相似性度量.基于检索流程形式化检索需求,提出了UML类图的检索算法.基于提出的衡量标准,从语义、结构和混合三种检索类型对提出的算法进行了验证.实验结果表明,所提出的检索算法在检索质量和检索效率上要优于其他方法.  相似文献   

3.
为了提高文本语义相似性度量的准确性,该文从深度学习的角度出发提出了一种新的文本语义相似性度量框架,充分利用深度神经网络实现词级别、句子级别、文本级别的表示学习,使得学习到的表示向量能提供融合上下文信息的丰富语义信息,在此基础上,设计了相似性度量层,采用简单的三层网络实现任意两个文本向量的相似性值计算.在两个基准数据集上...  相似文献   

4.
MicroRNA(miRNA)的许多生物过程是通过影响靶基因的转录后表达.miRNA与靶标之间的互补程度和性质决定其基因调控作用.结构相似性可以作为一个强有力的方法推断分子功能的相似性.然而,结构比对的方法来度量miRNA之间的相似性通常不太准确,而且时间开销大.对这些表达差异的miRNA的靶标基因进行聚类,可以很好地理解miRNA的功能.提出一个新的GO(gene Ontology)语义相似性的方法来区分miRNA功能组.该方法采用项信息和边的权重来度量GO项的权重.此外,2个GO图的共同项和非共同项还被用来度量这2个图之间的相似度.对于2个miRNA,它们之间的相似性可以用它们靶标基因标注的GO项的相似性来计算.实验结果表明此方法不仅可以将相似功能的miRNA聚在一起,而且可以预测未知miRNA的功能.  相似文献   

5.
为提高短文本语义相似性度量准确性,设计一种基于混合机器学习模型的短文本语义相似性度量算法.先对短文本实施预处理,基于混合机器学习模型构建短文本的字词向量模型,对短文本进行特征扩展;然后组合短文本的多样度量特征,对多样度量特征进行维度规约;最后通过构建一个集成学习模型,计算语义相似性结果,实现语义相似性的度量.使用“Quora Question Pairs”比赛数据集测试该方法的性能,测试结果表明,该方法的准确性较高,对数损失和度量均方差均较低,说明该方法的相似性度量准确性较高.  相似文献   

6.
以实体关系图为研究背景,提出了基于区域子图的实体相关性度量方法.该方法从实体的邻居节点出发,通过定义实体的区域子图,对实体的语义上下文环境进行统一描述.为了快速有效地实现不同区域子图间的相似性计算,将区域子图转化为近似语义树结构,并利用树核函数,以计算语义树中相同子结构数量的方法对实体的相关性进行计算.最后,根据实验结果,对该方法的性能进行评估,结果显示该方法具有较好的准确率和运行效率.  相似文献   

7.
基于非负矩阵分解的隐含语义图像检索   总被引:1,自引:0,他引:1  
提出了一种基于非负矩阵分解(Non-negative Matrix Factorization,NMF)的隐含语义索引(Latent Semantic Indexing,LSI)模型用于图像检索.应用NMF训练算法构造了一个语义空间,将查询图像和原型图像都投影到该空间以获得语义特征,在此空间中进行相似性的度量并将距离最近的图像返回给用户.与已有两种检索模型的实验结果对比表明,所提出模型是有效的.  相似文献   

8.
完善地名自动匹配更新技术,以地名属性信息为契机,采用语义相似性度量技术进行地名匹配研究.研究结果表明:语义相似性度量技术对于地名的自动化乃至智能化匹配技术有着不可替代的支撑作用,并且可以大大简化以及完善原有的地名匹配方法,值得深入研究并实践采用.该研究成果打破了原有地名匹配研究的局限性,有助于其他学者对地名匹配方法的进一步完善与拓展,展现了良好的地名匹配研究前景.  相似文献   

9.
语义相似性度量能够提高信息检索的准确性和效率,已成为文本处理中的一个核心任务.为解决一词多义等词汇歧义问题,提出一种基于低维向量组合的语义向量模型.该模型引入了知识库与语料库的多语义特征的融合,主要的语义融合对象包括连续的分布式词向量和从WordNet结构中的语义特征信息.首先利用深度学习技术中的神经网络语言模型,预先从文本语料中学习得到连续的低维词向量;然后从知识库WordNet中抽取多种语义信息和关系信息;再将多语义信息融入词向量进行知识扩展和强化,生成语义向量,从而实现基于向量空间的语义相似性度量方法.在基准测试集上的实验结果表明,该方法优于基于单一信息源(知识库WordNet或文本语料)的语义相似性度量方法,其皮尔森相关系数比基于原始词嵌套向量的方法提高了7.5%,说明在向量特征层面上的多语义信息的融合有助于度量词汇间的语义相似性.  相似文献   

10.
针对主题图导航定位的精确性和有效性问题,提出一种面向本体的主题图导航定位方法.根据主题图的特征关系去实现资源导航定位.因此,首先定义本体关系和相似性计算方法,并通过本体关系分析主题图的匹配融合方法,以及通过RDF、OWL-S、WSDL和XTM间的标签关系去实现导航定位模型;建立一种具有语义的蚁群算法进行优化求解,并与传统的蚁群算法进行比较,结果表明,具有语义的蚁群算法智能性更强.最后定义本体的召回率,用主题图精确度和语义蚁群优化效率评估该模型.结果表明,有效提高了主题图连接资源的精确性.  相似文献   

11.
Semantic similarity between Gene Ontology (GO) terms is critical in resolving semantic heterogeneousness when integrating heterogeneous biological databases. Traditionally, distance based and information content based measures are two major methods. In this paper, a new method based on semantic pathway covering is proposed and an algorithm, COMBINE algorithm, is presented, which considers information contents of two given nodes and those of all nodes included in the two nodes’ pathways. Experiments show that COMBINE algorithm obtains the highest correlation index compared with those distance based and information content based algorithms.  相似文献   

12.
13.
语义相似度计算广泛应用于自然语言处理中,但现有语义相似度计算方法没有充分挖掘本体结构中概念间的关系.笔者针对当前概念相似度计算的片面性和不完善性等不足,提出一种计算概念间语义相似度和相关度的混合方法.从有向边包含的特征属性对语义距离进行扩展,结合概念深度,将语义距离转换成语义相似度,通过引入概念间相关度计算,使最终概念语义相似度计算更加精确.并将该方法与人的主观判断结果进行比较,验证了该方法的可行性和有效性.  相似文献   

14.
A large semantic gap exists between content based index retrieval (CBIR) and high-level semantic, additional semantic information should be attached to the images, it refers in three respects including semantic representation model, semantic information building and semantic retrieval techniques. In this paper, we introduce an associated semantic network and an automatic semantic annotation system. In the system, a semantic network model is employed as the semantic representation model, it uses semantic keywords, linguistic ontology and low-level features in semantic similarity calculating. Through several times of users' relevance feedback, semantic network is enriched automatically. To speed up the growth of semantic network and get a balance annotation, semantic seeds and semantic loners are employed especially.  相似文献   

15.
提出了一种中文问句语义相似度计算的新方法.该方法分为两步:第一步采用基于问句句型模板规则匹配的方法提取问句语义表征;第二步根据问句语义表征计算问句语义相似度.采用该方法开发了一个面向常问问题集(FAQ)的问答系统.实验结果表明,采用该方法获得的相似度计算的准确率约为85%.  相似文献   

16.
基于本体的信息检索系统模型   总被引:5,自引:0,他引:5  
针对基于关键字的传统查询方法存在的不足,提出一种面向语义查询的信息检索模型.该模型将信息检索方法与语义Web技术相结合,通过基于本体的知识库实现用户对文档库的语义查询;同时,综合考虑语义检索和关键字检索两种情况,提出一种相似度计算方法,有效地满足了用户对Web信息资源的要求,并为以后的语义检索研究奠定了理论基础.  相似文献   

17.
一种基于农业领域本体的语义检索模型   总被引:1,自引:0,他引:1  
基于农业领域本体和词汇,给出一个针对农业领域的语义检索改进模型.该模型接受用户自然语言输入,通过计算词语与本体知识之间的相关度和相似度,来实现词汇到知识的映射.针对农业领域本体特点,给出相应的语义扩展规则,把检索结果从本体知识扩展到与之相关的资源文档,并对检索结果进行排序.  相似文献   

18.
一种改进的Lucene语义相似度检索算法   总被引:2,自引:0,他引:2  
 Lucene的基础上,结合检索词项的语义信息,利用外部词典Wordnet分析检索词项与被检索文档中词项的语义相似度,在此基础上实现对文档语义信息的检索。通过分析现有的相似度量函数的核心特征,选择合适的语义相似度量方法,提出了一种新的词项语义相似度检索函数,该函数能够对检索文档按照语义相似度进行排序。实验结果表明,所提出的方法能够有效地提升文献检索的准确度。  相似文献   

19.
基于模糊集的地理信息模式匹配算法   总被引:2,自引:0,他引:2  
结合现有模式匹配算法和GML模式的特点,给出了元素与元素语义贴近度的定义,在通用匹配规则的基础上引入具体的匹配规则.针对匹配规则在计算语义贴近度中的作用定义了权值调配函数,并给出了关于元素对的匹配函数的定义和计算公式.实验表明,该算法能够有效发现地理信息模式中元素之间的相似关系,提高了元素之间匹配结果的准确度,对地理信息模式的整合有较大的帮助.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号