首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 93 毫秒
1.
进行GO(gene ontology)语义相似性度量是解决生物学数据集成中语义异构问题的重要方法. 传统方法主要是基于距离的度量和基于信息量的度量.文中提出了一种基于语义路径覆盖的度量方法,并实现了其中Combine算法.该算法首先计算出每个节点的信息量,然后分别计算两个节点的语义路径的交的节点信息量之和以及这两个节点语义路径的并的节点信息量之和,将这两者之间的比率作为相似性度量值.实验结果表明该算法具有较高的相关系数.  相似文献   

2.
分析了当前GO语义相似性的几种常用度量方法,提出了一种基于语义子图计算GO术语语义相似性的新方法,并以GO图的一小部分为例,进行了算法研究,使语义相似性度量更加精确.  相似文献   

3.
随着语义Web不断发展,本体数量不断增加,为了增强Web服务语义的精确度,利用网络距离模型方法中概念层次结构树的结构信息、信息论模型方法中概念的语义信息量来进行边的权重计算,提出了一种用最短路径距离来计算概念间语义距离的简便方法.  相似文献   

4.
基于本体的语义相似性研究   总被引:2,自引:2,他引:0  
李文超  杨妮妮 《科学技术与工程》2012,12(21):5328-5330,5336
为了在信息检索中,从语义层面全面理解用户查询意图,提高信息的查全率和查准率,提出了基于本体的语义相似性和相关性计算方法。该算法充分考虑了本体模型结构的特点和本体间语义距离、本体密集度等因素对语义相似性的影响,提高了信息检索性能。以煤炭矿井工程的知识体系为例,建立了本体库模型,并设计了本体库的树状内存数据结构。通过实验仿真计算验证了本体相似性算法的有效性。  相似文献   

5.
为便于度量同一论域vague集合之间的相似性,定义vague集合之间的内积、外积、下积和上积等运算,在此基础上提出一种基于积运算的vague集合相似性度量方法,证明该方法的合理性,并通过实例验证了该方法的可行性和有效性。  相似文献   

6.
为了进一步提升语义检索的精度和改善用户体验,提出了一种基于多分类语义分析和个性化的语义检索方法.首先,利用改进的多分类语义分析方法实现目标文档的向量化,并建立词向量库;然后,利用支持向量机对文档进行分类,并结合文档类别生成标签索引.在检索时,根据词向量库的引导,使用用户历史检索记录和个人信息优化检索结果.实验结果显示,基于该方法的系统的检索精度、平均DCG和nDCG指标值分别达到0.7,7.267和0.890,较基于Lucene方法和Yahoo Directory方法所得结果的均值分别高出31%,36%和19%.在时间复杂度上,每次检索的平均耗时为0.669 s,较Lucene方法仅增加了0.326 s.由此可见,该方法提高了检索的精度和综合相关度,且额外的时间消耗较少.  相似文献   

7.
为了在信息检索中,从语义层面全面理解用户查询意图,提高信息的查全率和查准率,提出了基于本体的语义相似性和相关性计算方法。该算法充分考虑了本体模型结构的特点和本体间语义距离、本体密集度等因素对语义相似性的影响,提高了信息检索性能。以煤炭矿井工程的知识体系为例,建立了本体库模型,并设计了本体库的树状内存数据结构。通过实验仿真计算验证了本体相似性算法的有效性。  相似文献   

8.
为了提高文本语义相似性度量的准确性,该文从深度学习的角度出发提出了一种新的文本语义相似性度量框架,充分利用深度神经网络实现词级别、句子级别、文本级别的表示学习,使得学习到的表示向量能提供融合上下文信息的丰富语义信息,在此基础上,设计了相似性度量层,采用简单的三层网络实现任意两个文本向量的相似性值计算.在两个基准数据集上...  相似文献   

9.
提出了一种基于资源相似性的Web访问序列模式的相似度量方法,并且考虑了用户访问资源的时间因素,经过检验,证明其能够有效真实地反映实际情况。  相似文献   

10.
在信息检索领域,基于不精确的语义信息进行查询,需要用户多次进行筛选,降低了查询效率,因此,语义相似度计算的精确性至关重要.目前,人们主要利用概念词的距离、内容、属性等信息进行语义相似度计算,其中综合距离,信息内容和概念词属性等因素的混合式语义相似度计算方法是比较热门的方法,但该方法进行语义相似度计算时,权值的确定是根据专家的经验,人为的进行确定,具有一定的主观性,影响了语义相似度计算的准确性和客观性.因此,本文提出了一种新的混合式语义相似度计算方法,采用模糊优化的思想确定混合式语义相似度计算方法中的权值,避免了主观性,使语义相似度的计算更准确,查询结果更符合人们的需求.  相似文献   

11.
介绍了本体的相关知识和3种不同的领域本体语义相似度算法,针对这3种算法的视角和优缺点提出了改进的基于领域本体的语义相似度计算方法。该方法综合考虑语义距离、概念特征和信息量中多种语义相似度计算影响因素,较真实地反映了概念间的语义关系。  相似文献   

12.
一种基于义原重合度的词语相似度计算   总被引:1,自引:0,他引:1  
通过分析知网中的义原关系,认为在同一棵树中两个相等距离的义原,公共节点对相似度大小起着决定性作用;距离根节点越远,分类越细致,描述的信息越详细;它们的相似度也就越大.提出了一种基于知网的相似度的计算方法,定义了知网义原间的相似度公式.实验表明,利用本文方法计算词语相似度,所得结果在一定程度上更加与人的直观相符.  相似文献   

13.
提出了一种中文问句语义相似度计算的新方法.该方法分为两步:第一步采用基于问句句型模板规则匹配的方法提取问句语义表征;第二步根据问句语义表征计算问句语义相似度.采用该方法开发了一个面向常问问题集(FAQ)的问答系统.实验结果表明,采用该方法获得的相似度计算的准确率约为85%.  相似文献   

14.
一种改进的Lucene语义相似度检索算法   总被引:2,自引:0,他引:2  
 Lucene的基础上,结合检索词项的语义信息,利用外部词典Wordnet分析检索词项与被检索文档中词项的语义相似度,在此基础上实现对文档语义信息的检索。通过分析现有的相似度量函数的核心特征,选择合适的语义相似度量方法,提出了一种新的词项语义相似度检索函数,该函数能够对检索文档按照语义相似度进行排序。实验结果表明,所提出的方法能够有效地提升文献检索的准确度。  相似文献   

15.
针对搜索引擎领域存在的因查询条件模糊而严重影响信息检索性能的问题,提出了一种混合语义相似度优化模糊查询算法。首先,根据相似度计算概念提出了与其接近的新概念提取方法;然后,利用TF-IQF模型将链接划分成标记,并使用这些标记组成的集合表示出查询;最后,构建二分图识别出相关的查询,使用二分图计算出查询相似度。实验结果表明,相比点击文档、相关查询和反向查询三种算法,取得了更好的全查率、检索精度及F-度量。  相似文献   

16.
BFS-CTC汉语句义结构标注语料库构建方法   总被引:4,自引:3,他引:4  
根据现代汉语语义学,构建了一种层次化的句义结构模型.基于该模型构建了汉语句义结构标注语料库(Beijing forest studio-Chinese tagged corpus,BFS-CTC).利用自行开发的标注和管理工具,对模型中各个句义成分及其组合关系进行快速标注,降低培训工作量和标注成本.BFS-CTC涵盖了6种句式类型,约1万句,提供了符合现有规范的词法和句法标注信息与自定义规范的句义结构标注信息,便于词法、句法和句义的对照分析研究,以及语料的综合使用和横向分析.此外,BFS-CTC还具有较强的可扩展性,可在核心标注库基础上扩展生成其它扩展库和标注资源.  相似文献   

17.
为解决传统的协同过滤算法不能准确理解用户的喜好,影响推荐准确率和推荐效果,提出基于社会化标签语义相似度的协同过滤算法.算法以标签语义相似度为基础,将项目资源和相关标签的语义信息纳入,显著提高了推荐系统的预测性能.研究结果表明:与以具体评分数据为基础的算法相比,该算法较好地解决了词相似度和句子相似度计算问题,推荐准确度和性能较以往的协同过滤算法有明显提高,改善了推荐效果.  相似文献   

18.
针对在海量信息中进行商品筛选的问题,基于可拓学的基元理论、可拓变换、物元相关性等方法,提出一种基于可拓学的商品筛选方法;并对物元的相关性进行分析,给出商品的相似度计算方法.以服装筛选为例验证了该方法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号