首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
一种改进的Lucene语义相似度检索算法   总被引:2,自引:0,他引:2  
 Lucene的基础上,结合检索词项的语义信息,利用外部词典Wordnet分析检索词项与被检索文档中词项的语义相似度,在此基础上实现对文档语义信息的检索。通过分析现有的相似度量函数的核心特征,选择合适的语义相似度量方法,提出了一种新的词项语义相似度检索函数,该函数能够对检索文档按照语义相似度进行排序。实验结果表明,所提出的方法能够有效地提升文献检索的准确度。  相似文献   

2.
信息检索涉及到许多技术,涉及多个学科领域,应用更是非常广泛,其中语义相关度的研究一直是研究的热点问题.本文主要针对基于词关联度、基于Wikipedia、基于概念格、基于视觉内容、基于知网、基于中文语义词典、基于领域本体中的概念、基于主题图、基于本体的语义相似度计算方法等,进行比较探讨,特别是对一种新颖的方法使用时语义分析计算单词间相关度的方法进行了详细的阐述说明,并提出了自己的一些想法和下一步的研究方向.  相似文献   

3.
利用语义Web服务中的标准OWL-S,提出多层次语义Web服务检索技术.与目前关键字或分类的查询方法相比,多层次语义Web服务检索技术具有更多的判断依据,并增加Web服务在搜寻时的准确率及可用性.模型包括服务名称分析、概念描述及输出-输出参数相似性分析、服务质量分析3个阶段.实验结果表明,与传统的基于关键字的检索方式相比,采用多层次语义扩展检索的查准率平均值上升0.25,查全率平均值上升0.24,但执行效率降低3.2%.  相似文献   

4.
语义相似度计算是自然语言处理中的一个关键过程,在机器翻译、自动问答、句法分析、词义排歧等领域都有着广泛的应用.列举并分析了几种典型的基于知网的相似度计算方法,并提出一种改进的基于知网的相似度计算方法,实验结果表明该方法是有效的.  相似文献   

5.
基于语义理解的文本相似度算法   总被引:26,自引:0,他引:26  
相似度的计算在信息检索及文档复制检测等领域具有广泛的应用前景.研究了文本相似度的计算方法,在知网语义相似度的基础上,将基于语义理解的文本相似度计算推广到段落范围,进而可以将这种段落相似度推广到篇章相似度计算.给出了文本(包括词语、句子、段落)相似度的计算公式及算法,用于计算两文本之间的相似度.实例验证表明,该算法与现有典型的相似度计算方法相比,计算准确性得到提高.  相似文献   

6.
用户查询与文档之间语义匹配但词法不匹配现象是影响信息检索效果的重要原因之一.鉴于语义检索受限于本体自身的质量,为了降低其对检索效果的影响,通过分析目前语义查询扩展的研究现状,在已有概念相似度计算算法研究基础上进行改进和融合,提出了一种基于本体的信息检索查询扩展方法,并主要对基于本体技术的概念相似度计算算法进行修正,得到了组合向量空间模型QCR(Q,Ci)=∑k=1.….K wk*Sim_Rel(qK,Ci),作为引入查询扩展后的查询结果相关度评价方法.这种方法中,通过建立本体模型并计算本体中概念间的语义相似度来确定扩展查询词,它可以根据用户输入的名称,检索出相关文档并由用户自由设置相似度阈值,并将普通主题检索与语义检索合并,在本体乏力时返回普通检索结果,这在一定程度上弥补了垂直检索系统发展的不足.  相似文献   

7.
介绍了语义网的相关知识,针对数字图书馆信息检索效率不高的问题,在现有数字图书馆信息检索模型的基础上,提出一种新型的基于语义网的数字图书馆信息检索模型,详细论述了该模型的3个主要模块及其各自功能。通过采用语义网技术,解决了在传统的基于关键字的信息检索中只能从句法上对关键字进行分析,而无法根据信息资源中的语义关系进行检索的问题。  相似文献   

8.
一种基于知网的词汇语义相似度改进计算方法   总被引:4,自引:0,他引:4  
汉语词语语义相似度计算是中文信息处理中的一个关键问题.在知网(HowNet)环境下,通过分析影响词汇相似度计算结果的概念层次树结构,提出了一种同时考虑层次树深度、密度及语义路径等多因素的义元相似度计算方法,并应用于词汇相似度计算过程.实验结果表明,该方法使词汇相似度计算结果更趋于合理,绝大部分结果更符合人们的日常体验,有效提高了词汇相似度计算结果的精确度和准确性.  相似文献   

9.
汉语词语语义相似度计算是中文信息处理中的一个关键问题。在知网(HowNet)环境下,通过分析影响词汇相似度计算结果的概念层次树结构,提出了一种同时考虑层次树深度、密度及语义路径等多因素的义元相似度计算方法,并应用于词汇相似度计算过程。实验结果表明,该方法使词汇相似度计算结果更趋于合理,绝大部分结果更符合人们的日常体验,有效提高了词汇相似度计算结果的精确度和准确性。  相似文献   

10.
用户查询与文档之间语义匹配但词法不匹配现象是影响信息检索效果的重要原因之一。鉴于语义检索受限于本体自身的质量,为了降低其对检索效果的影响,通过分析目前语义查询扩展的研究现状,在已有概念相似度计算算法研究基础上进行改进和融合,提出了一种基于本体的信息检索查询扩展方法,并主要对基于本体技术的概念相似度计算算法进行修正,得到了组合向量空间模型QCR(Q,Ci)=∑k=1,…,Kwk*Sim_Rel(qK,Ci),作为引入查询扩展后的查询结果相关度评价方法。这种方法中,通过建立本体模型并计算本体中概念间的语义相似度来确定扩展查询词,它可以根据用户输入的名称,检索出相关文档并由用户自由设置相似度阈值,并将普通主题检索与语义检索合并,在本体乏力时返回普通检索结果,这在一定程度上弥补了垂直检索系统发展的不足。  相似文献   

11.
随着教育信息化进程的大力推进,网络教育资源的建设越来越受到国家和各高校的重视.语义网提供了语义互操作模型,能有效实现网络资源的发现、共享和集成应用.阐述了语义网、语义检索、本体构建、元数据标准等关键技术,分析了本体与元数据的关系,给出了基于元数据的教育资源本体构建方法.设计了基于本体的网络教育资源语义检索系统,该系统由...  相似文献   

12.
Publishing on the semantic web   总被引:9,自引:0,他引:9  
Berners-Lee T  Hendler J 《Nature》2001,410(6832):1023-1024
  相似文献   

13.
针对缺乏良好组织的本体难以被重用的问题,提出了对本体中术语进行语义重组的方法.该方法首先从本体文档中抽取类之间的关系,建立类关系图,进而对不同类型的关系赋以权重.然后将多本体中语义高度相关的术语进行组合,对语义相关度低的术语进行分割.最后分别通过基于划分、基于层次化的聚类算法将类关系图重组为一组虚拟本体,实现了对本体的有效重用.以语义搜索引擎Falcons索引的本体作为数据集,对生成的虚拟本体进行了时间性能和聚类合理性评估,并对比了2种聚类方法在虚拟本体生成中的作用.实验证明该方法生成的虚拟本体具有较好的语义内聚性,达到了对本体中术语进行语义重组的目的.  相似文献   

14.
基于语义Web的网页推荐模型   总被引:4,自引:1,他引:4  
如何使用语义 Web技术构建网页推荐模型是一个有着广泛应用前景的研究课题。语义 Web下的网页用本体标注 ,该模型自动采集被标注网页上的语义信息 ,利用网页中的标注信息和相应的本体概念对网页进行分类 ,将分类结果存放在数据库中。同时 ,在这个模型下 ,用户的兴趣存放在DAML (DARPA agent markup language)格式的文件中。通过用户兴趣和网页类别的匹配 ,就能够给用户推荐需要的网页 ,在推荐网页时 ,该模型还采用支持向量机用于分类用户。实验结果显示了该模型比传统的网页推荐模型准确率更高  相似文献   

15.
语义网数据分析之初探   总被引:1,自引:0,他引:1  
为了探索语义网的发展现状,用网络爬虫采集到9.859 636×106个语义网文档,构成数据集.针对该数据集,采用复杂网络分析方法,分析语义网文档的站点分布,语义网文档的大小分布,以及命名空间的使用情况等.实验结果表明:语义网文档的站点分布服从幂率分布,分布指数为0.5304;语义网文档大小的分布服从幂率分布,分布指数为1.4071;语义网文档的国家分布不均衡.与2年前比较,语义网文档数量成倍增长;语义网文档站点的分布指数由0.6515降为0.5304;语义网文档大小的分布指数由1.1833升为1.4071;命名空间的使用情况变化显著.  相似文献   

16.
针对传统P2P系统大多采用关键字匹配实现信息检索且不支持语义的问题,提出了一个基于本体的P2P语义检索框架.该框架采用超级节点拓扑结构,利用本体进行信息集成,将支持相似概念的节点聚类到同一语义对等组,组内节点依据本体定义使用语义链来连接,组之间语义关联则通过超级节点的组语义链来实现;同时增加语义快捷链实现不同语义组之间的节点连接.  相似文献   

17.
针对传统基于关键字的信息检索系统查全率和查准率都不高的缺点,提出了一种基于语义Web的智能信息检索模型,此模型在语义Web的环境下,利用本体技术,将最初的检索词通过查询扩展模块得到更完善的检索词集,然后利用扩展的检索词集进行检索。将基于关键字匹配的信息检索系统提升为基于本体知识库扩展查询的智能检索系统,从而提高了查全率与查准率,满足了人们对信息检索系统的要求。最后给出了模型的一种实施方案。  相似文献   

18.
特征词提取是一项提炼整个web页面内容的实用技术,同时也为文本分类,信息抽取应用提供了技术支持.在web页面内容上,利用段落间语义关系划分出网页内容的篇章结构,并以此为基础使用网页的元数据和特殊标签,设计了一个特征词的加权函数,综合考虑了词频、词长和位置因子,最后,实验对比了各类位置因子对系统的贡献度.实验结果表明,改进方法的F1值比传统的TFIDF提取技术提高了15.5%,其中,位置因子中的标题,关键词和摘要因素对系统的贡献最大.  相似文献   

19.
20.
语义Web中的语义度量与本体映射   总被引:5,自引:0,他引:5  
随着本体技术的逐渐成熟,本体的应用开始受到广泛的重视。然而,本体差别的存在使得不同本体间的知识重用与共享存在困难。文章考察了语义Web中本体所具有的特征,提出借助语义度量技术,实现本体间的映射,较好地解决了这一问题;同时,进一步的探讨了本体映射过程中的效率问题,。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号