首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 281 毫秒
1.
针对现存资源描述框架(RDF)查询方案不能满足日益剧增的海量RDF数据的关键词搜索要求,提出一种面向大规模RDF数据的分布式搜索算法(KDSOS).该算法首先结合RDF本体构建查询关键词对应的本体子图集并利用评分函数评分;其次在大规模的RDF数据图上优先搜索评分高的本体子图对应的结果子图,直到找到Top-k结果.实验结果表明,KDSOS算法在搜索效率和准确率上都具有明显的优势.  相似文献   

2.
随着Web内容爆炸式增长,基于RDF的开放关联数据越来越多,传统的RDF推理技术难以适应日益增长的大规模RDF数据推理任务.提出基于MapReduce的分布式迭代算法,设计了简洁的去重方法,实现分布式RDF推理,解决了RDF传递推理工程中持续产生单调递增数据集传递闭包问题.实验采用基于Hadhoop的分布式文件系统存储MapReduce算法,实验结果显示方法具有较好的计算性能和可扩展性.  相似文献   

3.
基于关键词的RDF数据查询方法   总被引:1,自引:0,他引:1  
在建立关键词倒排索引和路径索引的基础上,提出一个利用量化均衡规则和等距规则的启发式查询算法,并按照查询结果的大小排序返回最相关的前k个结果.通过建模RDF数据为RDF句子图,将文本信息封装到句子节点,同时将查询结果建模为包括所有查询关键词并且叶节点是关键词节点的无根树,将关键词查询问题转化为斯坦纳树问题.假设RDF句子图包括n个节点,最坏情况下索引占用的空间是3n2.假设关键词节点数为k,查询算法的时间复杂度为O(kn).该方法不需要依赖RDF数据的模式信息,支持对数据中的属性和关系名进行关键词查询.实验证明该方法能够快速而有效地实现RDF数据的关键词查询.  相似文献   

4.
Top-k子图匹配是一种应用广泛的图搜索技术。相比于单机环境,分布式环境下的Top-k子图匹配问题具有更大的挑战性。该文分析了已有方法在分布式环境下存在的问题,提出了包括查询拆分、查询执行、结果连接3个步骤的算法。算法通过查询拆分,彻底避免了生成中间结果过程中的数据传输,同时通过优化查询执行和结果连接步骤,避免不必要的中间结果生成,降低单个节点的计算量,提升整体效率。在此基础上,该文对分布式环境下Top-k连接策略进行了进一步优化。在真实图数据上进行的实验测试表明:该文提出的算法能够有效解决分布式环境下Top-k子图匹配问题,具有很好的扩展性,而且使用优化连接策略的算法性能较基础算法的效率有明显的提升。  相似文献   

5.
针对大规模路网路径搜索算法计算量大、耗时长、效率低等问题,采用MapRe-duce并行编程模型计算框架,利用网络中大量不同位置的计算机进行集群式海量数据计算,解决基于大规模路网分割成若干子图并行计算问题.本文基于MapReduce构建一个新的计算框架,建立了基于子图分割的并行搜索方法,实现超大规模真实交通路网中最短路径搜索.案例分析证明:该方法能够在可接受的计算时间内提供高质量的最短路径搜索服务.  相似文献   

6.
Web网上大量的异构、非结构化的数据使人们难以有效地发现自己所需信息. 通过利用元数据和本体语义特点,借助Web服务技术,提出构建元数据登记库MDR和本体管理系统OMS,在分布式闭包生成基础上进行推理,实现基于本体表示语言RDF特性的Web数据搜索引擎SBWSE,达到分布异构环境下高效发现信息的目的,解决了基于关键词的搜索引擎所表现的查全率和查准率不佳问题.  相似文献   

7.
基于领域本体的信息搜索模型   总被引:3,自引:0,他引:3  
针对目前的搜索模型局限于语法层次上关键词匹配的特点,以领域本体作为知识组织方式,提出了一种语义环境下基于本体的信息搜索模型.在此模型的基础上,分别提出了文档语义标注算法和搜索词语义扩展算法,两种算法分别对文档集语义分析和搜索词语义关系理解,实现双向语义信息搜索的目的.实验结果表明,提出的信息搜索方法能够克服关键词匹配搜索的不足,获得较好的搜索效果  相似文献   

8.
针对主题图导航定位的精确性和有效性问题,提出一种面向本体的主题图导航定位方法.根据主题图的特征关系去实现资源导航定位.因此,首先定义本体关系和相似性计算方法,并通过本体关系分析主题图的匹配融合方法,以及通过RDF、OWL-S、WSDL和XTM间的标签关系去实现导航定位模型;建立一种具有语义的蚁群算法进行优化求解,并与传统的蚁群算法进行比较,结果表明,具有语义的蚁群算法智能性更强.最后定义本体的召回率,用主题图精确度和语义蚁群优化效率评估该模型.结果表明,有效提高了主题图连接资源的精确性.  相似文献   

9.
概念格是形式概念分析中的核心数据结构.对此提出运用划分分治和分层约束的方法研究MapReduce框架下概念格并行生成算法以有效地构造概念格.将形式背景按对象划分成外延独立子背景后并行计算子背景上的临时概念,融合各节点临时概念形成全局概念.全局概念按照各概念外延基数进行分层,通过分层约束计算概念父子节点的搜索范围和并行搜索各层概念的父子节点,进而构建概念格.算法基于MapReduce框架实现并在公共数据集上进行测试,实验结果表明,基于概念分层方法的概念格并行构造算法能够对大数据形式背景有效地进行处理.  相似文献   

10.
为了实现对海量RDF数据的高效查询,研究RDF数据在分布式数据库HBase中的存储方法。基于MapReduce设计海量RDF数据的两阶段查询策略,将查询分为SPARQL预处理阶段与分布式查询执行阶段。SPARQL预处理阶段设计实现基于SPARQL变量关联度的查询划分算法JOVR,通过计算SPARQL查询语句中变量的关联度确定连接变量的连接顺序,根据连接变量将SPARQL子句连接操作划分到最小数量的MapReduce任务中;分布式查询执行阶段执行SPARQL预处理阶段划分的MapReduce任务,实现对海量RDF数据的并行查询。采用LUBM标准测试数据集对查询策略予以验证。研究结果表明:JOVR算法能够高效地实现对海量RDF数据的查询,并具有较强的稳定性与可扩展性。  相似文献   

11.
提出一种将关键词查询转换为SPARQL查询的方法来进行RDF数据的搜索.首先,根据RDF本身的关联特点,构建一个压缩实体摘要图;然后,借助关键词与所在实体的索引,将所查询的关键词在该摘要图上进行定位,通过图双向搜索算法找出包含关键词实体的前k子图,获得查询实体之间的关系,再联合最初的关键词及他们的属性,构建SPARQL查询;最后使用SPARQL搜索引擎执行查询.实验结果表明,所提方法较其他方法有更快的响应时间及更高的准确率.  相似文献   

12.
以实体关系图为研究背景,提出了基于区域子图的实体相关性度量方法.该方法从实体的邻居节点出发,通过定义实体的区域子图,对实体的语义上下文环境进行统一描述.为了快速有效地实现不同区域子图间的相似性计算,将区域子图转化为近似语义树结构,并利用树核函数,以计算语义树中相同子结构数量的方法对实体的相关性进行计算.最后,根据实验结果,对该方法的性能进行评估,结果显示该方法具有较好的准确率和运行效率.  相似文献   

13.
元搜索引擎的个性化   总被引:1,自引:0,他引:1  
提出一种通过产生用户动态偏好来达到个性化搜索的方法.利用RDF的语义表达能力存储和优化基于访问记录的用户偏好,并采用聚类方法划分用户群,实现对用户偏好的有效管理。给出了元搜索引擎选择算法和搜索结果排序算法,实现了一个个性化的元搜索引擎,实验表明,该搜索引擎提高了查询准确率和使用效率,并能够根据用户及其所在群的历史偏好信息重新组织搜索结果.  相似文献   

14.
在分析了Web本体的结构特征和语言学特征基础上,引入虚拟文档的概念,定义整个本体的虚拟文档为与主题相关的vocabularies的虚拟文档的组合.以虚拟文档中的词条作为Web本体分类的特征项.基于RDF图不容忽视的图状特性,在构造自RDF图本体的词汇依赖图(vocabulary dependency graph)之上采用相关基于图的排序算法,得到与构造本体虚拟文档相关的vocabularies对于该本体的重要性权值,进而计算特征项的权值.  相似文献   

15.
为解决传统推理引擎在进行大规模OWL本体数据的SWRL规则推理时存在的计算性能和可扩展性不足等问题,提出了云计算环境下的SWRL规则分布式推理框架CloudSWRL.根据SWRL规则语义,并以Hadoop开源云计算框架为基础,设计了OWL本体在HBase分布式数据库中的存储策略,定义了SWRL规则解析模型和相关推理中间数据模型,提出了在DL-safe限制下基于MapReduce的SWRL规则分布式推理算法.实验结果表明,在对大规模OWL本体进行SWRL规则推理时,CloudSWRL框架在计算性能和可扩展性方面均优于传统推理引擎.  相似文献   

16.
为了提高专业领域内信息检索的查准率,使检索结果在语义层面能够重新进行排序以去除非相关条目,利用语义Web中的本体技术和本体标准描述语言OWL建立了证券领域本体,并且基于证券领域本体提出了面向专业领域的信息资源检索系统IRS—SA,该系统有助于机构或者个人投资者获得及时有效的证券信息.系统接受输入检索关键词从而利用查询转化器自动构造或扩展用户查询,将自然语言查询转化为系统内部的格式后,使检索获得的结果按照本体中定义的概念及关系进行语义再排序,并将最后所得结果返回给用户,提高了文档语义相关性程度.  相似文献   

17.
领域本体中的概念相似度计算   总被引:21,自引:1,他引:21  
借鉴计算语言学中的语义距离思想,提出了RDF Schema构词所描述的本体概念相似度计算方法,并利用该方法对农业知识本体(AO)所描述的部分概念进行了相似度计算和分析.结果表明,该方法可以定量地分析概念、特性之间的相似度,并可以指导基于领域知识本体的语义查询中的概念集扩充和查询结果排序.  相似文献   

18.
图的最短路径查询作为图论的经典问题,广泛应用于现实世界的许多应用中.然而随着图的规模日益增大,传统单机环境下的查询算法已无法满足大规模图的处理需求.为解决上述问题,提出基于Hadoop的大规模图最短路径查询方法(D-CH方法):首先利用经典的图分割算法(CNM算法)将存储于Hadoop分布式文件系统(HDFS)中的大规模图进行分割,给出了适于后续算法的标记分割结果;然后将查询区分为分割后子图内查询和子图间查询,基于MapReduce编程模型分别给出相应的并行化查询处理算法.实验结果表明,D-CH方法对大规模图的最短路径查询具有良好的执行效率.  相似文献   

19.
为了提高RDF/RDFS本体中特定领域知识的利用效率,提出了一种从源本体中抽取出特定领域本体的算法.将RDF/RDFS本体抽象为图模型;根据RDFS推理规则生成RDFS本体图模型的闭包;应用图理论构建抽取算法,生成以特定领域术语词典中概念为节点的子图,得到所需的领域本体.抽取结果表明,该方法对于RDF层次的领域本体抽取有良好的适用性,可快速有效地构建特定领域本体.  相似文献   

20.
马秀平 《科技信息》2010,(22):I0189-I0190
随着Web信息呈指数级增加,目前存储模式已难以适应大规模RDF数据高效存储的需求。本文通过对语义万维网结构以及RDF语义文件存储和查询技术的研究,分析了海量语义数据管理的研究领域和现状,提出了基于RDF的海量数据管理框架。该框架旨在实现对海量数据的管理,以解决RDF数据管理中存在存储设计难度大,查询处理复杂且效率低,查询结果排序困难的问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号