首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 765 毫秒
1.
基于关键词的RDF数据查询方法   总被引:1,自引:0,他引:1  
在建立关键词倒排索引和路径索引的基础上,提出一个利用量化均衡规则和等距规则的启发式查询算法,并按照查询结果的大小排序返回最相关的前k个结果.通过建模RDF数据为RDF句子图,将文本信息封装到句子节点,同时将查询结果建模为包括所有查询关键词并且叶节点是关键词节点的无根树,将关键词查询问题转化为斯坦纳树问题.假设RDF句子图包括n个节点,最坏情况下索引占用的空间是3n2.假设关键词节点数为k,查询算法的时间复杂度为O(kn).该方法不需要依赖RDF数据的模式信息,支持对数据中的属性和关系名进行关键词查询.实验证明该方法能够快速而有效地实现RDF数据的关键词查询.  相似文献   

2.
针对现存资源描述框架(RDF)查询方案不能满足日益剧增的海量RDF数据的关键词搜索要求,提出一种面向大规模RDF数据的分布式搜索算法(KDSOS).该算法首先结合RDF本体构建查询关键词对应的本体子图集并利用评分函数评分;其次在大规模的RDF数据图上优先搜索评分高的本体子图对应的结果子图,直到找到Top-k结果.实验结果表明,KDSOS算法在搜索效率和准确率上都具有明显的优势.  相似文献   

3.
图的最短路径查询作为图论的经典问题,广泛应用于现实世界的许多应用中.然而随着图的规模日益增大,传统单机环境下的查询算法已无法满足大规模图的处理需求.为解决上述问题,提出基于Hadoop的大规模图最短路径查询方法(D-CH方法):首先利用经典的图分割算法(CNM算法)将存储于Hadoop分布式文件系统(HDFS)中的大规模图进行分割,给出了适于后续算法的标记分割结果;然后将查询区分为分割后子图内查询和子图间查询,基于MapReduce编程模型分别给出相应的并行化查询处理算法.实验结果表明,D-CH方法对大规模图的最短路径查询具有良好的执行效率.  相似文献   

4.
提出一种将关键词查询转换为SPARQL查询的方法来进行RDF数据的搜索.首先,根据RDF本身的关联特点,构建一个压缩实体摘要图;然后,借助关键词与所在实体的索引,将所查询的关键词在该摘要图上进行定位,通过图双向搜索算法找出包含关键词实体的前k子图,获得查询实体之间的关系,再联合最初的关键词及他们的属性,构建SPARQL查询;最后使用SPARQL搜索引擎执行查询.实验结果表明,所提方法较其他方法有更快的响应时间及更高的准确率.  相似文献   

5.
现有的RDF关键词搜索方法主要是在大规模的RDF数据图上直接进行搜索,未能充分利用RDF本体中的语义信息,迭代次数过多造成搜索效率和效果不理想.针对这些问题,借助Redis内存数据库集群,提出分布式RDF关键词近似搜索算法(DKASR),即在分布式平台上实现大规模数据的并行搜索.算法结合RDF本体的语义信息构建本体子图,利用语义评分函数对本体子图进行排序,借助MapReduce计算模型实现并行搜索并返回Top-k结果;如果返回的结果没有达到Top-k,则对本体子图进行扩展生成近似本体子图,使用语义相似度函数对近似本体子图进行排序,再利用MapReduce计算模型实现并行搜索,直到返回Top-k结果.实验结果表明,DKASR算法能够高效正确地实现RDF关键词近似搜索并有效返回Top-k结果.  相似文献   

6.
马秀平 《科技信息》2010,(22):I0189-I0190
随着Web信息呈指数级增加,目前存储模式已难以适应大规模RDF数据高效存储的需求。本文通过对语义万维网结构以及RDF语义文件存储和查询技术的研究,分析了海量语义数据管理的研究领域和现状,提出了基于RDF的海量数据管理框架。该框架旨在实现对海量数据的管理,以解决RDF数据管理中存在存储设计难度大,查询处理复杂且效率低,查询结果排序困难的问题。  相似文献   

7.
最短路径问题一直是计算机等学科的热点研究问题,常应用于社交网、交通网等诸多领域.图规模爆炸式的增长导致传统单机环境下的存储、查询已无法满足大规模图的处理需求.提出一种基于Spark-Graph X平台的大规模图最短路径查询方法(LSGSP-SG):首先利用经典算法对大规模图进行分割并标记,将割点的信息记录在文本文件中,然后利用大数据平台Spark的Graph X框架进行迭代式分布计算并进行各个计算机节点的消息通信及同步,最后返回最短路径查询结果.  相似文献   

8.
为了实现对海量RDF数据的高效查询,研究RDF数据在分布式数据库HBase中的存储方法。基于MapReduce设计海量RDF数据的两阶段查询策略,将查询分为SPARQL预处理阶段与分布式查询执行阶段。SPARQL预处理阶段设计实现基于SPARQL变量关联度的查询划分算法JOVR,通过计算SPARQL查询语句中变量的关联度确定连接变量的连接顺序,根据连接变量将SPARQL子句连接操作划分到最小数量的MapReduce任务中;分布式查询执行阶段执行SPARQL预处理阶段划分的MapReduce任务,实现对海量RDF数据的并行查询。采用LUBM标准测试数据集对查询策略予以验证。研究结果表明:JOVR算法能够高效地实现对海量RDF数据的查询,并具有较强的稳定性与可扩展性。  相似文献   

9.
在语义网环境下,对AllegroGraph RDF数据库的空间数据语义表达方式进行了介绍,分析、阐述了其索引机制和查询技术,并通过实验,验证了其处理大规模空间数据语义查询的良好性能.  相似文献   

10.
为了快速准确地理解语义网实体,提出了基于概念空间的摘要方法.针对RDF数据的无序性问题,首先将一个实体的不同侧面的RDF数据划分到不同的概念空间中去.其次在同一个概念空间中的数据依照谓语聚类的方法进行组织.对于实体重用带来的RDF数据的可信度问题,根据数据的来源,在数据的权威性维度上对实体数据进行划分.针对实体数据的大规模特性,提出实体数据摘要的方法,综合基于结构的重要性、用户偏好以及来源文档的重要性对数据的重要性进行计算.实验结果表明:基于概念空间的摘要方法能够有效地帮助人们快速理解语义网实体;该方法相对于其他RDF浏览器有4%~17%的效率提升;在用户比较熟悉RDF的情况下,使用该方法能够提高20%左右的效率.  相似文献   

11.
设计动态图上最短路径距离查询的并行计算框架。通过构建增量图的方法, 实现一个批次内的多个查询在不同数据图版本的多线程并发执行。对于每个查询, 使用双向宽度优先搜索算法来减少搜索空间, 并提出搜索过程中扩展方向的决策函数。利用BSR对数据图邻接表进行编码, 结合 SIMD指令和图顶点重标号算法, 进一步提升数据级并行度。在真实图数据集下的大量实验验证了所提方法的高效性。  相似文献   

12.
在确定查询阈值上限时,当前数据库查询方法只能使用查询树的一条路径,并行性能较差;在对超大规模数据进行查询时,具有查询时间长、响应不及时的弊端。为此,提出一种新的阈值上限一定时超大规模数据库的查询方法,通过RSA算法对超大规模数据库进行加密和解密处理,依据多叉树的定义构造多叉索引树,在此基础上计算各代表数据点与查询点之间的距离;在阈值上限一定时,利用多个从节点机并行处理后,使用主节点机汇集结果,运用后续子树递归处理,直至获取查询结果。实验结果表明,所提方法不仅具有很高的查询效率,而且CPU使用率很高。  相似文献   

13.
目的在空间四边形网格曲面上,寻求连结所有网格结点的最短路径。方法运用图论的相关知识,提出应用最短哈密顿路径法,通过建树的方法来连结网格节点以形成路径。结果在划分好的空间曲面网格上实现了最短路径的求解,进而证明了提出方法的可行性和构建算法的正确性。结论该方法可以更有效地解决空间曲面上最短路径的求解问题。  相似文献   

14.
针对双向两车道无人车行驶场景,基于离散优化的方法,提出一种新的轨迹解耦规划算法。该算法将带有时间戳的三维轨迹规划问题,解耦成分别对路径和速度规划,速度规划时引入ST图,用以描述无人车与障碍物之间的运动关系。通过分层采样的方法构建路径Lattice图搜索初始路径,以及基于多目标A*搜索算法在ST图中规划出初始速度剖面,减少算法的计算量。同时,结合优化的方法对轨迹进行优化,使轨迹收敛到全局最优解。最后,通过仿真实验,验证了该算法的有效性和可靠性。  相似文献   

15.
基于经典的Dijkstra算法,研究采用预处理的点到点最短路径算法。通过引入双向Dijkstra和基于reach的预处理方法形成新的RE算法,并利用C++编程设计算法程序,将新算法应用于交通工程领域。利用EFSS数据结构搭建考虑交叉口和路段延误的交通网络,检验新算法的适用性和效率,结果发现RE算法与Dijkstra算法相比,搜索速度有大幅提升且能保证路径查询的正确性,RE算法在大规模网络上优势更为显著,查询时间约为Dijkstra算法的10%。  相似文献   

16.
正则表达式由于其强描述能力和灵活性,在信息检索,程序设计,数据挖掘,深度分组检测,生物信息处理等领域得到了广泛而深入的应用,然而正则表达式,尤其是正则表达式集合,由于搜索速度慢往往成为系统的性能瓶颈。现有的正则表达式搜索算法性能较好的是多模式过滤类型的算法,此类算法严重依赖于两个因素,从NFA的初始状态到终止状态的最短路径Lmin和正则表达式所表达的语言的前缀集合Pref(RE)的大小,Lmin越长,搜索速度越快,Pref(RE)越大,搜索速度越慢。针对上述问题提出了一种基于Bloom filter的正则表达式集合搜索算法,此方法利用Bloom filter的集合查询时间集合大小无关的特点,使得正则表达式搜索速度不受Pref(RE)大小的影响,如果采用多个Bloom filter并行,还可以间接增大Lmin的长度。分析与测试结果表明,本算法较大的加快了正则表达式的搜索速度,对于正则表达式集合,算法性能改善尤其明显,可以实现大规模正则表达式集合的快速搜索。  相似文献   

17.
针对常规模式匹配方法在大规模模式匹配中效率不高无法满足在线应用的问题,提出了一种高效率用户查询模式匹配方法.该方法在常规模式匹配方法中引入查询模式语义环境,使用搜索技术和聚类技术裁减模式匹配的搜索空间,在保证正确率的前提下,能显著提高匹配效率,满足用户在线响应时间要求.实验证明了这种方法的有效性.  相似文献   

18.
双语影视知识图谱的构建研究   总被引:1,自引:0,他引:1  
提出一种双语影视知识图谱(BMKG)的构建流程。通过半自动化的方法构建了双语影视本体(BMO), 将各个影视数据源对齐到BMO, 以保持异构数据源的语义描述一致性。在知识链接方面, 在充分挖掘和利用领域特征的基础上, 采用基于Word2Vec 和TFIDF 两种向量模型的实体相似度计算方法, 使相似度特征增加一倍, 大大提升了模型的链接效果。在实体匹配方面, 提出基于相似度传播算法的实体匹配算法, 并利用影视数据源之间的内在联系, 克服了跨语言实体之间计算相似度的语言障碍。实验结果表明, 当阈值取到0.75 以上时, 实体匹配的准确率都能达到90% 左右。此外, 还建立了影视知识图谱共享平台, 并提供开放性的数据访问和查询接口。  相似文献   

19.
以图的赋权邻接矩阵为切入点,建立了以换乘次数最小为首要目标,途径站点数最小为第二目标的公交出行最优路径模型;同时,回避了最短路径算法时间复杂度大的缺点,以最短路径矩阵为数据系统,提出了解决公交查询的通用高效算法;最后,通过公交查询系统实例证实了其可行性和有效性.  相似文献   

20.
研究了XML路径表达式的相关查询算法,提出了基于标注后缀树的XML路径表达式公共子查询的优化算法,通过冗余消除技术来提高路径表达式的查询效率·在REOA测试集上,通过对设计的查询进行测试,分析了基于标注后缀树的XML路径表达式公共子查询的优化算法的性能·实验结果表明,基于标注后缀树的XML路径表达式冗余消除技术可以极大地提高路径表达式的查询效率·  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号