首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 140 毫秒
1.
随着大数据时代的到来,互联网所承载的信息呈现出异构性强、价值密度低、来源分布广、实时性高等新的特点.因此在信息检索时,与获取相关网页相比,人们更希望获得页面中包含的知识.RDF作为一种新的知识表示和发布形式,以其精确且易于理解的语义结构得到了广泛的认可和应用.但传统基于语法匹配策略的SPARQL查询方法无法发现RDF数据中不同谓词间的隐含语义,不能从语义层面上获取更加完备的查询结果.针对这一问题,设计了一种新的查询方法来扩充传统SPARQL查询模式.首先分析RDF三元组中谓词的语义属性.在此基础上,根据不同谓词间语义属性的标注,对输入SPARQL语句中具有语义属性的谓词进行扩展,从而给出了一种新的一般化的查询策略.最后通过实验验证了这种语义扩展查询方法的可行性和正确性.  相似文献   

2.
利用知识工程相关方法和技术,构建了全球海底光缆知识图谱.知识图谱中,本体包含了8个实体类型、7个实体属性,实例层包含了1 949个实体、共计8 535个三元组.将所构建知识图谱与DBpedia、Geonames建立了2 378个链接,在此基础上,通过SPARQL查询,对海底光缆数据进行了分析.   相似文献   

3.
本体问答系统需要实现从自然语言问句到本体查询语句的转换,目前的解决方法主要有自然语言接口和问句相似度方法。针对现有问句相似度方法在本体问答系统中应用的不足,设计了改进的相似度计算方法。通过建立常问问题的查询模式集合,综合考虑问句的统计、语义、结构特征计算目标问句的相似度,分别以自动选择和用户交互两种方式选择目标问句的查询模式,并将其转换成实际SPARQL查询语句,最终检索本体及抽取出答案。两种方式的准确率分别为83.8%和92.1%。  相似文献   

4.
研究了可扩展的标志性语言(XM L)存取控制策略。通过基于不确定的自动机(NFA)的XM L查询重写技术,实现了支持精细粒度的XM L文档存取控制策略。通过构造XM L文档存取控制策略的NFA以及基于NFA的查询语句重写技术,有效地实现了独立于视图的、高效的XM L精细粒度的存取控制。  相似文献   

5.
Hive作为建立在Hadoop上的数据仓库,已成为很多企业处理大数据的首选。然而,传统企业中大量的遗留应用依赖于传统关系型数据库(RDBMS),迁移时需要翻译大量查询语句。提出了一种基于查询树的SQL到HiveQL的自动翻译方法。该方法利用SQL解析器将SQL语句解析为查询树,提供8种不同的重写策略重构查询树,进而将其转化为正确的HiveQL语句,实现了一个翻译工具——DFMapper。在基准测试集TPC-DS上进行的查询实验证明,DFMapper可以正确翻译绝大多数的查询语句,并且具有很强的扩展性。  相似文献   

6.
随着知识图谱的广泛应用,为了提高从中提取知识数据和产品数据的准确率和效率,以知识图谱为数据源,根据实际业务需求制定业务数据抽取与组织规则(抽取规则即为题目中的映射规则,设计规则的表达描述方法和规范约束,由业务需求者填写实际可实施抽取的规则),支持根据该规则从知识图谱中抽取符合规则的子图.由于该子图符合设计业务需求方的规则,因此该子图包含了符合业务需求的数据和组织结构.通过数据产品生成规则(从结构相对固定,具备实际业务含义的子图数据生成报告文档、统计表格等业务用户最终需要的数据产品),从抽取的子图生成需要的数据产品(报告文档,统计表格等).通过SPARQL查询语言、自然语言生成等技术实现了以知识图谱为数据源,快速自动地生成文本、图表、报告文档等数据产品,大幅度提升了效率.  相似文献   

7.
基于非一致性关系数据库的非聚集查询技术,发展普通的一致性查询应答的语义,提出非一致性数据库的范围语义,给出基于一致性查询范围的实际聚集查询重写方法,返回基于这种语义的聚集查询范围值.通过对初始分组属性和键属性聚集得到候选结果集,再过滤与初始分组属性值相冲突和不满足初始查询的元组.对于最小值,过滤掉可能不一致的元组,去掉可能值,得到一致性值;对于最大值,得到可能的最大候选值.实验基于TPC-H基准采用不同的参数进行研究.研究结果表明,聚集属性和投影属性数量、数据库以及初始查询的结果集对重写查询的负载有显著的影响,但非一致性数据比例和共享共同键值元组数的影响很小.尽管重写查询比初始查询的执行时间长,但是可以接受.  相似文献   

8.
提出了一种面向异质可扩展标记语言(XML)文档的近似查询算法(TPQR).利用模式重写策略,通过对XML模式之间语义相似度及节点映射关系的求解,将原始查询树改写为多种XML模式下的重写查询树,从而解决了XML数据的多样性带来的查询语义缺失问题.将经变异操作序列得到的变异查询树精确地嵌入在XML数据树之中,即可将XML近似查询问题转变为多棵变异查询树的精确查询问题.在汽车外形智能化设计的实验中比较了TPQR算法和静态有序选择算法,结果表明,在查准率、查全率上,前者比后者分别提高了5%~10%和10%~30%.  相似文献   

9.
查询语句语义优化的基本思想是,数据库所反映的现实世界的特定知识可以用来将查询语句变换成语义上等价但句法上不同的形式,以期寻找常规优化方法不可能找到的最优执行方案。本文提出了建立在费用模型及约束强度概念上的语义优化策略,并对查询语句中连接运算的删除作了进一步讨论。  相似文献   

10.
查询语句语义优化的基本思想是,数据库所反映的现实世界的特定知识可以用来将查询语句变换成语义上等价但句法上不同的形式,以期寻找常规优化方法不可能找到的最优执行方案。本文提出了建立在费用模型及约束强度概念上的语义优化策略,并对查询语句中连接运算的删除作了进一步讨论。  相似文献   

11.
基于本体的临床试验数据语义查询   总被引:2,自引:0,他引:2  
临床试验数据的描述中多自然语言、多专业医学术语的特点使得用户难以通过自定义的关键字快速定位所需的资源。该文采用基于本体的方法实现对于临床试验数据的语义查询。该系统的实现步骤如下:使用OWL(Web on-tology language)构建基于ICD-10和ICMJE标准的本体,包含疾病和临床试验类;从Clinical Trials注册库获取临床试验数据,标注为本体中的临床试验类实例;建立临床试验实例与疾病实例的联系;借助SPARQL实现对于临床试验数据结构化的查询。使用上述方法,用户能够通过疾病实例和相关属性的关键字,表达结构化的语义查询条件,精确定位所需的临床试验。与传统的仅基于关键字匹配的查询方法相比,该方法所表达的查询条件能够更加准确地描述用户的查询需求。  相似文献   

12.
13.
14.
为了提高语义Web查询的查全率和查准率,文中提出了一种基于形式化领域本体的查询处理方法.首先采用描述逻辑表达领域本体的语法和语义,实现领域本体的形式化转换;然后基于转换后的形式化领域本体,采用含半幺群概括演算作为基于形式化领域本体查询转换的目标语言,定义了用户查询到含半幺群同态查询的转换规则和语义优化处理、查询重写规则,最后通过实验验证了该方法的查询性能.  相似文献   

15.
设计从自然语言问句到结构化查询的转换框架。该方法从自然语言问句的句法结构入手, 提出一套启发式识别实体与关系的方法, 并利用语料库建立从实体到知识库的映射, 对谓词进行消歧, 进而转化为计算机可理解的结构化查询语言。从百度知道抽取人物、地点、组织3类共 42 个问题作为标准测试集。实验结果表明, 所提出的框架能够有效地将中文自然语言问句转换为结构化查询, 为下一代智能问答系统打下良好的基础。  相似文献   

16.
目前互联网技术的研究热点是智能化的、个性化的服务,而传统的Web搜索排序算法和已有的个性化排序已经不能满足政府、企业等用户的信息查询需要.本文将研究核心定位到充分理解用户查询偏好上,提出了基于用户偏好的PageRank算法.文中利用用户互反馈技术修正查询关键词,利用语义相关性技术分析用户查询意图,理解用户偏好.改进的算法完善了搜索查询的可靠性依据,能够较好地挖掘用户的偏好主题,贴近用户的查询目的,提高搜索查询效率和用户满意度.  相似文献   

17.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号