首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 20 毫秒
1.
自主工业软件是支撑国内中小企业创新发展的核心力量之一。自主工业软件相关文本中蕴含着大量与制造业相关的知识,但是目前缺少相应的知识提取和知识库构建方法。该文提出一种基于神经网络和自然语言处理的知识提取模型,该模型包括文本表示、实体识别、关系抽取3个部分。基于知识图谱对提取的实体和关系进行建模,通过本体建模定义自主工业软件相关概念,利用图数据建模将本体模型中的概念映射到图数据中,提升了数据检索和建模能力,并将数据持久化存储到知识库中。应用结果表明:该方法可用于构建自主工业软件知识库,对整合制造业相关知识起到重要作用。  相似文献   

2.
铁路信号设备是保障行车安全、提高运输效率的核心装备,加强信号设备智能运维是降低铁路运行风险的必要基础保障。目前,针对我国基于建筑信息模型(BIM)的智能运维平台存在不能精准映射各设备的行为规律和相互之间互馈作用的机理,须同时依靠经验知识进行推断等问题。首先构建了铁路设备运维文本知识图谱;其次构建卷积神经网络(CNN)-团组图卷积神经网络(cgGCN)模型对BIM图像模态数据进行处理,完成对20种铁路信号设备零件图信息的标注,实验结果表明模型准确率达到95.38%,精确率和召回率的调和平均值F1达到95.58%;最后将BIM图像信息以视觉模态嵌入运维文本知识图谱,利用Neo4j图数据库实现多模态知识图谱可视化展示,从而精准映射各信号设备相互之间互馈作用的机理,为后续现场铁路运维人员实施安全管理和运维决策提供在线服务和指导。  相似文献   

3.
毛平 《科技资讯》2009,(36):183-183
本文在构建军用飞机领域本体的基础上,尝试基于领域本体的文本信息语义检索研究。重点探讨了基于领域本体的文本信息标注以及查询扩展方法以及知识片段的提取思想,实现了基于语义的文本信息资源的检索功能。  相似文献   

4.
目前网络上关于辽代历史信息化智能查询服务系统资源相对缺乏,关于辽代历史介绍文本篇幅冗长,不方便大众进行阅读观看.为了便于大众能更加快速准确了解相关的辽代历史知识,基于百度百科、搜狗百科以及基于爬虫技术等形式获取了与辽代历史相关的文本数据,采用BiLSTM-CRF模型进行实体抽取,通过关系抽取模型抽取实体间的关系,通过知识融合等技术对得到的数据进行实体对齐以及本体构建.最终构建辽代历史文化领域知识图谱,并在此知识图谱的基础上开发了可视化查询系统.  相似文献   

5.
文本数据中的实体和关系抽取是领域知识图谱构建和更新的来源.针对金融科技领域中文本数据存在重叠关系、训练数据缺乏标注样本等问题,提出一种融合主动学习思想的实体关系联合抽取方法.首先,基于主动学习,以增量的方式筛选出富有信息量的样本作为训练数据;其次,采用面向主实体的标注策略将实体关系联合抽取问题转化为序列标注问题;最后,基于改进的BERT-BiGRU-CRF模型实现领域实体与关系的联合抽取,为知识图谱构建提供支撑技术,有助于金融从业者根据领域知识进行分析、投资、交易等操作,从而降低投资风险.针对金融领域文本数据进行实验测试,实验结果表明,本文所提出的方法有效,验证了该方法后续可用于金融知识图谱的构建.  相似文献   

6.
针对目前个人知识管理中存在的知识来源多样、存储分散、片段知识不便及时存储、基于关键词匹配而非语义检索等问题,采用本体方法建立了具有用户层、表示层、本体层和存储层4层结构的个人知识管理系统.用户请求经表示层转化为对本体的具体操作请求后发给本体层;本体层包含了本体定义、本体查询、本体更新的三大类接口访问存储层;存储层负责知识的存储.通过本体技术,能实现基于语义的个人知识管理.  相似文献   

7.
为了分析工程项目管理领域BIM研究的热点内容,基于CNKI数据库2008-2017年的文献,运用Ucinet软件,构建了工程项目管理领域BIM研究热点的知识图谱,并采用共词分析以及社会网络分析等方法对该知识图谱进行了网络密度、中心性以及凝聚子群分析。研究结果表明,各个关键词之间联系较为紧密,构成1个以BIM和工程项目管理为中心的知识图谱,较少地形成单独的派系;工程项目管理领域BIM的研究热点主要集中在BIM的应用范围、管理方法、互操作性以及软件应用这四个方面。  相似文献   

8.
通过探索知识图谱在产业集群的应用,提出了产业集群知识图谱整体设计框架,设计了产业集群知识图谱中实体及其关系本体模型。选取宁波市注塑机产业集群为例,通过互联网平台获取企业数据,经过数据预处理、知识抽取和知识融合,依据本体模型构建了宁波市注塑机产业集群知识图谱,将所构建的所有三元组存储于Neo4j图数据库中。根据所构建的知识图谱,分析注塑机集群整体特性,通过分析发现产业集群在地理位置临近关系上和业务往来有着密切的关系,验证本文提出方法的可行性。  相似文献   

9.
为构建东盟十国知识图谱,需要对相关文本进行命名实体识别工作。设计一种基于双向GRU-CRF的神经网络模型对中国驻东盟十国大使馆中文新闻数据进行命名实体识别。以预训练的领域词向量为输入,利用双向GRU网络从向量化的文本中提取语义特征,再通过CRF层预测并输出最优标签序列。为了进一步改善结果,在双向GRU和CRF层之间添加两层隐藏层。在数据预处理方面,提出一种数据集划分算法对文本进行更加科学合理的划分。在东盟十国数据集上将该模型与几种混合模型进行对比,结果显示所提模型在人名、地名、组织机构名识别任务中拥有更好的识别性能。  相似文献   

10.
知识获取技术制约着知识系统的研究和应用,有效地从文本中提取领域知识成为知识获取的重要途径.本文提出了基于本体和图分析的领域知识获取技术,分析了本体数据结构、本体概念的实例化以及基于图分析的语义场构造方法.建立了具有广泛适用性的文本知识获取系统框架,实现了原型系统.通过针对中医医案的中医领域知识获取实验验证,取得了较好的效果.  相似文献   

11.
为采用知识图谱技术实现对油藏构造知识的整合,解决在本体建模过程中,很少将标准融合到本体模型 中,且在转换过程中存在对叙词概念粒度划分较粗或完全不对叙词进行类型划分等问题,提出一种基于叙词表 构建知识图谱的新方法,即标注原叙词表,建立映射规则,构造转换算法和生成知识图谱。其中标注、映射规 则建立与转换算法定义了构建知识图谱标准化过程。最后,选取油藏构造领域的部分知识,采用所提方法构建 知识图谱,其结果表明了该方法的可行性。  相似文献   

12.
本体融合已经成为学科领域知识图谱的重建和知识共享的重要途径,为解决本体融合领域缺乏标准融合框架问题,提出一种基于国际标准MFI4OR的本体融合模型.该模型提供一个标准的本体信息划分标准,即本体-本体构件-本体原子构件,实现对本体信息的管理和映射.在融合计算过程中,选择编辑距离算法并引入外部资源WordNet词典进行相似度计算.最后,以省级基金项目中的学习者模型构建需求为应用背景,将FOAF(Friend-Of-A-Friend)本体和RELATIONSHIP本体进行融合试验.结果 表明,该标准化融合模型能实现通用本体融合.  相似文献   

13.
目的在BIM技术中面向数据提取与应用研究相对较少现状下,提出一套完整高效率的BIM数据提取与应用技术方案,解决建筑行业中各专业之间在施工过程中数据使用效率低的问题.方法通过对BIM模型数据需求的分析,利用Revit API外部功能扩展方式,研究Revit对象的访问、过滤、编辑与创建,形成了基于构件的数据提取方案;结合SQL Server,对BIM模型构件图元实现基于关系数据库的数据储存,并创建形成构件拓扑关系;利用OpenGL三维图形库,采用完全面向对象设计方法,进行三维模型重建的研究.结果笔者所提方案实现了BIM模型的数据提取至数据库,进行数据库的关联查询,模型重建,构件查找.结论数据提取与应用技术具有可行性,在建筑工程领域具有一定的应用价值;能够解决模型与信息相互独立、模型抽象、信息断层等问题,实现模型与信息的完美结合.  相似文献   

14.
为了能够更快速、准确、智能地获取企业信息,需建立更智能的数据组织方式。通过构建企业领域本体,利用Karma建模实现多源异构数据的快速集成并发布成统一的RDF数据,并应用知识推理技术发现约20%的新知识,更新扩充RDF数据并存入Neo4j图数据库建立知识图谱。使用可视化技术设计实现企业知识图谱查询系统,用图形方法将知识图谱信息直观展现,以Web服务的方式提供企业信息检索服务,实现了对企业、法人及其相互关系的查询功能。实验结果表明,企业知识图谱明显提高了数据获取效率,增强了数据的可用性、可理解性与可见性。  相似文献   

15.
为了融合碎片化林业文本数据,解决目前林业网络知识散乱、无序和关联性不强的问题,将深度学习与知识图谱相结合,提出一种基于改进BERT和双向RNN的模型用于林业实体识别和实体关系抽取。通过基于实体Mask的BERT词向量处理,自动提取出序列中与研究领域相关的词级和语义特征,将词向量输入命名实体识别模型和实体关系提取模型训练。在通用数据集上,实体关系抽取BERT-BiGRU-Attention模型效果更优,F1值提升1%,准确率在90%以上;实体识别BERT-BiLSTM-CRF模型各项指标比传统模型提高2%。在林业数据集上,模型准确率达到80%以上。表明基于BERT和双向RNN模型构建中文林业知识图谱是可行的。在此模型的基础上搭建中文林业知识图谱智能系统,可以优化林业信息管理方法,促进林业发展。  相似文献   

16.
17.
范例表示和范例修改是基于实例推理领域中的两个研究热点.针对此,提出一种基于领域CBR本体的范例表示和范例修改方法,该方法引入本体表示范例,添加范例特征意图项指导范例修正,提高了范例库的重用性和范例修正的成功率.首先,以经典本体概念和CBR理论为基础,提炼出领域CBR本体的定义和主要组成部分.其次,与传统范例表示方法对比,给出了领域CBR本体范例表示的优势,并对领域CBR本体中的关键类——范例特征意图类及其作用进行了重点介绍.而后,对领域CBR本体的构建过程和基于领域CBR本体的范例修改过程进行了详细阐述.最后,应用OWL语言对斗轮CBR本体进行了描述,并通过斗轮CBR本体在机械设计重用中的应用分析验证了此方法的有效性.  相似文献   

18.
为实现电力变压器运维知识的有效沉淀,以运维文本为研究对象,提出一种融合规则的电力变压器运维知识图谱深度构建框架.首先根据专家指导自顶向下构建知识图谱概念层;然后融合规则和深度神经网络模型抽取知识,构建知识图谱的数据层.针对运维文本中的实体界限模糊和上下文信息利用不充分问题,提出一种通过扩展上下文信息和BERT(bidirectional encoder representations from transformers)获取扩展Span标签的方法,用于实体和关系抽取.算例分析表明,该方法在电力变压器运维数据集中知识抽取效果良好.  相似文献   

19.
为解决数控(computer numerical control, CNC)机床设计知识图谱构建过程中关键实体的抽取问题,制定了数控机床领域知识分类标准和标注策略,构建了领域数据集,并提出了一种基于RoBERTa(robustly optimized BERT pretraining approach)的数控机床设计知识实体识别方法。首先,利用数控机床领域数据集对RoBERTa模型进行微调,再利用RoBERTa对文本编码,生成向量表示;其次,采用双向长短期记忆(bidirectional long short-term memory, BiLSTM)网络提取向量特征;最后,利用条件随机场(conditional random field, CRF)推理出最优结果,进而为实体打上标签。实验结果表明:模型在数据集上的F1值为86.139%;对多数关键实体的F1值大于85%;相比其他模型提升2%~18%。可见该方法在数控机床设计知识实体识别中具有明显优势,能够识别机床设计知识文本包含的关键实体,为数控机床设计知识图谱构建提供了数据基础。  相似文献   

20.
针对数据质量中约束规则描述的语义复杂性、 快速提取等问题, 引入本体技术描述数据质量约束规则等 要素的语义关系, 提出了元本体的思想, 对数据质量领域的核心词汇进行了提练, 并依据相关标准, 构建了与 领域无关的数据质量元本体模型。 在应用中, 特定领域可根据需求将该元本体模型实例化为用于描述本领域 的数据质量本体, 不仅解决了数据质量领域词汇共享与明确描述问题, 而且使数据质量复杂约束规则语义描述 得以解决。 同时, 以石油领域数据为例, 依据提出的质量本体元模型实例化出石油领域的质量本体模型, 定义 了各种推理规则, 并基于 Jena 推理机验证了构建的数据质量本体的合理性, 极大地提高了数据质量评估中约 束规则提取的效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号