面向自主工业软件的知识提取和知识库构建方法 |
| |
引用本文: | 王立平,张超,蔡恩磊,史慧杰,王冬.面向自主工业软件的知识提取和知识库构建方法[J].清华大学学报(自然科学版),2022(5):978-986. |
| |
作者姓名: | 王立平 张超 蔡恩磊 史慧杰 王冬 |
| |
作者单位: | 1. 清华大学机械工程系;2. 电子科技大学机械与电气工程学院 |
| |
基金项目: | 国家重点研发计划项目(2020YFB1712303); |
| |
摘 要: | 自主工业软件是支撑国内中小企业创新发展的核心力量之一。自主工业软件相关文本中蕴含着大量与制造业相关的知识,但是目前缺少相应的知识提取和知识库构建方法。该文提出一种基于神经网络和自然语言处理的知识提取模型,该模型包括文本表示、实体识别、关系抽取3个部分。基于知识图谱对提取的实体和关系进行建模,通过本体建模定义自主工业软件相关概念,利用图数据建模将本体模型中的概念映射到图数据中,提升了数据检索和建模能力,并将数据持久化存储到知识库中。应用结果表明:该方法可用于构建自主工业软件知识库,对整合制造业相关知识起到重要作用。
|
关 键 词: | 自主工业软件 神经网络 实体识别 关系抽取 知识图谱 |
|
|