基于自然语言处理的材料领域知识图谱构建方法 |
| |
作者姓名: | 魏晓 王晓鑫 陈永琪 张惠然 |
| |
作者单位: | 1.上海大学 计算机工程与科学学院, 上海 200444;2.上海大学 材料基因组工程研究院 材料信息与数据科学中心,上海 200444;3.之江实验室, 浙江 杭州 311100 |
| |
基金项目: | 国家重点研发计划资助项目(2018YFB0704400);云南省重大科技专项资助项目(202002AB080001-2);云南省重大科技专项资助项目(202102AB080019-3);之江实验室科研攻关资助项目(2021PE0AC02);上海张江国家自主创新示范区专项发展资金重大资助项目(ZJ2021-ZD-006) |
| |
摘 要: | 如何将材料领域知识与机器学习技术相结合是材料智能研究迫切需要解决的问题. 知识图谱(knowledge graphs, KGs)作为一种高效的知识组织模型, 可以有效地对材料领域知识进行表示、组织和推理, 从而提升材料机器学习算法的智能水平. 研究了基于自然语言处理技术的材料领域知识自动获取方法, 提出了基于双向门控循环单元-图神经网络-条件随机场(bidirectional-gated recurrent unit-graph neural network-conditional random field, Bi-GRU-GNN-CRF) 的材料实体关系联合抽取方法, 以及基于改进 TextRank 算法的材料工艺知识抽取方法, 实现了从专利、论文等材料文献中自动获取材料实体、关系、工艺流程等材料领域知识. 实验结果表明, 所提出的材料知识获取方法具有较好的精度和召回率, 能够有效提升材料知识图谱的知识覆盖度. 基于该方法构建的材料领域知识图谱的知识覆盖率达到了80%, 能够为材料智能研发提供更加全面的知识支撑. 同时, 构建了非调制特殊钢、铝基复合材料、热障陶瓷涂层材料 3 个材料领域知识图谱, 并进行了应用探索, 进一步验证了知识图谱为材料研发提供知识支撑的可能性.
|
关 键 词: | 材料智能 自然语言处理 知识图谱 |
收稿时间: | 2022-03-28 |
|
| 点击此处可从《上海大学学报(自然科学版)》浏览原始摘要信息 |
|
点击此处可从《上海大学学报(自然科学版)》下载全文 |
|