基于BERT的危险化学品命名实体识别模型 |
| |
作者姓名: | 陈观林 程钊 邹凌 杨武剑 李甜 |
| |
作者单位: | 浙大城市学院, 计算机与计算科学学院, 浙江杭州 310015;常州大学计算机与人工智能学院, 江苏常州 213164 |
| |
基金项目: | 浙江省重点研发计划项目“危险化学品智慧监控及事故预防平台”(2020C03091)资助。 |
| |
摘 要: | 针对危险化学品实体识别及关系识别的问题,本文基于双向长短期记忆网络连接条件随机场(Bidirectional Long Short-Term Memory with Conditional Random Field, BiLSTM-CRF)模型,通过引入双向编码器表示(Bidirectional Encoder Representation from Transformers, BERT)模型结合多头自注意力机制,提出了一种预训练命名实体模型BERT-BiLSTM-self-Attention-CRF,通过对危险化学品的文本进行字符级别编码,得到基于上下文信息的字向量,增强了模型挖掘文本全局和局部特征的能力。实验结果表明,在自行构建的数据集上,本文模型优于其他传统模型,其F1值为94.57%。
|
关 键 词: | 命名实体识别 深度学习 危险化学品 预训练模型 自注意力机制 |
|
| 点击此处可从《广西科学》浏览原始摘要信息 |
|
点击此处可从《广西科学》下载免费的PDF全文 |
|