预训练模型下航天情报实体识别方法 |
| |
作者姓名: | 魏明飞1 2 潘冀3 陈志敏1 2 梅小华4 石会鹏3 |
| |
作者单位: | 1. 中国科学院大学 计算机科学与技术学院, 北京 100049; 2. 国家空间科学中心, 北京 100190;3. 国家无线电监测中心, 北京 100037;4. 华侨大学 信息科学与工程学院, 福建 厦门 361021 |
| |
摘 要: | 为了快速处理航天情报,基于数据驱动的深度学习技术,提出融合多源异构知识标注中文航天情报数据集的方法流程,以及基于预训练(pre-training)模型的航天情报实体识别(AIER)方法;通过对航天情报进行命名实体识别,达到对航天情报进行信息抽取的目的.通过融合BERT(bidirectional encoder representation from transformers)预训练模型和条件随机场(CRF)模型构建AIER模型(BERT-CRF模型),将其与隐马尔可夫模型(HMM)、条件随机场(CRF)模型、双向长短期记忆网络加条件随机场(BiLSTM-CRF)模型进行实体识别对比实验.结果表明:基于预训练模型的AIER模型能够取得93.68%的准确率、97.56%的召回率和95.58%的F1值;相比于其他方法,基于预训练模型方法的性能得到提高.
|
关 键 词: | 航天情报处理 预训练 信息抽取 命名实体识别 信息科学 |
|
| 点击此处可从《华侨大学学报(自然科学版)》浏览原始摘要信息 |
|
点击此处可从《华侨大学学报(自然科学版)》下载全文 |
|