基于预训练语言模型与多任务学习的事件检测方法期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于预训练语言模型与多任务学习的事件检测方法

作者姓名：	韩如雪杨苗宫小泽胡镑王永利熊伟赵显伟徐琳

作者单位：	1. 中国电子科技集团公司第二十七研究所;2. 南京理工大学,计算机科学与工程学院;3. 63863部队;4. 信息系统工程重点实验室

摘要：	为了解决现有事件检测方法存在语料稀疏和触发词一词多义导致的触发词抽取不准确以及类型判断错误等问题，该文将双向Transformer编码表示(BERT)的预训练模型与条件随机场(CRF)结合，并联合多任务学习，提出了一种基于BERT-CRF模型与多任务学习的事件检测方法(MBCED)。该方法同时进行事件检测任务和词义消歧任务，将词义消歧任务中学习到的知识转移到事件检测任务中，既补充了语料，也缓解了一词多义所导致的触发词分类不准确问题。在ACE2005数据集上的传统事件检测模型对比实验结果表明，与动态多池卷积神经网络(DMCNN)、基于循环神经网络的联合模型(JRNN)、基于双向长短期记忆和条件随机场(BiLSTM-CRF)的联合模型、BERT-CRF方法相比，MBCED方法触发词识别的F值提升了1.2%。多任务学习模型对比实验结果表明，与基于多任务深度学习的实体与事件联合抽取(MDL-J3E)模型、基于共享BERT的多任务学习(MSBERT)模型、基于CRF多任务学习的事件抽取模型(MTL-CRF)相比，MBCED在触发词识别和触发词分类2个子任务上的准确率都较好。
关键词：	词义消歧预训练模型多任务学习事件检测语料稀疏触发词识别条件随机场触发词分类

设为首页 | 免责声明 | 关于勤云 | 加入收藏