基于角色分离的中文事件抽取研究 |
| |
引用本文: | 张旭,朱艳辉,曾志高,欧阳康,孔令巍.基于角色分离的中文事件抽取研究[J].山西大学学报(自然科学版),2022(4):936-946. |
| |
作者姓名: | 张旭 朱艳辉 曾志高 欧阳康 孔令巍 |
| |
作者单位: | 1. 湖南工业大学计算机学院;2. 湖南工业大学智能信息感知及处理技术湖南省重点实验室 |
| |
基金项目: | 国家自然科学基金(61871432);;湖南省自然科学基金(2020JJ6089); |
| |
摘 要: | 端到端的事件抽取涉及两个子任务:事件检测和事件元素抽取,当前大多数研究工作并未解决元素抽取中角色重叠的问题,并且忽略了数据集提供的静态信息。文章提出一种基于两个独立编码器的事件抽取模型,通过词典增强的序列标注方法检测触发词和事件类型,再将事件类型、实体类型和边界信息作为元素抽取阶段的补充特征,使用多个角色二分类网络实现“分离式”的元素识别和角色分类,最后将基于静态数据统计得到的角色辨识度对所有分类器的损失函数加权求和,作为最终的损失函数,进而更好地拟合数据集特点。在两个公开的中文数据集ACE2005和DuEE上,实验F1值分别达到57.1%和76.1%,并且该方法有效提高了对角色重叠事件的识别准确率。
|
关 键 词: | 事件抽取 元素抽取 角色辨识度 角色重叠 |
|
|