类型感知的汉越跨语言事件检测方法 |
| |
作者姓名: | 张磊 高盛祥 余正涛 刘畅 陈瑞清 |
| |
作者单位: | 昆明理工大学 信息工程与自动化学院, 昆明 650500;昆明理工大学 云南省人工智能重点实验室, 昆明 650500 |
| |
基金项目: | 国家自然科学基金(61972186,61761026,61762056);国家重点研发计划(2018YFC0830105,2018YFC0830101,2018YFC0830100);云南高科技人才项目(201606);云南省重大科技专项计划(202002AD080001-5);云南省基础研究计划(202001AS070014,2018FB104) |
| |
摘 要: | 针对汉越跨语言事件检测缺少平行语料,越南语标注困难,需要统一跨语言语义空间,且触发词存在较大的歧义和局限性等问题,提出基于事件类型感知的汉越跨语言事件检测方法。构造类型感知的注意力机制突显事件特征,融入汉越的词位置、词性和命名实体信息,并通过梯度反转(gradient reversal layer, GRL),实现有标注汉语和无标注越南语之间的对抗训练,将从大量汉语新闻文本中学到的语言无关的事件类型特征融入到联合特征提取器中,进行汉越跨语言的无触发词事件检测,缓解越南语的数据稀缺和触发词的局限性。实验中提出的方法较最好的基线模型在准确率上提升了4.32%。
|
关 键 词: | 汉越跨语言事件检测 无触发词 事件类型感知 梯度反转 语言对抗 |
收稿时间: | 2021-04-22 |
修稿时间: | 2022-08-21 |
|
| 点击此处可从《重庆邮电大学学报(自然科学版)》浏览原始摘要信息 |
|
点击此处可从《重庆邮电大学学报(自然科学版)》下载免费的PDF全文 |
|