首页 | 本学科首页   官方微博 | 高级检索  
     

基于小样本学习的中文文本关系抽取方法
作者姓名:季一木  张旺  刘强  刘尚东  洪程  邱晨阳  朱金森  惠岩  肖婉
作者单位:1. 南京邮电大学计算机学院;2. 南京邮电大学高性能计算与大数据处理研究所;4. 南京邮电大学高性能计算与智能处理工程研究中心;5. 南京邮电大学教育科学与技术学院
基金项目:国家重点研发计划(2018AAA0103300,2018AAA0103302);;江苏省重点研发计划(SBE2023020143);;江苏省自然科学基金(BK20170900);;江苏省高校自然科学研究重大项目(19KJB520046,20KJA520001);;江苏博士后基金(2019K024);
摘    要:实体关系抽取作为文本挖掘和信息抽取的核心任务,是知识图谱构建过程中的关键一环。然而人工建立大规模有标签的数据耗时耗力。使用小样本学习来进行关系抽取,仅仅需要少量样本实例就能使模型学会区分不同关系类型的能力,从而缓解大量无标签数据带来的标注压力。本文对中文关系抽取数据集FinRE进行了重构使之适用于少样本学习,并引入了语义关系网络HowNet对实体进行更为精确的语义划分,并在此基础上使用双重注意力机制提高句子编码质量,从而提高了模型在面对噪声数据时的效能,减轻了长尾关系的影响。使用本文的方法在该中文数据集进行了评估,与原始原型网络相比,基于句子级别与实体级别的注意力机制的原型网络在抽取准确率上提升了1%~2%的性能。

关 键 词:小样本学习  关系抽取  BERT  HowNet  注意力机制
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号