首页 | 本学科首页   官方微博 | 高级检索  
     检索      

面向阅读理解过敏感性和过稳定性的数据增强研究
引用本文:高俊杰,行覃杰,谭红叶.面向阅读理解过敏感性和过稳定性的数据增强研究[J].山西大学学报(自然科学版),2022(4):1023-1029.
作者姓名:高俊杰  行覃杰  谭红叶
作者单位:山西大学计算机与信息技术学院
基金项目:国家自然科学基金(62076155);
摘    要:机器阅读理解是自然语言处理领域的一个重要任务,然而许多研究工作表明目前的模型在鲁棒性方面仍存在一些缺陷。文章针对机器阅读理解模型鲁棒性中的过敏感性问题和过稳定性问题,提出了一种基于数据增强的策略。首先使用回译数据增强法和传统的EDA数据增强法扩充数据,然后采用基于离群点检测的方法对扩充后的数据进行过滤,从而提高模型的鲁棒性。在DuReaderrobust数据集上的实验结果表明,本文方法可以提高模型在过敏感性和过稳定性方面的性能,F1值分别得到2.75%和1.18%的提升。

关 键 词:机器阅读理解  过敏感性  过稳定性  数据增强
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号