首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于分层ERNIE模型的中文嵌套命名实体识别
引用本文:贾李睿智,刘胜全,刘源,魏富源,孔博,王光耀.基于分层ERNIE模型的中文嵌套命名实体识别[J].东北师大学报(自然科学版),2023(1):97-103.
作者姓名:贾李睿智  刘胜全  刘源  魏富源  孔博  王光耀
作者单位:新疆大学信息科学与工程学院
基金项目:国家自然科学基金资助项目(61966034);
摘    要:近年来中文嵌套命名实体识别的相关研究进展缓慢,BERT和RoBERTa等预训练模型在处理中文语言时,导致模型只能学习到不完整的语义表示.针对以上两个问题,首先使用现有的中文命名实体基准语料库ACE2004和ACE2005,依照原始语料的中心词和外延的关系自动构造嵌套命名实体;然后使用分层ERNIE模型在构建好的中文语料库上进行中文嵌套命实体识别的研究,相较于BERT等模型,ERNIE模型则是通过对中文实体语义单元的掩码,使得模型学习完整概念的语义表示.实验结果表明,分层ERNIE模型在ACE2004和ACE2005两个中文嵌套命名实体语料库上F1值分别为84.5%和85.9%,性能优于BERT和RoBERTa模型.

关 键 词:嵌套命名实体识别  中文嵌套实体语料库  ERNIE  预训练模型
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号