首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于LNBC模型的中文命名实体识别
引用本文:马永军,王野.基于LNBC模型的中文命名实体识别[J].天津科技大学学报,2023(2):50-55.
作者姓名:马永军  王野
作者单位:天津科技大学人工智能学院
基金项目:天津市教委社会科学重大项目(2017JWZD19);
摘    要:针对中文命名实体识别中融合词典信息准确率提升不足的问题,使用在模型内部融合词典信息的策略,并结合预训练语言模型NEZHA增强文本的嵌入表示,提出一种基于LNBC(LE-NEZHA-BiLSTM-CRF)模型的中文命名实体识别方法.首先通过词典树匹配所有潜在的词,然后采用面向中文理解的神经语境表征模型(NEZHA)进行融合嵌入表示,将训练得到的字词融合向量输入双向长短期记忆(BiLSTM)网络进行特征提取,获取长距离的语义信息,最后通过条件随机场(CRF)层降低错误标签输出的概率.实验结果表明,该方法在MSRA数据集和Resume数据集中的F1值分别为95.71%和96.11%,较其他对比模型均有提高.

关 键 词:命名实体识别  词典信息  双向长短期记忆网络  条件随机场
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号