首页 | 本学科首页   官方微博 | 高级检索  
     

基于数据增强和字词融合特征的实体槽位识别
作者姓名:刘振元  许明阳  王承涛
作者单位:1. 华中科技大学人工智能与自动化学院;2. 华中科技大学图像信息处理与智能控制教育部重点实验室;3. 武汉问道信息技术有限公司
基金项目:国家自然科学基金资助项目(72071087);
摘    要:针对传统的基于字级表示的实体槽位识别模型无法很好利用词语信息,以及信息技术(IT)运维领域缺少足够数量公开数据集的问题,提出一种基于BERT_Word2vec_BiLSTM_CRF模型的实体槽位识别方法,并通过数据增强对模型的训练数据集进行扩展.该模型将基于转换器的双向编码表征(BERT)模型得到的字向量表示和Word2vec得到的词向量表示进行融合,通过双向长短时记忆(BiLSTM)网络进行上下文编码,通过条件随机场(CRF)进行解码,得到最终的序列标注结果.通过在某企业提供的数据集上进行实验,结果表明:融合词级特征可以在BERT预训练模型的基础上进一步提升识别性能,F1值达到了92.33%.

关 键 词:IT运维  实体槽位识别  字词融合  数据增强  基于转换器的双向编码表征(BERT)
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号