首页 | 本学科首页   官方微博 | 高级检索  
     

面向互联网食品文本实体关系联合抽取研究
作者姓名:左敏  薛明慧  张青川  蔡圆媛
作者单位:北京工商大学农产品质量安全追溯技术及应用国家工程实验室
基金项目:国家重点研发计划(2019YFC1606401);;北京市自然科学基金(4202014);;北京市教委科研计划项目(KM202010011011)~~;
摘    要:传统实体关系抽取方法中存在错误传播、实体冗余等问题,食品文本语料中存在主实体对应多个关系的特点,针对此情况,提出一种面向互联网食品文本领域的实体关系联合抽取方法。采用序列标注标签和实体关系匹配规则,将实体关系抽取任务转化为序列标注问题;引入基于位置感知的领域词注意力机制的字词双维度语义编码向量,增强文本的语义表征;在对句子进行字词双维度表示的基础上结合双向长短期记忆网络(bi-directional long short-term memory, BiLSTM)和条件随机场(conditional random field, CRF)构建了序列标注模型(position attention-bidirectional encoder representation from transformer, PA-BERT),实现实体关系联合抽取。对比实验证明,提出的实体关系联合抽取模型在食品数据集上的准确率比常用深度神经网络模型高出6%~11%,在食品文本实体关系抽取中是有效性的。

关 键 词:实体关系抽取  文本序列标注  注意力机制
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号