基于机器阅读理解的商品属性识别 |
| |
引用本文: | 张飞宇,马进,贾昊,张世奇,陈文亮.基于机器阅读理解的商品属性识别[J].山西大学学报(自然科学版),2022(4):924-935. |
| |
作者姓名: | 张飞宇 马进 贾昊 张世奇 陈文亮 |
| |
作者单位: | 苏州大学计算机科学与技术学院 |
| |
基金项目: | 国家自然科学基金(61876115); |
| |
摘 要: | 属性抽取的目标是从非结构化文本中抽取与文本实体相关的属性和属性值,然而在电商场景下基于序列标注的模型缺少应对大规模属性抽取任务的可扩展性和可泛化性能力。本文提出基于阅读理解的商品属性抽取模型,通过额外加入问句来强化模型对属性的理解,结合双仿射注意力机制捕获问句和文本之间的语义特征,进一步提高模型的抽取性能。本文在电商数据集上对不同类型问句和不同解码器进行了对比实验,结果表明本文提出的方法优于多个基线模型,相较于OpenTag和SUOpenTag模型,属性抽取的F1值分别提升7.70%和3.26%,未登录词识别的F1值分别提升15.51%和8.12%。
|
关 键 词: | 属性抽取 机器阅读理解 序列标注 大规模 |
|
|