首页 | 本学科首页   官方微博 | 高级检索  
     

文档级关系抽取方法的研究进展
作者姓名:周友华  黄翰  刘浩龙  郝志峰
作者单位:华南理工大学 软件学院, 广东 广州510006;佛山科学技术学院 数学与大数据学院, 广东 佛山528225
基金项目:国家自然科学基金资助项目(61876207);;中央高校基本科研业务费资助项目(2020ZYGXZR014)~~;
摘    要:关系抽取是自然语言处理领域的一项基础研究,抽取的结果可以用于知识图谱构建、人机问答、语义搜索等下游任务,具有广泛的应用场景和重要的研究价值。近年来,关系抽取研究取得了丰富的成果,但绝大多数研究局限于句子级关系抽取。研究表明,大量的关系无法通过单个句子提取,随着深度学习和自然语言处理技术的不断发展,文档级关系抽取研究工作迎来了新一轮的机遇和挑战。文中着重对近几年文档级关系抽取的研究进展进行分类和梳理,提炼出文档级关系抽取的一般技术路线图,分析文档级关系抽取研究的特征编码及特征聚合方法,并根据提取特征的不同,将文档级关系抽取方法概括为基于词汇特征、基于句法特征以及基于关系特征的3类方法;同时介绍常用文档级关系抽取数据集和评测指标,并对未来的研究趋势进行展望。

关 键 词:文档级  关系抽取  特征编码  特征聚合
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号