首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于中英文可比较语料的中文零指代消解
引用本文:杨紫怡,贡正仙,孔芳,周国栋.基于中英文可比较语料的中文零指代消解[J].北京大学学报(自然科学版),2017,53(2).
作者姓名:杨紫怡  贡正仙  孔芳  周国栋
作者单位:苏州大学计算机科学与技术学院,自然语言处理实验室,苏州215006;苏州大学计算机科学与技术学院,自然语言处理实验室,苏州215006;苏州大学计算机科学与技术学院,自然语言处理实验室,苏州215006;苏州大学计算机科学与技术学院,自然语言处理实验室,苏州215006
摘    要:针对中文篇章中的零指代问题,提出一种基于中英文可比较语料进行中文零指代识别和消解的方法,并提出英文对等句的概念。利用对等句,重新定义句子间隔,并引入双语词对齐特征。在基准平台基础上,从零指代项识别和零指代项消解两个方面进行研究。在Onto Notes5.0语料上的实验结果表明,与目前性能最好的系统相比,新提出的基于中英对等语料的中文零指代方法取得更好的性能。

关 键 词:中文零指代  双语  对等句  识别  消解

Exploit Comparable Corpus to Chinese Zero Pronoun Resolution
YANG Ziyi,GONG Zhengxian,KONG Fang,ZHOU Guodong.Exploit Comparable Corpus to Chinese Zero Pronoun Resolution[J].Acta Scientiarum Naturalium Universitatis Pekinensis,2017,53(2).
Authors:YANG Ziyi  GONG Zhengxian  KONG Fang  ZHOU Guodong
Abstract:A bilingual approach based on a comparable corpus is proposed to better detect and to resolve Chinese zero pronouns.The concept of English equivalent sentence is defined firstly.Then the equivalent sentence is employed to redefine the distance between sentences and to extract bilingual word alignment features.In this way,both zero pronoun detection and resolution of the baseline system from bilingual perspective are improved.The experiments conducted on the OntoNotes5.0 corpus show that the proposed approach can significantly outperform the state-of-the-art system.
Keywords:Chinese zero pronoun  bilingual  equivalent sentence  detection  resolution
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号