首页 | 本学科首页   官方微博 | 高级检索  
     

汉语隐式篇章关系识别
引用本文:孙静,李艳翠,周国栋,冯文贺. 汉语隐式篇章关系识别[J]. 北京大学学报(自然科学版), 2014, 50(1): 111
作者姓名:孙静  李艳翠  周国栋  冯文贺
作者单位:1. 苏州大学计算机科学与技术学院, 苏州 215006; 2. 河南科技学院信息工程学院, 新乡 453003; 3. 河南科技学院人文学院, 新乡 453003;
基金项目:863计划(2012AA011102);国家自然科学基金(61273320);教育部人文社会科学青年基金(13YJC740022)资助
摘    要:采用一个自建的汉语篇章结构语料库(隐式关系占80%)进行隐式关系识别。语料中将篇章关系分成3个层次, 第一层包含因果、并列、转折、解说四大类。在此语料上, 利用上下文特征、词汇特征、依存树特征, 采用最大熵的分类方法对四大类关系进行识别。实验结果显示, 总正确率为62.15%, 其中并列类识别效果最好, F1值达到75.26%。

关 键 词:篇章结构分析  篇章关系  隐式关系识别  汉语篇章语料库  
收稿时间:2013-06-22

Research of Chinese Implicit Discourse Relation Recognition
SUN Jing,LI Yancui,ZHOU Guodong,FENG Wenhe. Research of Chinese Implicit Discourse Relation Recognition[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2014, 50(1): 111
Authors:SUN Jing  LI Yancui  ZHOU Guodong  FENG Wenhe
Affiliation:1. Department of Computer Science and Technology, Soochow University, Suzhou 215006; 2. School of Information Engineering, Henan Institute of Science and Technology, Xinxiang 453003; 3. School of humanities, Henan Institute of Science and Technology, Xinxiang 453003;
Abstract:The authors use a self-built Chinese Discourse Treebank (80% relations are implicit) to recognize implicit relations. In this corpus, discourse relations are divided into three layers, the first layer has four types: causality, coordination, transition and explanation. Based on this corpus, maximum entropy classifier is employed to identify four types relations with context, lexical and dependency parse features. Experimental results show that total accuracy is 62.15% and the identification effect of coordination is the best, F1 reaches 75.26%.
Keywords:discourse parsing  discourse relation  implicit relation recognition  Chinese Discourse Treebank  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《北京大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《北京大学学报(自然科学版)》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号