首页 | 本学科首页   官方微博 | 高级检索  
     

汉语并列复句的自动识别方法
引用本文:吴云芳,石静,万富强,吕学强. 汉语并列复句的自动识别方法[J]. 北京大学学报(自然科学版), 2013, 49(1): 1-6
作者姓名:吴云芳  石静  万富强  吕学强
作者单位:1. 北京大学信息科学技术学院, 北京 100871; 2. 网络文化与数字传播北京市重点实验室, 北京 100192;
基金项目:863计划(2012AA011101);九十八年度蒋经国国际学术交流基金会项目(RG013-D-09);网络文化与数字传播北京市重点实验室开放课题(ICDD201202)资助
摘    要:针对汉语句际关系中分布最广泛的并列复句, 提出一种自动识别的方法。通过对句子语义相似度和结构相似度的计算, 使用基于词义的句子相似度计算、最大公共子串、最大谓词周边匹配长度、加重特定词语复现等方法, 在广义并列关系上进行评测。最后将其中3种方法进行集成, 并取得了较为理想的效果。

关 键 词:并列复句  句际关系  句子相似度  集成方法  
收稿时间:2012-05-31

Automatic Identification of Chinese Coordination Discourse Relation
WU Yunfang,SHI Jing,WAN Fuqiang,Lü Xueqiang. Automatic Identification of Chinese Coordination Discourse Relation[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2013, 49(1): 1-6
Authors:WU Yunfang  SHI Jing  WAN Fuqiang  Lü Xueqiang
Affiliation:1. School of Electronic Engineering and Computer Science, Peking University, Beijing 100871;2. Beijing key Laboratory of Internet Culture and Digital Dissemination Research, Beijing 100192;
Abstract:Several methods are proposed to automatically identify coordination relation, which is the most widely distributed one among discourse relations. The authors exploit semantic similarity and structure similarity to compute the sentence similarity, using lexical similarity, maximum common substring calculation, maximum length matching around head word, special words strengthening. Three of the above methods are integrated, and the experiment achieves promising results.
Keywords:coordinate complex sentence  discourse relation  sentence similarity  ensemble method  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《北京大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《北京大学学报(自然科学版)》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号