汉语并列复句的自动识别方法 |
| |
引用本文: | 吴云芳,石静,万富强,吕学强.汉语并列复句的自动识别方法[J].北京大学学报(自然科学版),2013,49(1):1-6. |
| |
作者姓名: | 吴云芳 石静 万富强 吕学强 |
| |
作者单位: | 北京大学信息科学技术学院,北京,100871;网络文化与数字传播北京市重点实验室,北京,100192 |
| |
基金项目: | 863计划(2012AA011101);九十八年度蒋经国国际学术交流基金会项目(RG013-D-09);网络文化与数字传播北京市重点实验室开放课题(ICDD201202)资助 |
| |
摘 要: | 针对汉语句际关系中分布最广泛的并列复句,提出一种自动识别的方法。通过对句子语义相似度和结构相似度的计算,使用基于词义的句子相似度计算、最大公共子串、最大谓词周边匹配长度、加重特定词语复现等方法,在广义并列关系上进行评测。最后将其中3种方法进行集成,并取得了较为理想的效果。
|
关 键 词: | 并列复句 句际关系 句子相似度 集成方法 |
Automatic Identification of Chinese Coordination Discourse Relation |
| |
Institution: | WU Yunfang1,,SHI Jing1,WAN Fuqiang1,Lü Xueqiang2 1.School of Electronic Engineering and Computer Science,Peking University,Beijing 100871;2.Beijing key Laboratory of Internet Culture and Digital Dissemination Research,Beijing 100192 |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 CNKI 万方数据 等数据库收录! |
|