汉语隐式篇章关系识别 |
| |
引用本文: | 孙静,李艳翠,周国栋,冯文贺.汉语隐式篇章关系识别[J].北京大学学报(自然科学版),2014,50(1). |
| |
作者姓名: | 孙静 李艳翠 周国栋 冯文贺 |
| |
作者单位: | 苏州大学计算机科学与技术学院,苏州,215006;苏州大学计算机科学与技术学院,苏州215006;河南科技学院信息工程学院,新乡453003;河南科技学院人文学院,新乡,453003 |
| |
基金项目: | 863计划(2012AA011102);国家自然科学基金(61273320);教育部人文社会科学青年基金(13YJC740022)资助 |
| |
摘 要: | 采用一个自建的汉语篇章结构语料库(隐式关系占80%)进行隐式关系识别。语料中将篇章关系分成3个层次,第一层包含因果、并列、转折、解说四大类。在此语料上,利用上下文特征、词汇特征、依存树特征,采用最大熵的分类方法对四大类关系进行识别。实验结果显示,总正确率为62.15%,其中并列类识别效果最好,F1值达到75.26%。
|
关 键 词: | 篇章结构分析 篇章关系 隐式关系识别 汉语篇章语料库 |
本文献已被 CNKI 万方数据 等数据库收录! |
|