首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于字符级特征的日文依存句法自动分析算法
引用本文:文益民,赵海,李健,黄晗文.基于字符级特征的日文依存句法自动分析算法[J].中南大学学报(自然科学版),2009,40(4).
作者姓名:文益民  赵海  李健  黄晗文
作者单位:1. 湖南大学,电气与信息工程学院,湖南,长沙,410082;湖南工业职业技术学院,信息工程系,湖南,长沙,410208
2. 香港城市大学,中文翻译及语言学系,香港,999077;苏州大学,计算机科学与技术学院,江苏,苏州,215006
3. 湖南工业职业技术学院,信息工程系,湖南,长沙,410208
基金项目:国家"863"计划项目,国家自然科学基金重点资助项目,湖南省博士后科研资助专项计划项目,湖南省教育科学"十一五"规划课题 
摘    要:基于字符在词位的特定性位置能起标志性作用,使用反映日语的语言倾向性的特征分析依存句法,给出基于字符级特征的依存句法自动分析算法.该算法使用词首的头2个字符、词尾的最后1个字符以及词尾的最后2个字符这3种类型的字符级特征加强分析器的学习.采用第1种类型的特征,反映日语的词汇形态特点,采用后2种类型的特征,则部分反映了日语表达重心后置的语言特性.在CoNLL-2009日语语料库上进行实验以及进行实际评估,结果表明:与基线特征相比,该算法有效地提高分析器的UAS指标(即无标记依存关系的正确率)和LAS指标(即考虑带标记的依存关系的正确率),大大提高分析器的竞争力.

关 键 词:计算机应用  依存句法分析  字符级特征

Japanese dependency parsing based on character-level features
WEN Yi-min,ZHAO Hai,LI Jian,HUANG Han-wen.Japanese dependency parsing based on character-level features[J].Journal of Central South University:Science and Technology,2009,40(4).
Authors:WEN Yi-min  ZHAO Hai  LI Jian  HUANG Han-wen
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号