首页 | 本学科首页   官方微博 | 高级检索  
     检索      

汉语基本块标注系统的内部关系分析
引用本文:宇航,周强.汉语基本块标注系统的内部关系分析[J].清华大学学报(自然科学版),2009(10).
作者姓名:宇航  周强
作者单位:清华大学信息技术研究院语音和语言技术中心;清华信息科学与技术国家实验室技术创新与开发部语音和语言技术中心;
基金项目:国家自然科学基金资助项目(60573185,60873173);;国家“八六三”高技术项目(2007AA01Z173)
摘    要:针对目前基本块分析主要侧重外部边界和句法标记识别的处理缺陷,提出了一种可以同时获得基本块的外部句法标记和内部关系描述的汉语基本块分析方法。首先通过设计关系标记集来描述基本块内部词与词之间的句法依存关系,然后利用统计建模对句子中的每个词进行序列关系标注,最后通过有限自动机规则自动获取句子的完整基本块标注结果。实验结果表明,与使用经典的边界标记(IOB)模型进行基本块句法标注分析的方法相比,该方法在句法标记识别性能略有下降的情况下获得了很好的内部关系分析结果。

关 键 词:中文信息处理  基本块  内部关系分析  统计模型  

Intra-chunk relationship analyse for Chinese base chunk labeling systems
YU Hang,ZHOU Qiang.Intra-chunk relationship analyse for Chinese base chunk labeling systems[J].Journal of Tsinghua University(Science and Technology),2009(10).
Authors:YU Hang  ZHOU Qiang
Institution:Center for Speech and Language Technologies;Research Institute of Information Technology;Tsinghua University;Center for Speech and Language Technologies;Division of Technology Innovation and Development;Tsinghua National Laboratory for Information Science and Technology;Beijing 100084;China
Abstract:
Keywords:Chinese information processing  base chunk  intra-relation analysis  statistical model  
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号