首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于双语对齐的汉语–新蒙古文命名实体翻译
引用本文:杨萍,侯宏旭,蒋玉鹏,申志鹏,杜健.基于双语对齐的汉语–新蒙古文命名实体翻译[J].北京大学学报(自然科学版),2016(1):148-154.
作者姓名:杨萍  侯宏旭  蒋玉鹏  申志鹏  杜健
作者单位:1. 内蒙古大学计算机学院,呼和浩特010021;临汾职业技术学院计算机系,临汾041000;2. 内蒙古大学计算机学院,呼和浩特,010021
摘    要:汉语–新蒙古文命名实体翻译在跨汉语–新蒙古文信息处理中具有重要意义,而直接使用机器翻译的方法不能达到满意的结果。针对上述问题,提出一种从汉语–新蒙古文平行语料中自动抽取汉语–新蒙古文命名实体翻译对的方法。该方法只需对汉语端进行命名实体标注;然后基于双语HMM词对齐结果,利用滑动窗口的方法抽取所有候选命名实体翻译对;最后基于融合5种特征的最大熵模型,对所有候选翻译单位进行过滤,选取与汉语端命名实体相对应的置信度最高的新蒙古文命名实体翻译单位。实验结果表明,该方法优于基于HMM的方法,在对齐模型只是部分准确的情况下,也获得较高准确率的汉语–新蒙古文命名实体翻译对。

关 键 词:命名实体  识别  翻译  双语对齐

Chinese-Slavic Mongolian Named Entity Translation Based on Word Alignment
YANG Ping,HOU Hongxu,JIANG Yupeng,SHEN Zhipeng,DU Jian.Chinese-Slavic Mongolian Named Entity Translation Based on Word Alignment[J].Acta Scientiarum Naturalium Universitatis Pekinensis,2016(1):148-154.
Authors:YANG Ping  HOU Hongxu  JIANG Yupeng  SHEN Zhipeng  DU Jian
Abstract:
Keywords:named entity  recognition  translation  bilingual word alignment
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号