首页 | 本学科首页   官方微博 | 高级检索  
     检索      

树-串句法统计翻译模型的正向解码算法
引用本文:薛永增,李生,赵铁军,杨沐昀.树-串句法统计翻译模型的正向解码算法[J].华中科技大学学报(自然科学版),2008,36(4):54-57.
作者姓名:薛永增  李生  赵铁军  杨沐昀
作者单位:1. 哈尔滨工业大学,媒体技术与艺术系,黑龙江,哈尔滨,150001;哈尔滨工业大学,语言语音教育部-微软重点实验室,黑龙江,哈尔滨,150001
2. 哈尔滨工业大学,语言语音教育部-微软重点实验室,黑龙江,哈尔滨,150001
基金项目:国家高技术研究发展计划(863计划)
摘    要:针对树-串句法统计翻译模型提出了基于对数线性模型的正向解码算法.该解码算法直接对句法树进行操作,能够简单有效地利用句法信息.在对数线性模型中定义了翻译模型概率、语言模型概率和空译文罚分3个特征函数.采用集束搜索算法搜索假设空间,采用多栈存储假设,依据启发式策略进行假设打分.研究了假设的扩展方法,特别是树节点上不同操作对位置有效性的影响.在IWSLT2004数据集上进行了对比实验.实验结果表明正向解码算法译文的BLEU评分高于传统解码算法,说明正向解码算法能够克服传统解码算法的不足,有效利用句法结构信息,比传统解码算法更适合于树-串统计翻译模型.

关 键 词:自然语言处理  统计机器翻译  句法  正向解码  启发式算法

Direct decoding algorithm for syntax-based tree-to-string statistical translation model
Xue Yongzeng,Li Sheng,Zhao Tiejun,Yang Muyun.Direct decoding algorithm for syntax-based tree-to-string statistical translation model[J].JOURNAL OF HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY.NATURE SCIENCE,2008,36(4):54-57.
Authors:Xue Yongzeng  Li Sheng  Zhao Tiejun  Yang Muyun
Abstract:
Keywords:
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号