首页 | 本学科首页   官方微博 | 高级检索  
     检索      

汉语-维吾尔语的一对一词对齐研究
引用本文:张亚军,贺琛琛.汉语-维吾尔语的一对一词对齐研究[J].昌吉学院学报,2012(6):80-83.
作者姓名:张亚军  贺琛琛
作者单位:昌吉学院计算机工程系;昌吉学院人事处
基金项目:国家自然基金(60963018);国家语委科研项目(MZ115-75);新疆维吾尔自治区高校科研计划青年教师科研基金项目(XJEDU2011S42);昌吉学院科研基金项目(2011SSQD029)
摘    要:描述基于统计机器翻译的汉语到维吾尔语的一对一词对齐系统。系统进程分为两个模块:预处理和词字对齐。预处理过程,包括中文文本预处理和维吾尔语文本预处理过程:首先将维吾尔语通过专用工具转换为拉丁维文,然后将拉丁维吾尔语中的特殊文字转换成无歧义的字符。词对齐的实现过程:首先使用IBM模型1,其次利用IBM模型2,构建出一个词对齐系统。实验表明,该系统实现的词对齐比GIZA++中实现的正确率可以提高2.6个百分点。

关 键 词:汉语-维吾尔语  词对齐  IBM模型1  IBM模型2
本文献已被 CNKI 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号