首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于多种长度单位的汉英句子分组对齐算法
引用本文:昝红英,张霞,刘亚雷.基于多种长度单位的汉英句子分组对齐算法[J].郑州大学学报(理学版),2009,41(2).
作者姓名:昝红英  张霞  刘亚雷
作者单位:1. 郑州大学信息工程学院,郑州,450001
2. 仰恩大学计算机与信息学院,福建,泉州,362014
3. 西南交通大学电气工程学院,成都,610031
基金项目:河南省教育厅自然科学基金
摘    要:传统的基于长度的汉英双语句子对齐算法大都以字节作为句子长度的计算单位.提出了以句子所含动词、名词、形容词、实词、字节及全部词语总数等6种单位作为句子长度的计算方法进行汉英句子对齐研究.针对传统基于长度对齐算法消耗内存大、效率低的特点,提出了不受文本大小限制的分组对齐算法.实验结果表明,汉英句子对齐以词语作为长度计算单位的算法性能较高,准确率达到99.01%,召回率达到99.50%.

关 键 词:自然语言处理  双语语料  句子对齐  分组对齐  句子长度

The Chinese-English Alignment Algorithm Based on Multi-Units Length via Grouping the Sentences
ZAN Hong-ying , ZHANG Xia , LIU Ya-lei.The Chinese-English Alignment Algorithm Based on Multi-Units Length via Grouping the Sentences[J].Journal of Zhengzhou University:Natural Science Edition,2009,41(2).
Authors:ZAN Hong-ying  ZHANG Xia  LIU Ya-lei
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号