基于统计的汉英法律文献亚句子级对齐 |
| |
引用本文: | 吕学强,李清隐,任飞亮,姚天顺. 基于统计的汉英法律文献亚句子级对齐[J]. 东北大学学报(自然科学版), 2003, 24(1): 23-26 |
| |
作者姓名: | 吕学强 李清隐 任飞亮 姚天顺 |
| |
作者单位: | 东北大学,信息科学与工程学院,辽宁,沈阳,110004;东北大学,信息科学与工程学院,辽宁,沈阳,110004;东北大学,信息科学与工程学院,辽宁,沈阳,110004;东北大学,信息科学与工程学院,辽宁,沈阳,110004 |
| |
基金项目: | 国家自然科学基金资助项目(60083006),国家重点基础研究发展规划资助项目(G19980305011)· |
| |
摘 要: | 基于统计的句子对齐是根据双语句子的长度在所有可能的对齐中找出概率最大的一个·提出两种对齐汉英语料的参数计算方法,使对齐模型中的评价函数满足标准正态分布·参数s2的值是对训练语料中的所有点(l1,(l2-cl1)2)进行线性回归分析所得直线的斜率,s2的另一种求法是直接计算方差·实验结果表明汉英法律文献亚句子级对齐的正确率为98 8%,召回率为99 2%·
|
关 键 词: | 双语语料库 汉英法律文献 亚句子级对齐 统计方法 评价函数 参数计算 标准正态分布 |
文章编号: | 1005-3026(2003)01-0023-04 |
修稿时间: | 2002-04-27 |
Sub-Sentence Alignment of Chinese-English Law Literature Based on Statistical Approach |
| |
Abstract: | |
| |
Keywords: | bilingual corpora Chinese-English law literature sub-sentence alignment statistical approach evaluation function parameter computation standard normal distribution |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
| 点击此处可从《东北大学学报(自然科学版)》浏览原始摘要信息 |
|
点击此处可从《东北大学学报(自然科学版)》下载全文 |
|