首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于统计的汉英法律文献亚句子级对齐
引用本文:吕学强,李清隐,任飞亮,姚天顺.基于统计的汉英法律文献亚句子级对齐[J].东北大学学报(自然科学版),2003,24(1):23-26.
作者姓名:吕学强  李清隐  任飞亮  姚天顺
作者单位:东北大学,信息科学与工程学院,辽宁,沈阳,110004
基金项目:国家自然科学基金资助项目(60083006),国家重点基础研究发展规划资助项目(G19980305011)·
摘    要:基于统计的句子对齐是根据双语句子的长度在所有可能的对齐中找出概率最大的一个·提出两种对齐汉英语料的参数计算方法,使对齐模型中的评价函数满足标准正态分布·参数s2的值是对训练语料中的所有点(l1,(l2-cl1)2)进行线性回归分析所得直线的斜率,s2的另一种求法是直接计算方差·实验结果表明汉英法律文献亚句子级对齐的正确率为98 8%,召回率为99 2%·

关 键 词:双语语料库  汉英法律文献  亚句子级对齐  统计方法  评价函数  参数计算  标准正态分布
文章编号:1005-3026(2003)01-0023-04
修稿时间:2002年4月27日

Sub-Sentence Alignment of Chinese-English Law Literature Based on Statistical Approach
Abstract:
Keywords:bilingual corpora  Chinese-English law literature  sub-sentence alignment  statistical approach  evaluation function  parameter computation  standard normal distribution
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《东北大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《东北大学学报(自然科学版)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号