首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
提出了一种汉-维句子对齐混合算法,它是以基于词典的方法为主、基于长度的方法为辅的一种混合对齐算法.目的在于建立一个以汉文-维文平行语料库及面向政府文献的汉-维机器翻译为应用背景的,实用汉-维句子对齐系统.  相似文献   

2.
徐春 《科技信息》2011,(17):I0104-I0105
平行语料库研究是近年来语料库语言学横向发展的新趋势。人们清楚的认识到大规模的高质量汉英平行语料库在自然语言处理、比较语言学研究和第二语言教学等众多领域中的巨大价值。文章介绍了一个大规模汉英双语平行语料库的构建系统,利用互联网上存在的海量多语言文本资源,通过网页的内容分析和链接分析,实现了一个双语语料挖掘的自动获取系统,包括其总体规划、实施模型和流程细节。目的是通过学习国内外资料。最终建设一个基于互联网的平行语料库自动构建系统。  相似文献   

3.
分段对齐在双语句子对齐的过程中发挥着重要的作用,文章提出了一种新的基于锚点句对的分段对齐方法,并把它和传统的基于回车符的分段对齐方法相结合,形成了一种多层次的分段对齐方法.  相似文献   

4.
尝试对平行语料库中需要去重的中文句子相似情况作分类,利用整体相似因子和局部相似因子计算句子的相似度,并借鉴KMP算法的匹配跳跃思想,提出中文字符串匹配的类KMP算法,并对算法进行实验验证。结果表明,算法具有较好的效果,能够实现平行语料库中相似句子的去重。算法开放测试的召回率达94%,去重准确率达到84%。算法可以应用于任何长度的语句比对,适用范围广。  相似文献   

5.
以《尼山萨满》为例,利用语料库的技术手段保护和传承少数民族文化典籍。构建了一个满族典籍的平行语料库系统原型,重点研究了该平行语料库的语料对齐方法,分别研究了两种段落对齐方法和三种句子对齐方法,并对各个方法进行了性能评价,最终选出最适合该平行语料库的对齐方法。测试结果表明,最终选取的对齐方法满足构建满族典籍平行语料库的需求,从而为其他同类型的少数民族语料库构建提供更多的参考。  相似文献   

6.
Translation lexicons are fundamental to natural language processing tasks like machine translation and cross-language information retrieval. This paper presents a lexicon builder that can auto-extract (or assist lexicographer in compiling) the word translations from Chinese-English parallel corpus. Key mechanisms in this builder system are further described, including co-occurrence measure, indirection association resolution and multi-word unit translation. Experiment results indicate the effectiveness of the authors‘ method and the potentiality of the lexicon builder system.  相似文献   

7.
刘立 《大连民族学院学报》2010,12(2):176-179,186
介绍了少数民族英语学习者的特殊性以及语料库在研究少数民族学生三语习得中的作用,指出目前国内仍无以民族语为母语背景的英语学习者语料库,因而深入研究少数民族英语学习者的中介语和语言迁移缺乏自然语料和数据。据此提出有必要建设少数民族英语学习者语料库,并从建库目的和规模、语料抽样、语料加工与标识、语料库赋码等方面进行了深入的阐述。  相似文献   

8.
针对纳西语、汉语因句法结构差异较大而导致双语词语自动对齐较为困难的问题,提出一种融合特征约束模型的纳西-汉语双语词语对齐算法.首先在语料中统计纳西-汉语词语区间扭曲和位置转换特性,并由此建立2个双语词语对齐的特征约束模型;然后将提出的特征约束模型融入词语对齐的对数线性模型框架,并结合最小错误率算法训练模型参数;最终搜索出最佳的词语对齐结果.实验以IBM Model3为词语对齐比较模型,结果表明,该双语词语对齐算法可以使纳西-汉语词语的对齐准确率提升21.9%.  相似文献   

9.
根据汉语中二字词较多的特点,提出了一种新的分词词典机制.该机制在词典数据结构中添加二字词检测位图表,在分词时,利用位图表可快速判断二字词优化分词速度.选取人民日报语料片断进行了实验测试.实验结果表明,基于二字词检测位图表的分词词典机制有效地提高了汉语自动分词的速度和效率.  相似文献   

10.
基于语义的中文句子的直接生成方法   总被引:1,自引:0,他引:1  
给出一种基于知识机器翻译系统的中文句子的生成方法.这种方法根据中文的特点,从语义的中间语言表达式直接生成中文短语或句子,因此省却了中间语言到句法结构的变换步骤,简化了生成过程.  相似文献   

11.
词典中多义词的义项划分与排列一直是词典编撰的难题。常用的历史顺序、频率顺序和逻辑顺序各有利弊。运用于语言研究领域的原型理论对于分析词义,体现多义词义项间的联系起到了重要作用,也为使用者的多义词习得提供了更多的帮助。  相似文献   

12.
基于语料库的Web词典编纂及自动生成系统设计与实现   总被引:3,自引:2,他引:1  
“基于语料库的WEB词典编纂&自动生成系统”是专门针对词典编纂出版而研制开发的软件系统,该系统通过互联网建立安全、稳定的词典编纂及生成平台,实现词典编纂生成全过程数字化、自动化、规范化,最大限度地利用现有资源,高效率地完成词典编纂出版工作.笔者主要从体系结构、功能模块及实现3方面介绍该系统的设计与实现.  相似文献   

13.
王颖 《长沙大学学报》2005,19(1):119-121
词汇教学是大学英语教学的重要组成部分.但是,长期以来,我们面临的是课时少、任务重、学生学习效益低的状况.笔者认为,应该改革教师讲、学生听的传统教学方法,借助现代化的教学手段,以学生为中心组织课堂活动,逐步培养学生的自主学习能力.唯有如此,才能提高教学效益.本文介绍笔者使用<新视野大学英语>教材语料库辅助词汇教学的一些尝试,为计算机辅助词汇教学提供了一个模式.  相似文献   

14.
以汉语为研究对象,提出构建大规模高质量汉语复述平行语料的方法.基于翻译引擎进行复述数据增强,将英语复述平行语料迁移到汉语中,同时人工构建汉语复述评测数据集.基于构建的汉语复述数据,在复述识别和自然语言推理任务中验证复述数据构建及其应用方法的有效性.首先基于复述语料生成复述识别数据集,预训练基于注意力机制的神经网络句子匹...  相似文献   

15.
分析翻译课程中多模态学习者双语语料库的构建问题。将计算机辅助翻译(CAT)技术纳入翻译教学,利用CAT平台,构建包含文本、视频等多种模态的新型学习者双语语料库,并以雪人翻译软件为例,探讨多模态学习者双语语料库构建的选材、语料加工、检索等问题以及具体构建步骤和方法。  相似文献   

16.
通过对中国大陆法律法规汉英平行语料库中情态动词的分布及其分布的原因和意义的分析,发现基本情态动词shall,may,must,should,will和can出现的频数较多,因为法律法规主要规定人们的义务和权利,权利从某种程度上说是政府对其管辖的人民的承诺。  相似文献   

17.
双语教学考核与评价体系的研究   总被引:1,自引:0,他引:1  
石怀旺 《科技信息》2010,(27):27-27,267
考试不仅是教育的评价手段,它还指导着教学。建立一套科学的双语教学考核方法不仅有利于评价双语教学的效果,同时对推广双语教学工作有着重要的意义。本文在分析了传统考核方式局限性的基础上,提出了双语教学的考核建议,并结合"数字信号处理"双语教学的实践,介绍了该门课程的考核方法。  相似文献   

18.
序列比对是生物信息学中基本的信息处理方法,对于发现生物序列中的功能、结构和进化信息具有重要的意义。该文对典型的双序列比对算法以及多序列比对算法进行了描述和评价;针对目前序列比对算法普遍存在的不足,提出了一种新的思想--基于知识表达系统的序列比对研究,应用知识表达系统对序列比对相似性发现进行定义及其处理。  相似文献   

19.
牛军锋 《科学技术与工程》2012,12(28):7289-7292,7297
为了缩短捷联惯导系统的初始对准时间并提高对准精度,分别设计了常规卡尔曼滤波器和自适应卡尔曼滤波器用于精对准。在系统噪声统计特性未知时,自适应卡尔曼滤波算法利用滤波残差的均值和方差,不断对卡尔曼滤波的状态噪声方差阵和测量噪声方差阵进行实时修正,从而提高滤波器对模型不确定性和噪声变化的适应能力和鲁棒性。仿真结果表明,使用自适应UKF算法与常规的UKF算法相比,可以获得更优的对准精度和快速性。  相似文献   

20.
<朗文当代英语辞典>第四版微观信息更加丰富和多样化,具体表现在例证更加丰富,增加习惯搭配信息.新增类义词汇栏,新增百科信息,恢复语言说明栏.在宏观结构方面,新的版本采用全彩印刷,查找更为方便,插图更为丰富,另外书后附有CD-ROM光碟,这是新版的重大突破.尽管仍有不足之处,但它依然是英语学习的好帮手,质量优良的好词典.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号