首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 31 毫秒
1.
回顾基于规则的机器翻译中的文本处理、文本分析、词典构成、词典查询和语义排歧技术,指出基于规则的机器翻译因为词义选择、层次切分、特殊句型结构等固有难题难以圆满解决,只有发展新的翻译技术,才能使机器翻译质量达到实用水平.  相似文献   

2.
为解决基于实例的甲骨文机器翻译缺乏深层次语义分析的问题,引入了本体技术.采用实例和本体相结合的办法,分阶段实现甲骨文语句的机器翻译.基于实例的方法用于仅需浅层语义分析的句子,基于本体的方法用于需深层语义分析的句子.在对比分析甲骨文与现代汉语之间的内在联系基础上,建立了甲骨文知识本体,为机器翻译的词典和语义提供概念及其层次网络,解决甲骨文同义词、兼类词及词义消歧问题.实验结果表明:对常规的简单甲骨文语句,基于实例的机器翻译结果较好;对复杂的甲骨文语句,需要利用基于本体的机器翻译,其结果也基本满足研究需求.  相似文献   

3.
结合一个基于规则的日汉机器翻译系统,给出了自然语言生成规则的一种解释技术.该技术着眼于汉语生成规则语言的表达能力、自然性以及可扩充性,在实现中采用了基于元规则的方法,可以很方便地对规则语言进行扩充;另外,元规则的描述主要采用了自动机模型.所述的原则和技术也适用于一般的基于规则的自然语言处理系统.  相似文献   

4.
提出一种基于翻译日志的统计机器翻译模型的剪枝方法。该方法利用翻译规则在翻译日志中的命中频数对机器翻译规则进行过滤, 保留当前机器翻译模型所需的最小规则表。实验表明, 该方法能够在仅保留原有模型1%~3%翻译规则的前提下达到原有模型的翻译效果。  相似文献   

5.
为了将统计机器翻译技术中的规则信息引入到端到端的神经网络模型中,提出了一种将规则信息转化为近似等价的序列信息的方法.在此基础上,提出了两种融入规则信息的神经机器翻译模型,并在基于注意力机制的循环神经网络(RNN)模型上进行了验证.相对于未融入规则信息的基准模型在美国国家标准与技术研究院(NIST)评测集上的评测结果,上述两种模型的双语互译评估(BLEU)值均有所提高.实验表明,将规则等外部知识融入到神经机器翻译系统中是提升模型翻译质量的一种有效途径.  相似文献   

6.
重建巴比塔的情结促使科学家和语言学家联合起来试图利用计算机来进行自然语言的翻译和转换工作。介绍了机器翻译的起源,论述了基于规则和基于语料库的机器翻译系统的特点和实例,探讨了目前机器翻译系统的缺陷及其将来研发方向。  相似文献   

7.
由于装备信息的敏感性,军事领域的跨语言实体匹配问题会面临缺乏标注好的平行语料、依赖机器翻译质量等问题.从这些问题出发,提出了一种跨语言舰船实体匹配算法.首先归纳匹配规则,通过融合机器翻译和词典短语释义取得语言转换结果,设计了检测后缀相同字符串的相似度度量suffix-matter优化候选集,提高了算法的效率.还设计了捕...  相似文献   

8.
本文简要地回顾了机器翻译发展的历史,介绍了基于语言规则的机器翻译方案中的源语言分析方法及其发展过程,具体包括:直译式方法、基于产生式规则的方法以及基于启发式预处理的方法。深入分析并总结了各种分析方法的利弊,最后提出了一种基于全启发策略的语言分析模型,并开发了高效的全启发式语言分析系统。  相似文献   

9.
一种机器翻译系统用词典的设计及其结构   总被引:1,自引:0,他引:1  
提出了机器翻译系统的词典设计目标,讨论了大型动态词典文件的组织方法,根据汉语词分布不均匀的特点,提出一种扩充的B^+树索引词典文件结构,并给出该词典的查询算法及词典结构的评估。实践证明该词典结构达到了机器翻译系统的要求,其结果是合理的。  相似文献   

10.
在英汉机器翻译中,英语介词多义的处理是最难解决的问题之一,尽管国内外一些机器翻译专家在这方面已做了许多工作,并获得一些成果,但远未能彻底解决这一问题,在对英语介词的现象进行分类的基础上,以介词“in”为例对其多义现象进行了详细的分析研究。在研制“智能型英汉机器翻译系统”中,采取在词典和规则中加入介词的语义属性和上下文相关函数等措施,比较好地解决了介词多义的问题。从而,使“智能型英汉机器翻译系统”的  相似文献   

11.
语义歧义大量存在于自然语言中,其排歧成功率是衡量机器翻译、信息检索、文本分类等自然语言处理软件性能的重要指标.对语义消歧这一自然语言理解领域的难点技术问题进行了探讨,分析了统计学习方法在语义消歧中的应用,阐述了统计语义消歧的有关技术,并给出一个基于贝叶斯与机读词典的语义消歧实例,取得了较高的语义消歧成功率.  相似文献   

12.
基于Hash方法的机器翻译词典的组织与构造   总被引:6,自引:1,他引:6  
给出了一种机器翻译词典的二级Hash方法,并用此方法组织与构造了中日机器翻译标准词典,该方法可通过统计以各种字集开头的词的数目来规划数据块的分配,同时又将统计结果作为Hash方法的参数来调节数据块的分配,这种调节作用非常有利于控制分布的均匀性,减少冲突,提高空间利用率,该方法不仅免去了常规的以索引方式组织词典模式中对各级索引的繁琐的维护工作,而且也提高了分词效率。  相似文献   

13.
仅用一本词典,掌出原文词语的意思,就能够做好翻译是对翻译的一种误解。翻译过程涉及因素较多,了解原语的基本词义只是对原文解读的一部分,而且词典意义具有静态的性质,而语言的使用则是动态的,因此,对词典意义的把握虽然有助于对原语意义的理解,但不能决定翻译的质量。从人们对词典在翻译中的作用的误解入手,阐明了如何正确对待词典与翻译的关系,从而提高翻译的质量。  相似文献   

14.
选取某汽车《维修手册》为案例,在分析其语言、项目、格式特点及其在术语、风格等方面易出现的问题的基础上,探讨计算机辅助翻译在机械工程文档中的翻译流程和功能。结果发现:计算机辅助翻译能充分发挥人和软件的各自优势,细化翻译流程,明确每个环节的任务;并能通过相应的操作工具,使翻译项目管理变得有章可循,有法可依,从而有效地提高翻译质量和效率。  相似文献   

15.
语义词典是人工智能、语义网与知识工程等研究领域的热点,它可以支持机器学习、自然语义理解、数据挖掘及机器翻译等技术。文章在藏语独特的文法理论研究基础上,利用对比英文和藏文词之间的语义关系、构建双语大型数据库和制定映射过程中词汇空缺等方法,构建了基于半自动匹配的藏文语义词典。本语义词典既兼容了国际通用的英文WordNet,又保留了藏语的特点,为藏文信息处理提供了重要的数据资源。  相似文献   

16.
提出了一种汉-维句子对齐混合算法,它是以基于词典的方法为主、基于长度的方法为辅的一种混合对齐算法.目的在于建立一个以汉文-维文平行语料库及面向政府文献的汉-维机器翻译为应用背景的,实用汉-维句子对齐系统.  相似文献   

17.
在词典辅助编纂平台中词典数据微观数据结构是基础,所有的功能实现都建立在该微观数据结构上.如何构造一个可以同时兼顾人读和机读的标准词典数据微观结构,是一个值得广泛和深入研究的问题,文章针对Dict-G系统从词典数据微观数据结构及其数据库设计2个方面作了详细探讨.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号