首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 18 毫秒
1.
探讨汉语彝语机器翻译的方法与实现.阐述了课题研究的背景和意义,给出了技术实施中的时态转换的匹配规则,汉彝句型转换的翻译初步实践、汉语句子单词切分时的边界处理算法.从而实现对源语言汉语单词的切分检索,通过算法对语句进行调序,再结合彝族特定的语法、句型结构,最终生成目标语言彝语.即采用适合汉彝语法的句法结构转换再增减恰当的词汇来构成符合源语句语义信息的目标语句,从而达到汉彝机器翻译的基本层次.  相似文献   

2.
基于语义的中文句子的直接生成方法   总被引:1,自引:0,他引:1  
给出一种基于知识机器翻译系统的中文句子的生成方法.这种方法根据中文的特点,从语义的中间语言表达式直接生成中文短语或句子,因此省却了中间语言到句法结构的变换步骤,简化了生成过程.  相似文献   

3.
在英汉机器翻译中,英语介词多义的处理是最难解决的问题之一,尽管国内外一些机器翻译专家在这方面已做了许多工作,并获得一些成果,但远未能彻底解决这一问题,在对英语介词的现象进行分类的基础上,以介词“in”为例对其多义现象进行了详细的分析研究。在研制“智能型英汉机器翻译系统”中,采取在词典和规则中加入介词的语义属性和上下文相关函数等措施,比较好地解决了介词多义的问题。从而,使“智能型英汉机器翻译系统”的  相似文献   

4.
语料中抽取句子是藏语自然语言处理领域中一项关键技术,在句型研究、句法分析、语义分析、语用分析、问答系统和机器翻译等很多领域都有广泛的应用前景.文章在分析藏语句尾词性和虚词特征的基础上,提出了一种基于虚词和句尾词特征的藏语句子抽取方法,即从文本串的单垂符或双垂符开始,通过逆向搜索虚词的位置节点和句尾词性抽取藏语句子.实验表明,该方法抽取藏语句子的准确率可达98.9%以上,抽取句子的数量明显提高.  相似文献   

5.
随着语料库语言学的兴起,基于实例的机器翻译得到越来越多的研究,本文设计了一个完整的基于实例的机器翻译系统的模型,并对对齐处理、相似度计算和检索方法做了详细说明.  相似文献   

6.
汉语单句谓语中心词识别知识的获取及应用   总被引:13,自引:0,他引:13  
在基于实例的机器翻译(EBMT)的语句相似度研究中,确定谓语中心词以把握句子的整体结构是至关重要的。以标注了谓语中心词的3000句汉语单句作为训练集,将候选词本身的语法属性以及上下文环境作为该候选词的归类特征,通过建立统计决策树模型获取谓语中心词的识别知识。应用统计决策树进行了谓语中心词的自动识别,并获得了较为满意的测试结果。  相似文献   

7.
在英汉机器翻译中,英语介词多义的处理是最难解决的问题之一。尽管国内外一些机器翻译专家在这方面已做了许多工作,并获得一些成果,但远未能彻底解决这一问题。在对英语介词的多义现象进行分类的基础上,以介词“in”为例对其多义现象进行了详细的分析研究。在研制“智能型英汉机器翻译系统”中,采取在词典和规则中加入介词的语义属性和上下文相关函数等措施,比较好地解决了介词多义的问题。从而,使“智能型英汉机器翻译系统”的译准率大大提高。  相似文献   

8.
英汉机器翻译系统中介词多义的处理方法   总被引:2,自引:0,他引:2  
在英汉机器翻译中,英语介词多义的处理是最难解决的问题之一。尽管国内外一些机器翻译专家在这方面已做了许多工作,并获得一些成果,但远未能彻底解决这一问题。在对英语介词的多义现象进行分类的基础上,以介词“in”为例对其多义现象进行了详细的分析研究。在研制“智能型英汉机器翻译系统”中,采取在词典和规则中加入介词的语义属性和上下文相关函数等措施,比较好地解决了介词多义的问题。从而,使“智能型英汉机器翻译系统”的译准率大大提高。  相似文献   

9.
针对甲骨文字形多变、异体字多等特点, 通过对甲骨字的构成分析, 提出一种基于语义构件的甲骨文字库自动生成方法。该方法以动态描述库为基础, 通过算法提取甲骨字的构件特征信息, 重组笔元生成语义构件, 再给语义构件加上特征描述生成构件知识库。通过仿射变换重复使用语义构件自动生成任意甲骨字。实验表明, 该方法能有效解决甲骨文无字库输入的实现, 还可以解决甲骨字编码、构件统计、未释字的考释等。  相似文献   

10.
神经机器翻译是目前机器翻译领域主流研究方法,但是蒙汉平行语料的稀缺使得蒙汉神经机器翻译性能难以提升.本文针对基于Transformer的蒙汉神经机器翻译系统,利用深度学习模型对蒙古文词切分方法进行研究,分析了蒙古文部分切分、BPE子词切分和BiLSTM-CNN-CRF神经网络切分方法对于蒙汉机器翻译模型的影响,并在此基础上利用基于BERT(bidirectional encoder representations from Transformers)中文语义相似度计算的数据增强技术去扩充蒙汉机器翻译训练数据.在CCMT2019提供的数据集上进行对比实验,实验结果表明,数据增强方法的BLEU值相较于基线实验提升显著,且BLEU4值达到了75.28%.  相似文献   

11.
甲骨文的白话释读是甲骨文信息处理研究中的一个重要环节。通过引入计算机辅助翻译的技术,将已经过甲骨文专家确认正确的现代汉语释读存储在翻译记忆库中,实现了专家知识的共享和重用。基于翻译记忆的辅助翻译技术对大多数的甲骨文句子,准确率为74.3%,对残缺部分较多或含未释字较多的甲骨文句子,准确率为27.2%,基本满足甲骨文研究需要。基于上述技术,实现了一个甲骨文计算机辅助翻译系统。实验结果证明,该系统可提高信息工作者和甲骨文专家的研究效率。  相似文献   

12.
为了解决现有句子相似度算法未考虑句子语义信息的问题,提出了一种基于词法、句法和语义的句子相似度计算方法.将句子相似度分为词法层、句法层、语义层3个层次.在词法层,通过构建句子的词汇相似度矩阵和数字序列相似度矩阵来计算词法相似度;在句法层,使用概念词汇转化成的RDF三元组相似度来计算句法相似度;在语义层,基于本体树状结构中最短路径表示的语义距离来计算语义相似度.然后,提出句子语义相似度计算模型,采集图书领域句子对作为测试集,构建图书领域本体作为知识源.实验结果表明,所提方法具有更高的准确率和召回率,其F-度量值达0.649 9,与余弦相似度算法、基于编辑距离的算法和基于TF-IDF的算法相比分别提高约12%、17%和16%.  相似文献   

13.
回顾基于规则的机器翻译中的文本处理、文本分析、词典构成、词典查询和语义排歧技术,指出基于规则的机器翻译因为词义选择、层次切分、特殊句型结构等固有难题难以圆满解决,只有发展新的翻译技术,才能使机器翻译质量达到实用水平.  相似文献   

14.
提出了一种汉-维句子对齐混合算法,它是以基于词典的方法为主、基于长度的方法为辅的一种混合对齐算法.目的在于建立一个以汉文-维文平行语料库及面向政府文献的汉-维机器翻译为应用背景的,实用汉-维句子对齐系统.  相似文献   

15.
语义相似度计算在自然语言理解与处理、信息检索、知识获取、机器翻译等领域具有重要作用.近年来,随着知识本体和知识图谱研究的深入,面向复杂关系处理的结构化知识表达手段更为丰富和强大,从而推动了基于本体的语义相似度计算方法的快速发展.基于本体的语义相似度计算大致分为基于距离的方法、基于信息量的方法、基于属性的方法和混合式方法 4种代表性方法.回顾了上述方法的发展脉络,分析了各自的基本思想和主要实现方法,并对其优缺点进行了系统比较.最后总结了语义相似度的评测方法,并在此基础上,展望了基于本体的语义相似度计算方法的发展方向.  相似文献   

16.
平行句对抽取是解决低资源神经机器翻译平行语料不足的有效途径.基于孪生神经网络的平行句对抽取方法的核心是通过跨语言语义相似度判断2个句子是否平行,在相似的语言对上取得了非常显著的效果.然而针对英语东南亚语言双语句对抽取任务,面临语言空间和句子长度存在较大差异,仅考虑跨语言语义相似度而忽略句子长度特征会导致模型对仅有语义包含关系但不平行句对的误判.笔者提出一种结构特征一致性约束的双语平行句对抽取方法,该方法是对基于孪生神经网络的双语平行句对抽取模型的扩展,首先通过多语言BERT预训练语言模型在嵌入层将两种语言编码到同一语义空间,以此缩小语义空间中语言的差异.其次分别对两种语言句子的长度特征进行编码,与孪生网络编码后的句子语义向量进行融合,增强平行句对在语义及结构特征上的表示,降低模型对语义相似但不平行句对的误判.在英缅双语数据集上进行实验,结果表明提出的方法相比基线模型准确率提高了4.64%,召回率提高了2.52%,F1值提高了3.51%.  相似文献   

17.
回顾基于规则的机器翻译中的文本处理、文本分析、词典构成、词典查询和语义排歧技术,指出基于规则的机器翻译因为词义选择、层次切分、特殊句型结构等固有难题难以圆满解决,只有发展新的翻译技术,才能使机器翻译质量达到实用水平.  相似文献   

18.
机器翻译属于人工智能中的一个领域,在现代工业技术中的地位越来越重要.但机器翻译中通常会遇到的歧义问题大大影响了机器对自然语言的理解.使机器翻译的难度加大,译文可读性极差.本文主要讨论机器翻译中存在的歧义问题,以及基于词汇和句法的处理歧义问题的常用方法.  相似文献   

19.
在本体工程中,处于演变过程中的本体常出现不一致性问题,这将导致基于本体的推理失效.为解决推理失效的问题,提出了一种新的处理DL-Lite本体实例断言中冲突的不一致容忍语义,讨论了新的不一致容忍语义与已有的不一致容忍语义的关系,给出了在新定义的不一致容忍语义下的修复算法并做了新语义下推理任务的复杂度分析.  相似文献   

20.
针对基于位置服务(LBS)中缺乏语义基础的问题,分析了LBS涉及的数据和服务特点,设计了用于识别和关联语义相关概念的混合结构本体,对其进行建模.该方法克服了LBS中可能出现的语义异质问题,便于用户和服务之间进行概念的共享和交换.示例的结果,表明了基于本体的LBS在克服语义异质问题上的优点.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号