首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
双语平行语料库是多语种自然语言处理的重要资源,已被广泛地应用于机器翻译、机助人译、翻译知识抽取与跨语言信息检索等领域中。本文针对汉语-印尼语平行语料的自动对齐与可比语料的自动提取问题,提出了基于锚点和词典相结合的段落对齐方法,并在此基础上采用基于置信区间的长度模型实现句子对齐,同时,为了快速提高汉语-印尼语平行语料库的构建效率,还提出了基于跨语言文档相似度的可比语料提取方法。实验结果表明,本文提出的平行语料对齐方法和可比语料提取方法的准确率较传统方法有显著的提高,说明本文提出方法是有效的、可行的。  相似文献   

2.
为了解决汉英平行语料中带噪声的问题,通过设计规则方法、统计方法(包括Zipporah系统、词对齐模型、语言模型)以及神经网络方法(包括翻译模型和双语预训练模型),从不同侧重点对汉英句对平行程度进行度量.结果表明翻译模型和双语预训练模型在过滤优质平行语料任务上有良好表现.最后,对于表现优异的方法,按照加法和乘法两种方式进...  相似文献   

3.
冉庆鹏 《科技信息》2012,(9):151-152
本文对平行数据处理使用了参数估计方法,阐述了给定数据的情况下,如何对模型进行识别,设定正确的模型。并对江苏省各收入组的消费函数以及分类消费函数进行识别与分析。  相似文献   

4.
为了改变计算机必须依靠文本才能进行评分的情况,该文在国内首次开展了面向大规模英语口语机考中的复述题型自动评分技术研究,并证明了其技术可行性。首先基于连续语音识别、自然语言理解等技术搭建了复述题自动评分技术流程,并针对复述题无需按原文复述、考试现场录音质量低等难点,通过借助朗读题录音的声学模型自适应处理、基于复述原文的通用语言模型裁剪、基于识别输出词图的机器评分特征提取等一系列的改进工作的开展,最终完成的自动评分系统在339份中国科学技术大学期末考试现场采集的复述题数据集上达到了专家精细评分84%的性能,超过了教师批量阅卷时的性能。实验结果表明该系统在英语复述测试中,可以辅助教师进行更科学客观的评分。  相似文献   

5.
针对图像识别中获取全局特征的局限性及难以提升识别准确性的问题,提出一种基于随机增强Swin-Tiny Transformer轻量级模型的图像识别方法.该方法在预处理阶段结合基于随机数据增强(random data augmentation based enhancement, RDABE)算法对图像特征进行增强,并采用Transformer的自注意力机制,以获得更全面的高层视觉语义信息.通过在玉米病害数据集上优化Swin-Tiny Transformer模型并进行参数微调,在农业领域的玉米病害上验证了该算法的适用性,实现了更精确的病害检测.实验结果表明,基于随机增强的轻量级Swin-Tiny+RDABE模型对玉米病害图像识别准确率达93.586 7%.在参数权重一致,与性能优秀的轻量级Transformer、卷积神经网络(CNN)系列模型对比的实验结果表明,改进的模型准确率比Swin-Tiny Transformer, Deit3_Small, Vit_Small, Mobilenet_V3_Small, ShufflenetV2和Efficientnet_B1_Pruned模型提高了...  相似文献   

6.
D-S证据理论数据融合方法在目标识别中的应用   总被引:52,自引:0,他引:52  
为解决车辆目标识别问题 ,采用基于推理的数据融合方法 ,分析了 Dempster- shafer证据理论用于多传感器数据融合的基本概念和理论 ,并将它应用于车辆目标识别的数据融合中 ,实验结果证明了基于融合后的识别结果较单传感器的识别结果好 ,验证了这一方法的正确性和有效性  相似文献   

7.
内蒙古各大湖泊和湿地是野生鸟类的聚集地,对野生鸟类进行准确识别是进行鸟类保护和习性分析的基础.大量试验证明,卷积神经网络在大规模数据集上训练后具有良好识别效果.但获取野生鸟类图像存在一定难度,很难得到足够的样本量.为提高小样本野生鸟类图像的识别准确率,防止网络训练过程中的过拟合问题,通过改进VGG16的预训练,设计了一...  相似文献   

8.
通过对英语教师口语语料的分析,从母语使用、教师提问语和指令语等角度,运用关联规则探讨教师隐性知识显性化和学生隐性知识构建的认知过程,统计实验结果证明了研究方法的适用性和可行性。  相似文献   

9.
幽默作为一种特殊的语言表达方式,是生活中活跃气氛、化解尴尬的重要元素。随着人工智能的快速发展,如何利用计算机技术识别和生成幽默成为自然语言处理领域热门的研究内容之一,并逐渐形成一个新兴研究领域:幽默计算。幽默计算致力于利用自然语言处理技术理解和识别包含幽默的文本表达,挖掘幽默表达潜在的语义内涵,构建面向幽默表达的计算模型。首先对当前幽默计算的背景进行概述,阐明幽默的可计算性和幽默计算对于人工智能的意义;在此基础上,对幽默研究的发展情况进行回顾,给出幽默研究的语言学基础;然后综述当前幽默计算在幽默识别和幽默生成两个方面的进展情况,分别给出针对幽默识别和幽默生成的计算框架;最后,对幽默计算在聊天机器人、机器翻译、儿童教育软件和外语教学等多个自然语言处理任务中的应用前景和应用模式进行展望。希望通过对幽默计算及其应用研究的总结和概述,完善现有幽默计算模型,增进计算机对于自然语言的理解,推动人工智能的进一步发展。  相似文献   

10.
机器翻译是人工智能领域的热点问题。在实际应用过程中,平行语料库的收集和构建直接影响机器翻译的效果。随着我国数字业务的快速发展,以及“一带一路”背景下国际交流频率的不断增加,中哈互译需求凸显。针对汉哈文机器翻译个性化的技术要求,结合哈萨克语的特点,本文提出一种基于信息内容比例的段落对齐方法,开发设计了辅助工具软件Corpus,利用该工具对汉-哈文之间的段落对齐进行可视化,并利用段落对齐方法进行数据的编排存储。实验结果表明,基于本文提出的方法,汉-哈平行篇章与段落手工对齐正确率达到94.5%,95.2%;自动对齐正确率达到87.5%,89.3%,能够提升平行文本的对齐质量,成功建立篇章与段落对齐的汉-哈平行语料库。  相似文献   

11.
徐春 《科技信息》2011,(17):I0104-I0105
平行语料库研究是近年来语料库语言学横向发展的新趋势。人们清楚的认识到大规模的高质量汉英平行语料库在自然语言处理、比较语言学研究和第二语言教学等众多领域中的巨大价值。文章介绍了一个大规模汉英双语平行语料库的构建系统,利用互联网上存在的海量多语言文本资源,通过网页的内容分析和链接分析,实现了一个双语语料挖掘的自动获取系统,包括其总体规划、实施模型和流程细节。目的是通过学习国内外资料。最终建设一个基于互联网的平行语料库自动构建系统。  相似文献   

12.
Translation lexicons are fundamental to natural language processing tasks like machine translation and cross-language information retrieval. This paper presents a lexicon builder that can auto-extract (or assist lexicographer in compiling) the word translations from Chinese-English parallel corpus. Key mechanisms in this builder system are further described, including co-occurrence measure, indirection association resolution and multi-word unit translation. Experiment results indicate the effectiveness of the authors‘ method and the potentiality of the lexicon builder system.  相似文献   

13.
蒙古语语料库的研究与建设   总被引:3,自引:0,他引:3  
论述了蒙古语语料库的建设所涉及的重要问题.详细讨论了语料库的结构,包括总体框架结构和实现的表结构,语料的加工及统计分析.简单介绍了蒙古语语料库在语音合成、形码到音码的转换、文字识别后处理方面的应用.  相似文献   

14.
语料库在英语教学中的应用   总被引:1,自引:0,他引:1  
杨小平 《太原科技》2006,(2):71-72,75
就语料库在教学方面的发展进行了探讨。重点阐述了语料库在语言研究方面和高校英语教学实践中的应用。  相似文献   

15.
作为词头的"兆"和作为数量单位的"兆"在含义上分歧很大,造成了"兆"在使用上的困扰。取消"兆"作为"百万"词头以及重新定位其表示"万亿"的含义,不仅具有较高的理据性,同时也具有较强的可行性。  相似文献   

16.
陈爱兵 《南昌高专学报》2011,26(1):69-71,77
双语语料库作为有效的翻译辅助工具,在翻译实践中,主要有三方面的应用价值:为检索词提供最佳的翻译等值单位;有利于克服思维定势的负效应,提高译文质量;有助于提高译者的跨文化意识.  相似文献   

17.
Parallel corpus is of great importance to machine translation,and automatic sentence alignment is the first step towards its processing.This paper puts forward a bilingual dictionary based sentence alignment method for Chinese English parallel corpus,which differs from previous length based algorithm in its knowledge-rich approach.Experimental result shows that this method produces over 93% accuracy with usual English-Chinese dictonaries whose translations cover 31.88%-47.90% of the corpus.  相似文献   

18.
分析了研究者们在多词单位抽取算法中的一些工作,包括多词单位的评分和选择.将评分算法根据它们的设计依据划分为3类,对它们进行总结分析,并用实验进行了验证.本文还分析了多种评分算法的组合方法,使用这些组合方法可以互补各种评分算法,达到更好的抽取效果.  相似文献   

19.
技术哲学领域的知识创新是一个有待深入研究的课题,如何借助计算机,自觉创造人机共生的知识创新机制,实现知识创新的全面提高,仍然值得进一步研究。阐释了语料库建设对技术哲学研究的作用,介绍了语料库建设的支撑技术,并分析了哲学与计算机科学的相互关系。  相似文献   

20.
分析翻译课程中多模态学习者双语语料库的构建问题。将计算机辅助翻译(CAT)技术纳入翻译教学,利用CAT平台,构建包含文本、视频等多种模态的新型学习者双语语料库,并以雪人翻译软件为例,探讨多模态学习者双语语料库构建的选材、语料加工、检索等问题以及具体构建步骤和方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号