首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
汉语–新蒙古文命名实体翻译在跨汉语–新蒙古文信息处理中具有重要意义,而直接使用机器翻译的方法不能达到满意的结果。针对上述问题,提出一种从汉语–新蒙古文平行语料中自动抽取汉语–新蒙古文命名实体翻译对的方法。该方法只需对汉语端进行命名实体标注;然后基于双语HMM词对齐结果,利用滑动窗口的方法抽取所有候选命名实体翻译对;最后基于融合5种特征的最大熵模型,对所有候选翻译单位进行过滤,选取与汉语端命名实体相对应的置信度最高的新蒙古文命名实体翻译单位。实验结果表明,该方法优于基于HMM的方法,在对齐模型只是部分准确的情况下,也获得较高准确率的汉语–新蒙古文命名实体翻译对。  相似文献   

2.
阐述了蒙古文单词音节自动拆分软件的设计过程.该软件能够自动拆分一个蒙古文词的音节构成.并能判断构成单词的音节个数及音节类型.  相似文献   

3.
根据蒙古文地名的特点,引入词性特征、字典特征、实体指示词特征以及外文地名用词特征,基于条件随机场模型对蒙古文地名自动识别问题进行研究.结果表明,该模型对蒙古文地名识别的准确率为95.45%,召回率为79.41%,F值为86.70%.  相似文献   

4.
实用高效的蒙古文词切分方法是实现蒙古文信息处理的前提和基础.研究提出从3种基本的蒙古文词切分方法,组合成12种蒙古文词切分方法.应用数据包络分析(DEA)方法,提出用于蒙古文词切分方法综合评价的数学模型和有效性计量公式,并围绕蒙古文切词方法的智能选择问题,提出基于国际标准编码的蒙古文词切分系统的设计方法和整体框架.  相似文献   

5.
CPN(Coloured Petri Nets)非常适用于描述和分析含有并发、同步和通信等情况的复杂系统。该文提出了一种面向CPN属性的自动生成测试序列的方法。首先给出了CPN属性的形式化定义,然后根据系统的CPN模型给出了面向CON属性生产测试序列的算法,并应用该算法完成了面向CPN属性的测试序列自动生成工具的开发。这对于CPN t00Is也是个非常有效的扩展。  相似文献   

6.
以蒙古文编码国家标准的研制及其系统实现方面的工作为基础,针对蒙古文复杂文本布局引擎(CTL Engine)及其OpenType字库的系统结构,提出蒙古文复杂文本布局引擎的标准符合性测试(Conformance Test for Standards)方案,定义蒙古文复杂文本布局引擎的测试点及其测试实例,并以关键软件系统为依托测试和分析Uniscribe和HarfBuzz等支持蒙古文的复杂文本布局引擎。  相似文献   

7.
本文提出以自然语言为界面实现程序自动生成的研究成果。该研究系统使用面向对象的方法与技术,以自然语言为输入界面,使用扩充的格语法进行语法语义分析,将用户描述的VC 期望程序功能的汉语篇章依次进行自动切词处理、语法处理、语义分析理解、目标程序的自动生成,最终形成满足用户要求且符合Visual C 语法的结果程序。  相似文献   

8.
基于三维CAD/CAE集成系统,提出了一种考虑模型理想化过程的船舶有限元属性自动继承方法.充分利用CAD/CAE系统集成的特点,选用特征点简化几何匹配过程,采取包容盒初筛剔除无关单元减少计算量;计算精确距离校正几何匹配结果,定义处理规则解决模型理想化造成的例外情况,提取已有模型文件中的几何属性作属性源防止数据冗余.在NX11.0平台上,以C++语言对该方法进行编程实现.最后以实际船舶模型为例进行测试,结果表明:该有限元属性继承方法充分考虑模型理想化的影响,统一了例外情况的处理规则,自动完成属性继承过程,降低了属性赋予错误的可能,显著提高了有限元建模效率.  相似文献   

9.
一种基于CPN的协议测试序列生成方法   总被引:1,自引:0,他引:1       下载免费PDF全文
针对状态空间规模较大的协议,提出了一种基于着色Petri网CPN(colored petri net)、面向属性的协议一致性测试序列生成方法。 首先, 构建被测协议规范的CPN模型, 即协议模型, 并将被测协议的若干功能属性采用CPN进行形式描述, 形成属性模型。 提出了属性模型到协议模型的状态投影算法、模型状态空间的路径匹配算法和搜索算法, 基于这些算法给出了一种完整的基于属性的测试序列生成方法。 该方法不但可以有效避免协议规模庞大所导致的状态爆炸问题, 而且还对测试中的PCO库所进行了特殊标识, 完成测试序列中可观察元素的自动提取处理, 使得处理后的测试序列可直接用于协议实际测试过程。 为有效验证所提测试序列生成方法的可行性, 开发了一套实现该方法的软件, 并应用于HMIPv6协议的实际测试过程中。实践表明, 这套软件可以对较为复杂的协议一致性测试过程提供强有力的支持。  相似文献   

10.
对蒙古文数据的查找方法进行了分析,给出了一种新的蒙古文数据的查找方法--最小字素查询方法.该方法中首次提出了蒙古文按字形查找的思想,解决了蒙古文多字同形特点所带来的查找方面的难点.  相似文献   

11.
神经机器翻译是目前机器翻译领域主流研究方法,但是蒙汉平行语料的稀缺使得蒙汉神经机器翻译性能难以提升.本文针对基于Transformer的蒙汉神经机器翻译系统,利用深度学习模型对蒙古文词切分方法进行研究,分析了蒙古文部分切分、BPE子词切分和BiLSTM-CNN-CRF神经网络切分方法对于蒙汉机器翻译模型的影响,并在此基础上利用基于BERT(bidirectional encoder representations from Transformers)中文语义相似度计算的数据增强技术去扩充蒙汉机器翻译训练数据.在CCMT2019提供的数据集上进行对比实验,实验结果表明,数据增强方法的BLEU值相较于基线实验提升显著,且BLEU4值达到了75.28%.  相似文献   

12.
一种基于程序状态的随机测试模型   总被引:1,自引:0,他引:1  
讨论了马尔可夫链模型在随机程序测试中的应用。在建立了程序的马尔可夫链测试模型和马尔可夫链使用模型的基础上,提出了衡量测试完备性的量化计算公式和估计程序平均失败频率的计算公式。测试结果证实了其可行性和正确性。  相似文献   

13.
基于Mealy机的蒙古文排序算法   总被引:1,自引:0,他引:1  
排序是语言文字信息处理中的重要工作之一,它的目的是将单词(或词组)的任意序列重新排列成按关键字有序的序列,从而优化存储结构,提高检索速度.但由于蒙古文排序习惯和其"UCS"编码的特殊性,单词排序不能完全依靠字符编码的自然顺序.单词的排列顺序不仅与字符编码有关,而且与字符状态有着密切的关系.因此先给出字符状态和词状态的定义,然后提出一种基于Mealy机的字符串排序算法.该算法是传统的字符串排序算法的一种扩展,主要解决了编码相同状态不同情况下词的排序问题,并且在传统蒙古文排序中的应用证实了算法的有效性.该算法具有很好的适应性,能够解决其它一些复杂文本语言的排序问题.  相似文献   

14.
通过分析蒙古语的词组能够辨别出蒙古语中的一些突厥语借词,我们称其为词组分析法。使用词组分析法对蒙古语中由同义或近义的两个词构成的词组进行分析,发现通过此方法可以辨别出蒙古语中的一些突厥语借词。  相似文献   

15.
可编程逻辑控制器(PLC)是工业控制领域中广泛使用的自动控制装置。由于PLC程序缺乏具有普适性的测试工具,开发人员往往只能采用人工方式排查代码错误,导致测试效率低下。工业用户亟需一种标准化PLC代码检测方法,自动完成PLC程序语法检测与分析。该文以IEC61131-3标准为基础,建立基于Backus-Naur范式(BNF)的指令表语法模型。基于该模型构造抽象语法树,进而设计出一种具有线性复杂度的PLC指令表代码语法检测算法。利用2段控制工程中的PLC指令表代码对所提出的算法与商用软件CODESYS Static Analysis进行对比测试,验证了所提算法的可用性。  相似文献   

16.
词向量具有良好的语义特性,可用于改善和简化许多自然语言信息处理应用。本研究利用CBOW和Skip-gram两种模型架构在不同数据和不同维度下训练蒙古语词向量,然后结合蒙古语特征设计一个语义语法综合测试集,并在此测试集上用语义和语法相似度来评测词向量质量。研究结果表明,蒙古语语义和语法相似性任务上,Skip-gram模型优于CBOW模型,Skip-gram模型的窗口大小为5的情况下,词向量质量最好,且随着词向量维度或训练数据的增大,词向量质量有明显的提高。  相似文献   

17.
蒙古文字体清晰显示研究   总被引:1,自引:0,他引:1  
随着蒙古文网站开发技术的成熟,蒙古文网站层出不穷.但是蒙古文网站中的蒙文字体与中文、英文字体相比不是模糊发虚就是有明显的锯齿,针对这个问题本文首先分析了字库显示技术的现状,并着重介绍了影响字体清晰显示的Hinting技术,之后对蒙古文字体的清晰显示进行了分析.  相似文献   

18.
由于手工法生成的测试例具有随机性、不确定性和不完整性,因此提出了一个自动生成测试例的方法,使用该方法生成的测试例比运用手工法生成的测试例准确、完整.该方法首先为OSPFv3协议的邻居状态转换过程建立了部分的EFSM模型,然后遵循故障模型的故障类型标准,使用数据流与控制流相结合的方法自动生成测试序列,对生成的测试例经过测试发现了协议实现的一些错误.  相似文献   

19.
运用语料库语言统计方法对中文文中自动查错的有关问题进行探讨,运用词二元接续关系进行查错,主要依据词二元同现概率,互信息,t-测试差,其中,t-测试差是首次被应用于查错。  相似文献   

20.
Windows环境下蒙古文复杂文本处理的研究   总被引:1,自引:0,他引:1  
简要介绍了复杂文本和Uniscribe布局引擎,然后介绍一种基于Uniscribe的蒙古文Unicode文本的解释算法,解决Windows环境下字处理软件不支持蒙古文国际标准编码的问题.该算法具有较好的通用性,能够有效处理多种复杂文本语言,在蒙古文字处理软件MWord中的应用说明了该算法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号