首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
通过查阅文献,依据蒙古文语法中的词法,分析了蒙古文词的相关属性,然后使用软件工程中的快速原型模型创建分析蒙古文词的模型,并用VB编程语言实现自动分析蒙古文词的程序,完成了自动分析所输入蒙古文词的构成及属性的任务,最后使用实验方法选择小样本测试实例,对该程序进行黑盒测试,测试结果表明,该程序分析蒙古文词的准确率达到90%以上.  相似文献   

2.
基于支持向量机的中文文本中地名识别   总被引:2,自引:0,他引:2  
提出并实现了一种基于支持向量机(SVM)的中文文本中地名的自动识别方法.结合地名的特点,抽取单字本身、基于字的词性、是否在地名特征词表中及其上下文的信息作为向量的特性,并将其转化为二进制表示,在此基础上建立了训练集,并通过对多项式Kernel函数的测试,得到了用支持向量机进行地名识别的机器学习模型.实验表明,所建立的SVM地名识别模型是有效的,系统开式召回率和精确率分别达86.69% 和93.82%,F-值为90.12%.  相似文献   

3.
蒙古文OpenType 字体制作技术   总被引:3,自引:0,他引:3  
简要介绍了蒙古文主要特征和有关基于U n icode编码标准的O penT ype字库,然后介绍了蒙古文名义字符转换为变形显现字符的一些主要的变化规则,在此基础上提出了蒙古文O penT ype字库设计方法.最终显示了结果.  相似文献   

4.
简要介绍了蒙古文字的主要特征及其基于Unicode编码标准的蒙古文OpenType字库,接着介绍了蒙古文名义字符转换为变形显现字符的一些主要变化规则.然后介绍了GNOME平台的多种语言文字处理模块-Pango 库处理 OpenType 字体的方法.在此基础上为Linux-GNOME平台的Pango库增加蒙古文处理模块,实现了在Linux-GNOME通用编辑器中蒙古文的正确显示.  相似文献   

5.
汉语–新蒙古文命名实体翻译在跨汉语–新蒙古文信息处理中具有重要意义,而直接使用机器翻译的方法不能达到满意的结果。针对上述问题,提出一种从汉语–新蒙古文平行语料中自动抽取汉语–新蒙古文命名实体翻译对的方法。该方法只需对汉语端进行命名实体标注;然后基于双语HMM词对齐结果,利用滑动窗口的方法抽取所有候选命名实体翻译对;最后基于融合5种特征的最大熵模型,对所有候选翻译单位进行过滤,选取与汉语端命名实体相对应的置信度最高的新蒙古文命名实体翻译单位。实验结果表明,该方法优于基于HMM的方法,在对齐模型只是部分准确的情况下,也获得较高准确率的汉语–新蒙古文命名实体翻译对。  相似文献   

6.
CRF与规则相结合的中文地名识别   总被引:2,自引:0,他引:2  
采用递增式学习策略优化条件随机域(conditional random fields,CRF)的特征模板以提高中文地名的识别效果,结合语言学相关知识构建规则库,以弥补机器学习模型获取知识不够全面导致召回率偏低的不足,最终实现了CRF与规则相结合的中文地名识别系统.实验结果表明,采用CRF与规则相结合的方法识别中文文本中的地名是有效的,对Bakeoff2007NER任务的MSRA语料进行开放测试,召回率、精确率和F值分别为94.67%、92.35%和93.50%.  相似文献   

7.
现有蒙古文文字存在元样本尺寸较小、使用标准VGG-Net进行字元识别不能达到较好效果的问题,提出基于改进VGG-Net的蒙古文字元识别方法。通过改进的VGG-Net模型对手写蒙古文字元图像数据增强后的23类手写蒙古文字元样本进行识别。结果表明,改进的VGG-Net对字元图像识别的准确率达到96.83%,相比传统VGG-Net模型识别速度更快,准确率更高,占用储存空间更少。  相似文献   

8.
蒙古文信息处理由于诸多原因,造成多种编码共存,现有的大量信息资源无法共享.大多数系统的蒙古文编码以蒙古文显现字符为基本编码单位,属于字形编码.本文讨论的问题是首先将不同种类的蒙古文字形编码转换为蒙古文最小字素编码,再根据蒙古文正字法对照词典及有关规则,转换为蒙古文国际编码.  相似文献   

9.
对蒙古文数据的查找方法进行了分析,给出了一种新的蒙古文数据的查找方法--最小字素查询方法.该方法中首次提出了蒙古文按字形查找的思想,解决了蒙古文多字同形特点所带来的查找方面的难点.  相似文献   

10.
用样式表制作蒙文网页   总被引:2,自引:2,他引:2  
蒙古文信息网络化中最难解决的问题之一是蒙古文网页的制作.蒙古文字的结构和书写方式与其它文种相比有自己的特点,再加上蒙古文字库编码的不统一等原因,一直影响蒙古文网页制作.针对蒙古文的书写特性提出了利用样式表的文本特性制作蒙古文网页的方法,使制作出的蒙古文网页中的蒙古文字按字符方式显示,并能实现蒙、汉、英文混排显示.  相似文献   

11.
从国内外蒙古文信息处理现状、蒙古文国际标准与字库、蒙古文信息处理关键技术等几个方面简述了蒙古文信息处理技术发展历程,并对蒙古文信息处理应用价值及存在的问题进行了分析,希望以此可以为推进蒙古文信息处理工作提供良好的参考作用。  相似文献   

12.
2000年内蒙古自治区科技进步奖评奖揭晓,我校赵小兵副教授等研制的“蒙古文Windows 操作系统”获科技进步三等奖.该成果首次在Windows环境下实现了蒙古文信息处理,对蒙古文信息处理有着重要的应用价值,对蒙古民族科学文化的现代化、信息化将产生深远的影响.赵小兵等获2000年内蒙古自治区科技进步三等奖  相似文献   

13.
蒙古文字体清晰显示研究   总被引:1,自引:0,他引:1  
随着蒙古文网站开发技术的成熟,蒙古文网站层出不穷.但是蒙古文网站中的蒙文字体与中文、英文字体相比不是模糊发虚就是有明显的锯齿,针对这个问题本文首先分析了字库显示技术的现状,并着重介绍了影响字体清晰显示的Hinting技术,之后对蒙古文字体的清晰显示进行了分析.  相似文献   

14.
神经机器翻译是目前机器翻译领域主流研究方法,但是蒙汉平行语料的稀缺使得蒙汉神经机器翻译性能难以提升.本文针对基于Transformer的蒙汉神经机器翻译系统,利用深度学习模型对蒙古文词切分方法进行研究,分析了蒙古文部分切分、BPE子词切分和BiLSTM-CNN-CRF神经网络切分方法对于蒙汉机器翻译模型的影响,并在此基础上利用基于BERT(bidirectional encoder representations from Transformers)中文语义相似度计算的数据增强技术去扩充蒙汉机器翻译训练数据.在CCMT2019提供的数据集上进行对比实验,实验结果表明,数据增强方法的BLEU值相较于基线实验提升显著,且BLEU4值达到了75.28%.  相似文献   

15.
研究地名文化景观特征及分布,对挖掘地名文化内涵,保护、传承和弘扬优秀传统地名,都具有重要意义。以《陆良县地名志》所载的地名为研究对象,运用统计分析方法对陆良县地名文化景观进行分类,借助GIS核密度估计法,揭示陆良县地名文化景观的空间分布特征。研究表明:1)陆良县地名以人文景观类地名为主,占陆良县地名总数的70.88%,人文景观类地名中,人工建筑类地名最多,也是陆良县地名总数中占比最多的地名,占陆良县地名总数的26.24%,蕴含着区域悠久的人类历史文化和频繁的人类活动;自然景观类地名占陆良县地名总数的29.12%,其中,山类地名最多,占陆良县地名总数的18.57%,是陆良县地名总数占比居第二的地名。2)自然景观类地名集中分布在北部、西部、中部和东部地区,与自然地理环境特征表现出高度的一致性;人文景观类地名主要集中分布在地势平缓的坝子地区,与人类活动和人口分布趋于一致性。3)陆良县复杂多样的自然地理环境所孕育的爨文化、农耕文化、军垦文化以及民族文化,共同造就了陆良县地名文化景观的独特性和综合性。  相似文献   

16.
一个地方的命名总有其根据,或依据自然因素,或依据人文因素,因此一个地名会反映当地的自然特征或人文特色.本文运用统计法、分类法和综合分析法对河南省开封市五县的行政村级地名进行剖析,探索地名命名的规律方法,归纳命名原则.通过对开封市五县的2 132个行政村的地名分析,得出地名的典型特征为地域性、文化性和独特性.依照地名所反映的信息将地名划分为三大类:自然地理类、人文地理类和其他因素类.其中人文地理类因素的地名所占比重最大,尤其是姓氏类和军事类地名,这在一定程度上说明家族延续兴旺和历史军事原因形成的地名是开封市五县行政村地名的主流,切实反映了地名形成的悠久和演变的复杂.  相似文献   

17.
地名具有很强的地域性,承载着一定地域历史时期以来的地理、历史或文化状况,具有一定的研究价值.本文以上海市地名为研究对象,采用分类统计法和GIS技术,对各行政级别的地名文化景观特征和成因进行研究,对探索上海历史时期社会经济发展状况具有借鉴意义.研究指出:自然景观类地名多分布于东部、西南部,与上海的自然地理特征相吻合;东部与东南部是文化类地名的集中区,但各类文化地名的分布也存在着差异.上海地名文化景观特征反映出历史以来上海市独特的盐文化、海防文化、园林文化、建筑文化以及移民文化.  相似文献   

18.
本文以湖南长沙市地名为研究对象,采用统计法、分类及分析与综合法等研究方法,对村级地名所体现的地理要素特征进行研究.将湖南长沙市村级地名分为自然地名和人文地名两大类,有助于人们更好地了解和认识地理环境因素对村级地名形成的影响,探索长沙市地名的空间分布特点和规律.  相似文献   

19.
以江西省石城县客家地名为研究对象,借助K均值聚类和空间插值方法对自然景观地名和人文景观地名进行聚类分析和特征研究.结果表明,石城县地名点在空间上呈聚集分布状态,中部地区的地名密度高于北部和南部地区,这与石城县的自然地貌特征相一致.在聚类结果中,从自然景观角度来看,山貌、水系地名多于动植物、耕作地名,反映出石城县"八山半水一分田"的自然地理特征和客家"山地文化"的特色;从人文景观角度来看,建筑交通地名少于方位、方言和美愿地名,印证了石城县"半分道路和庄园"的人文景观特征和客家方言的特色.说明石城县的地名文化景观深植于自然与文化地理特征中,同时也体现了不同历史时期客家文化的交融与整合.  相似文献   

20.
自然环境对地名的形成有重要的影响,自然环境要素可以分为地形地貌、水体、生物、土壤、气候和其他自然特征.茂名市自然环境相关的地名中地形地名和水体地名数量最多,它们的空间分布受到茂名市地形的影响.茂名市生物地名可以分为与植物相关和与动物相关的地名;土壤地名可以分为与土壤颜色和土壤质地相关的地名,土壤颜色以红色系为主,土壤质地以砂质为主;气候地名主要与降水相关.其他自然特征地名主要为数量和颜色,多和地形、水体等自然要素或人文要素结合起来,起修饰的作用.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号