首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
介绍了规范彝文字词频度统计的设计及应用程序.首先阐述了研究开发该软件的必要性和重要意义:然后介绍了用于统计的彝语语料库;讨论了统计的算法;最后根据国际彝文编码的基本原则,词汇的频度、频率、累计频率以及通用度原理结合规范彝文的特点设计字词频统计系统.  相似文献   

2.
榕江位于贵州省黔东南州的东南部,按现代汉语方言划分的区域,榕江方言属于北方方言的西南方言。但由于受当地方音上语的影响,与普通话相比较,差别很大。其差别主要表现在声母、韵母两个方面。一、声母榕江方言声母与普通话声母之间存在着较大差异。其主要是几组声母相混的问题。因而榕江人要学好普通话,必须把握好两者之间的对应规律,并寻求有效方法加以辨证。(一)声母的对应特点1、检江方言一般没有以山、oh、山为声母的音节,普通话里以出、Ch、北为声母的音节,格江方言对应归并到以z、c、s为声母的音节去了。2格江方言h一般不…  相似文献   

3.
贵州古彝文与汉语在句法结构上属于非单调对称语言,在机器翻译过程中,这种差异将严重影响译文质量。本文通过研究贵州古彝文与汉语在句法结构上的差异,提出一种基于规则的彝汉双语调序模型,用于调整彝文语序,以提高彝汉翻译译文质量。该模型中针对贵州古彝文句法特点,总结了一系列彝语句法规则,通过对比彝语和汉语句法结构上的差异,利用移动、替换等操作调整彝语语序,使其在结构上更符合汉语语序。最后通过实验对所提调序规则进行验证,实验结果表明,通过调序模型得到的符合目标语言句法的源语言调序结果正确率为0.635;利用词对齐模板,对源语言进行直译,译文的BLUE评分值由调序前的0.154提高到调序后0.248。  相似文献   

4.
1989年,北京、云南、四川、贵州、广西等省、市、自治区的有关领导、权威专家云集西昌,一致通过了1980年国务院批准实施的规范彝文作为我国彝文信息处理标准,1992年,国家技术监督局颁布实施了多项规范彝文信息处理国家标准,从而使彝文信息处理工作得到了顺利发展。1998年,在滇、川、黔、桂四省(区)彝族古籍整理协作会第六次会议上,来自四省区和北京的权威及有关领导云集成都,一致通过了“将国务院批准的四川规范彝文作为我国彝族统一文字的会议纪要”。至此,计算机彝文信息处理事业得到了迅速发展。YWBDDOS北大方正彝文激光照排系统、YWPS彝文系统、YWWIN2000彝文系统、YW彝文字幕系统等计算机彝文系统相继问世,并获得了省部级的各种奖励。古老的彝文,正向着世界、向着信息化、现代化、网络化、趄着五彩缤纷的信息时代大步迈进。  相似文献   

5.
1989年,北京、云南、四川、贵州、广西等省、市、自治区的有关领导、权威专家云集西昌,一致通过了1980年国务院批准实施的规范彝文作为我国彝文信息处理标准,1992年,国家技术监督局颁布实施了多项规范彝文信息处理国家标准,从而使彝文信息处理工作得到了顺利发展.1998年,在滇、川、黔、桂四省(区)彝族古籍整理协作会第六次会议上,来自四省区和北京的权威专家及有关领导云集成都,一致通过了"将国务院批准的四川规范彝文作为我国彝族统一文字的会议纪要".至此,计算机彝文信息处理事业得到了迅猛发展.YWBDDOS北大方正彝文激光照排系统、YWPS彝文系统、YWWIN2000彝文系统、YW彝文字幕系统等计算机彝文系统相继问世,并获得了省部级的各种奖励.古老的彝文,正向着世界、向着信息化、现代化、网络化、朝着五彩缤纷的信息时代大步迈进.  相似文献   

6.
自动分词是彝文信息处理领域的一项基础性课题.词类的划分标准是正确切分词乃至以后的词性标注、文字识别、文本校对、机器翻译、篇章理解、自动文摘、文本校对、自动标引等彝文信息处理研究的必要条件.本文首先首先阐述了研究彝文分词规范的必要性和重要意义; 然后提出了彝文分词规范的基本原则; 讨论了研制彝文分词规范中存在的一些问题.  相似文献   

7.
凉山彝语(北部方言什乍话)的类别量词很丰富。量词主要来源于名词、动词和描摹词(有人将其归为形容词);抽象的量词由具体的量词引申而来。凉山彝语量词有自己独特的一套语义分类标准,名词所指事物都有不同的属性,从量词归类时所依据的属性可以看到该语言所侧重的事物属性。除了这些最显著的语义特点外,量词还有一些变调特点和句法特点。拷贝型量词也是凉山彝语类别量词的一个重要类型,正如其他的藏缅语族语言一样,它是量词发展的初级阶段。  相似文献   

8.
随着互联网和彝文信息化的快速发展,彝文网络上充斥着大量的敏感信息,极大的影响了我国边疆的舆情信息安全.但彝文信息技术的发展与中英文相比还比较滞后,因彝文语言结构复杂、彝语分布环境广泛等原因,彝文的信息采集和文本分词等技术还不够成熟,这对涉外彝文网页的敏感内容监管带来巨大的挑战.为解决彝文网络信息的安全传播和舆情稳定,试图提出彝文敏感内容分级模型,并结合自研的彝文爬虫及分词等技术.构建一种面向彝文网页的敏感内容分级的算法模型和演示系统,相比于同类的民族语言舆情分析系统,不仅可实现敏感词的识别和过滤,还具有敏感内容分级、敏感源地址追踪等功能.通过人工评测与分析,该系统对敏感内容的分级可达到48%的准确率,敏感词的识别率为80%.  相似文献   

9.
自吐弥桑布扎创制文字以来,藏民族便有了统一的书面语。历史上形成的藏区三大方言一卫藏方言、康区方言和安多方言,都有不同的地域特点和语言风格。由于语言差异,从很大程度上抑制了藏区各地人民相互之间的顺利交往,妨碍着我区改革开放、经济建设和社会发展的信息交流。推广藏语普通话,对今日的西藏来说,是一个迫在眉睫的问题。文章通过分析康区方言,阐述了推广藏语普通话的重要性。  相似文献   

10.
为解决古彝文的信息化,分析了古彝文拼音方案中的声母、韵母的读音特征,考虑了声调符号及吐气符号等因素,设计了古彝文输入法的拼音码表,音码规定为按古彝文字的读音取码,根据编码字母采用对应计算机键盘的字母键进行输入。利用该拼音码表实现古彝文在键盘上的输入,从而解决了之前基于笔画输入部首较多、学习困难以及与计算机操作系统不兼容等问题。  相似文献   

11.
为解决古彝文的信息化,通过分析了古彝文拼音方案中的声母、韵母的读音特征,考虑了声调符号以及吐气符号等因素,设计了古彝文输入法的拼音码表,音码规定为按古彝文字的读音取码,根据编码字母采用对应计算机键盘的字母键进行输入。利用该拼音码表实现古彝文在键盘上的输入,从而解决了之前基于笔画输入部首较多、学习困难以及与计算机操作系统不兼容等问题。  相似文献   

12.
国内     
正7月1日起实施手语"普通话"和盲文"规范字"今年7月1日起,《国家通用手语常用词表》和《国家通用盲文方案》将作为国家语委语言文字规范正式实施,这意味着手语和盲文有了国家标准,手语有了"普通话",盲文有了"规范字"。据了解,将手语规范纳入国家语委语言文字规范标准范畴是改革开放40年以来的第一次。我国地域辽阔、方言众多,听力残疾人难以说普通话,视力残疾人难以写规范汉字,手语和盲文是他们使用的特殊语言和文字,各地听力  相似文献   

13.
文章以中国社会科学院民族所研制的《中国少数民族语言语音声学参数统一平台》的原理,基于"现代蒙古语青海方言乌图美仁土语语音声学参数库",使用实验语音学、实验音系学的理论,对乌图美仁土语词首音节短元音的第一共振峰、第二共振峰(F1、F2)进行较系统的声学分析,并在绘出其声学元音图、声学格局图的基础上采用定量和定性分析相结合的方法对现代蒙古语青海方言乌图美仁土语词首音节短元音特点进行了系统的论述.实验得出现代蒙古语青海方言乌图美仁土语词首音节短元音音位有//、/e/、/i/、//、//、/o/、//、//、/y/等9个音位.  相似文献   

14.
何东英 《科技信息》2012,(29):53-53
会理土语是彝语北部方言南部次方言中的西部土语。因会理在历史发展过程中受汉文化的影响较深,其语音已与喜德标准语产生了一些区别。本文以该土语使用的群体结构及发展趋势为分析点,望彝族人增强母语保护意识。  相似文献   

15.
这里的图象文字信息处理指的是用于激光排版的彝文信息处理。彝文的字形、构词方法同中文类似,因此可借助中文处理的办法进行处理。要使少数民族文字处理具有实用价值,须做到中、西、少数民族文字的兼容。彝文同汉字一样为个体形意字,这样,可以把彝文字加入CCDOS中文字库。首先,必须建立彝文字库。建立字库的方法主要有两种:一是编写程序进行手工建库;一是利用图形扫描仪扫描标准样本到相应图形文件,对图形文件运用交互式切割出相应的文字点阵信息,建立相应的点阵库文件。作者用后一种方法,完成了扫描仪取汉字或图形的剪切、编码、存库工作,这是建字库的较快速办法。并用C语言写了56K程序。该系统的优点是:①完整的菜单弹出与下拉,、便于读者使用;②模块式的编程,便于修改和维护;③汉字切割的直观性,提供了良好的用户界面,便于汉字的存取及修改;④编码汉字存库简易,便于今后与机内码汉字查对。  相似文献   

16.
彝文文字识别中的文字切分算法设计与实现   总被引:2,自引:0,他引:2  
针对目前国内OCR及其文字切分技术主要应用于汉字、英文等文字的识别,而对于少数民族文字,则缺乏较为实用的文字切分工具的问题,提出了基于少数民族文字识别的文字切分方法.该方法以彝文文字为例进行切分,经实验证明该方法具有较好的切分效果.  相似文献   

17.
彝族夸恩斯支系有一种共同使用的语言,它是夸恩斯支系的标志。对于彝族诸多支系的语言由于同语源和同放源的关系,统归为一种语言,即彝语。对于诸多支系的语言变体,不论差异大小,前人以地缘关系划分方言,诸如北部方言、西部方言等。但考察各支系的语言情况,地缘关系的性质不突出,而民族支系的社会群体性表现强烈。各支系的语言是各自支系的重要标志,它具有与其他支系不相一致的语音体系、语法结构和相当数量的词汇。民族支系或交错杂居,或各自聚居,各自使用自己的语言,这种现象是以民族支系为特征的,对这样的语言,我们且称之为“支系方言”。彝族各支系之间不论地域、社会发展、服饰、信仰、习俗等情况的不同,共同的族源和意识成为一个民族共同体,支系方言是共同体  相似文献   

18.
结合“数字图书馆”的建设,阐述了古籍文献的整理范围,提出了制定规范的“核对标准”及标准的款目格式、著录文字、著录级次、规定信息源等整理方法以及具体的核对操作。  相似文献   

19.
针对目前国内OCR及其文字切分技术主要应用于汉字、英文等文字的识别,而对于少数民族文字,则缺乏较为实用的文字切分工具的问题,提出了基于少数民族文字识别的文字切分方法.该方法以彝文文字为例进行切分,并且采用基于连通域的方法,经实验证明该方法能够取得较好的切分效果.  相似文献   

20.
本文在藏语的文字和方言语音的基础上建立了藏语方言研究系统,主要包括藏语词条的收集和整理;方言词汇的确认;方言音系的整理;藏文与拉丁双向转写;方言国际音标的自动生成等几方面,为藏语的方言研究提供了理论支持和应用工具。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号