首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 187 毫秒
1.
Windows环境下蒙古文复杂文本处理的研究   总被引:1,自引:0,他引:1  
简要介绍了复杂文本和Uniscribe布局引擎,然后介绍一种基于Uniscribe的蒙古文Unicode文本的解释算法,解决Windows环境下字处理软件不支持蒙古文国际标准编码的问题.该算法具有较好的通用性,能够有效处理多种复杂文本语言,在蒙古文字处理软件MWord中的应用说明了该算法的有效性.  相似文献   

2.
分析了微软多语言复杂文本布局引擎Uniscribe的主要工作机制,说明了Uniscribe主要接口函数的功能及用法.基于Uniscribe接口实现了支持Unicode编码和OpenType字体的蒙古文竖向文本编辑器,解决了其中的一些技术难题.  相似文献   

3.
通过查阅文献,依据蒙古文语法中的词法,分析了蒙古文词的相关属性,然后使用软件工程中的快速原型模型创建分析蒙古文词的模型,并用VB编程语言实现自动分析蒙古文词的程序,完成了自动分析所输入蒙古文词的构成及属性的任务,最后使用实验方法选择小样本测试实例,对该程序进行黑盒测试,测试结果表明,该程序分析蒙古文词的准确率达到90%以上.  相似文献   

4.
用样式表制作蒙文网页   总被引:4,自引:2,他引:2  
蒙古文信息网络化中最难解决的问题之一是蒙古文网页的制作.蒙古文字的结构和书写方式与其它文种相比有自己的特点,再加上蒙古文字库编码的不统一等原因,一直影响蒙古文网页制作.针对蒙古文的书写特性提出了利用样式表的文本特性制作蒙古文网页的方法,使制作出的蒙古文网页中的蒙古文字按字符方式显示,并能实现蒙、汉、英文混排显示.  相似文献   

5.
通过调查汇总内蒙古广播电视台蒙古语媒体资产编目现状,分析了现行的蒙古语媒体资产通过汉译,用汉文编目方法中存在的问题,提出直接用蒙古文编目的可能性和需要重点解决的问题。蒙古文标准编码环境逐步成熟,尤其Windows平台上的编辑输入和显示问题容易解决,重点在于蒙古文字符编码与字形之间的多对多复杂转换关系及录入不规范等众多原因,容易导致编目文本存在严重的拼写多样化现象和字形拼写错误。为此本文提出使用智能输入法避免错误录入、使用智能校对纠错、使用智能搜索模糊匹配等多手段结合的解决方案。随着这些技术的成熟,相信蒙古文媒体资产编目问题一定能得到解决并投入实际应用。此项工作的研究对其他蒙古语文资源建设及大数据建设和应用具有广泛的参考价值。  相似文献   

6.
基于Mealy机的蒙古文排序算法   总被引:1,自引:0,他引:1  
排序是语言文字信息处理中的重要工作之一,它的目的是将单词(或词组)的任意序列重新排列成按关键字有序的序列,从而优化存储结构,提高检索速度.但由于蒙古文排序习惯和其"UCS"编码的特殊性,单词排序不能完全依靠字符编码的自然顺序.单词的排列顺序不仅与字符编码有关,而且与字符状态有着密切的关系.因此先给出字符状态和词状态的定义,然后提出一种基于Mealy机的字符串排序算法.该算法是传统的字符串排序算法的一种扩展,主要解决了编码相同状态不同情况下词的排序问题,并且在传统蒙古文排序中的应用证实了算法的有效性.该算法具有很好的适应性,能够解决其它一些复杂文本语言的排序问题.  相似文献   

7.
针对长文本在文本分类时提取语义关键特征难度大,分类效果差等问题,建立基于循环神经网络变体和卷积神经网络(BGRU-CNN)的混合模型,实现中文长文本的准确分类。首先,通过PV-DM模型将文本表示为句向量,并将其作为神经网络的输入;然后,建立BGRU-CNN模型,经双向门控循环单元(B-GRU)实现文本的序列信息表示,利用卷积神经网络(CNN)提取文本的关键特征,通过Softmax分类器实现文本的准确分类;最后,经SogouC和THUCNews中文语料集测试,文本分类准确率分别达到89. 87%和94. 65%。测试结果表明,循环层提取的文本序列特征通过卷积层得到了进一步优化,文本的分类性能得到了提高。  相似文献   

8.
实用高效的蒙古文词切分方法是实现蒙古文信息处理的前提和基础.研究提出从3种基本的蒙古文词切分方法,组合成12种蒙古文词切分方法.应用数据包络分析(DEA)方法,提出用于蒙古文词切分方法综合评价的数学模型和有效性计量公式,并围绕蒙古文切词方法的智能选择问题,提出基于国际标准编码的蒙古文词切分系统的设计方法和整体框架.  相似文献   

9.
报纸新闻互文类型有互文性、元文本性和副文本性。报纸新闻互文研究既是句子角度的静态研究,更是语篇角度的动态研究。新闻是对客观现实的建构,这种建构就是互文,互文在语篇中具有概念功能、人际功能和语篇功能。互文体现出作者对"不同的互文来源+不同的互文动词+不同的互文形式+不同的互文本"的选择。互文及其成分在新闻语篇中表现出不同的语篇作用,共同建构新闻语篇的客观性、真实性、权威性、公正性,并建立作者的立场、态度。互文把文本(当下文本)引入无限的文本世界,开拓了读者的视野。  相似文献   

10.
简要介绍了蒙古文字的主要特征及其基于Unicode编码标准的蒙古文OpenType字库,接着介绍了蒙古文名义字符转换为变形显现字符的一些主要变化规则.然后介绍了GNOME平台的多种语言文字处理模块-Pango 库处理 OpenType 字体的方法.在此基础上为Linux-GNOME平台的Pango库增加蒙古文处理模块,实现了在Linux-GNOME通用编辑器中蒙古文的正确显示.  相似文献   

11.
尽管在对网络协议的一致性测试方面已经取得了相当大的进展,但是如何有效地,全面地测试一个实际的协议仍然是一致性测试研究方面的主要问题,本文集中讨论测试方法的选择,测试过程中的控制程度和一致性程度的关系,以及确定地测试IUT的意义,为DECT网络层设计的致性测试套体现了这些观点。  相似文献   

12.
介绍了一个基于PSOLA合成技术的蒙古语文语转换系统,系统针对蒙古语自身的特点,采用了语音合成领域比较成熟的波形编辑合成技术,也建立了实用的蒙古语语音合成音库,音库基元都进行了基音标记,在韵律修改中也做了尝试。  相似文献   

13.
针对目前车用性能测试系统体积庞大、功能单一、安全性和可靠性低等缺点,采用基于Matlab/Simulink平台的dSPACE开发环境,开发了以dSPACE实时仿真系统为核心的重型商用车性能测试系统,完成了测试系统布置,开发步骤设计,实现了整车性能试验数据的采集、处理、分析、显示以及保存.应用所开发的测试系统完成了重型商用车性能道路试验,获得了经验驾驶员的操纵数据和原型车的动力性指标,为AMT系统的研制开发奠定了基础.  相似文献   

14.
基于分层密度特征的文档图像检索   总被引:1,自引:0,他引:1  
为克服基于版面重建的文档图像检索方法对图像质量要求高,且局限于部分文种,以及基于版面分割的文档图像检索方法受限于版面分割技术等问题,提出了一种基于二值文档图像分层密度特征的检索方法。该方法通过倾斜校正、去除黑边等预处理得到有效文本区域,提取有效文本区域的长宽比和分层密度特征,通过特征比对进行检索。实验表明:该方法对不同分辨率以及不同的输入设备具有自适应能力,对复杂版面和批注等噪声鲁棒性好,漏检率为2%,是一种简单有效的文档图像检索方法。  相似文献   

15.
基于词汇的蒙古语文语转换的实验   总被引:4,自引:0,他引:4  
蒙古语是一种很有影响的语言,较放西有许多独特的方面,本介绍了一个基于词汇的蒙古语语转换系统的设计与实现。  相似文献   

16.
贾运  田学东  左丽娜 《科学技术与工程》2020,20(29):12021-12027
古籍版面图像结构复杂,对其进行有效、准确的分析是实现古籍汉字识别与检索的前提和基础。对古籍汉字版面分析的关键问题展开研究,在对古籍版面特点进行分析与归纳的基础上,提出基于LOF和波动阈值的古籍版面分析方法。首先,采用基于LOF的分类算法对古籍版面图像投影分割后的区域进行分类,确定存在分割问题的候选混合区域;然后,利用波动阈值对候选混合区域中的文字与框线粘连部分进行分割;最后,确定古籍版面中的文字区域并输出。实验结果表明,该算法能够有效地分离古籍文字区域和框线区域,版面分类和分割准确率分别为87.02%和78.69%。  相似文献   

17.
并行测试是下一代自动测试技术的主要发展方向之一。从并行测试系统的本质概念入手,分析了影响并行测试系统资源优化配置的关键因素,给出了解决问题的思路。研究了并行测试信号模型、测试资源接口模型,以降低系统组建成本和提高测试系统效率为研究目标,提出了并行测试任务优化序列的概念;以此为基础,给出了并行测试资源优化配置方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号