首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
针对目前国内OCR及其文字切分技术主要应用于汉字、英文等文字的识别,而对于少数民族文字,则缺乏较为实用的文字切分工具的问题,提出了基于少数民族文字识别的文字切分方法.该方法以彝文文字为例进行切分,并且采用基于连通域的方法,经实验证明该方法能够取得较好的切分效果.  相似文献   

2.
印刷体蒙古文字识别技术中切分方法的设计与实现   总被引:1,自引:2,他引:1  
文字识别是人工智能的一个重要研究领域.有些民族文字识别的成果已转化为商品化软件.蒙文文字识别的研究还处于起步阶段,蒙古文字的结构和书写方式与其他文种相比有许多特点.印刷体蒙文文字识别技术中字元切分的方法,经过实验其切分正确率在98%以上,并已成功地用于印刷体蒙文识别软件中.  相似文献   

3.
针对当前图像文字识别与提取的最新发展状况,提出一种基于K-means的图像文字识别与提取算法,其主要处理步骤包括图像的预处理、像素点聚类处理、图层的选择与优化以及最终的文字切分等。经过上机对算法进行测试,该算法能够有效提高图像文字识别与提取的准确率与执行效率,并可以针对不同环境下的图片文字进行有效识别。  相似文献   

4.
刘瑛  王绪本 《科学技术与工程》2007,7(21):5584-55895608
简牍图像具有干扰噪声大、文字大小不一的特点,传统的文字切分算法很难准确区分图像中的文字与噪声。针对简牍图像特点,利用投影法进行文字初步切分,运用多种补偿算法对初切分结果进行去噪处理和精确定位。实验结果表明,该算法具有文字切分效果好、运算时间短、易于实现的特点,对简牍图像处理的工程应用具有积极意义。  相似文献   

5.
提出一种有效的文字特征提取方法,用三角形网格提取文字统计特征,然后利用自组织映射神经网络(SOM)对四类印刷体汉字进行文字识别,计算结果表明该方法用于文字识别准确性较高.  相似文献   

6.
提供了一种计算机手写文字图形输入理论方法.这个理论,可以预见的,在任何一个少数民族的象形字与表声字词的手写识别上可被灵活的应用,在任何一个象形字或表声字上可被灵活的应用.  相似文献   

7.
基于识别反馈的粘连字符切分方法研究   总被引:1,自引:0,他引:1  
字符切分是影响OCR系统识别的关键因素之一.对于中英文混排粘连字符图像,笔者提出了一种基于字符类别的识别反馈的字符切分方法.该方法结构简单,容易实现,实验结果表明该方法切分效果好.  相似文献   

8.
印刷体蒙古文字识别中蒙古文字特征的选择   总被引:2,自引:0,他引:2  
从文字识别的角度出发,依据印刷体蒙古文字的特点,选择笔划轮廓结构特征、笔划穿越特征、关键特征点、蒙古文构词法等作为蒙古文字的特征,并以这些特征来设计分类器.该分类器已经被成功地用于印刷体蒙古文字识别软件中,取得了较高的识别率,从而证明了选取这些特征是合理的、有效的.  相似文献   

9.
设计并构建了一种记录书写者民族信息的手写体汉字数据库———大连民族学院DNU-Ⅰ型多民族脱机手写体汉字数据库。包括单字库、行文本库和段文本库3个子库。为少数民族汉字书写特征分析、中文文档的行切分、汉字的切分识别、中文文本的无切分识别、笔迹鉴别和签名验证等方面的研究奠定基础,并提供算法的验证平台。同时介绍了字符识别数据库的一般构建流程和数据库图像二值化、归一化、行分割等预处理算法,为少数民族文字数据库的构建提供了技术支撑。  相似文献   

10.
字符切分是影响OCR系统识别的关键因素之一.对于英文搭接字符图像,笔者提出了一种基于轮廓线搜索策略的搭接英文字符切分方法.该方法结构简单,容易实现,实验结果表明该方法切分效果好.  相似文献   

11.
针对传统汉字切分方法中对粘连汉字和重叠汉字切分不准确的问题,提出了基于极小阈值和曲线拟合的垂直投影汉字切分算法.该算法在传统垂直投影法汉字切分的基础上结合极小阈值和曲线拟合进行切分,实验结果表明:相对于传统汉字切分方法,该算法对含有粘连和重叠现象的手写体汉字文本的切分是有效的,从而可使手写体汉字的切分准确率有较大的提高.  相似文献   

12.
基于Linux系统的彝文输入动态挂接   总被引:1,自引:1,他引:1  
随着我国大力推进Linux系统的应用与研究,古老悠久的彝文如何在这个先进的操作系统上输入、处理是民文信息处理领域研究的重点.尝试就Linux系统中彝文输入方面的问题进行探讨分析,并给出一些解决思路.  相似文献   

13.
针对印刷体维文在连体段切分部分存在过切分和漏切分的现象,结合水平投影法和连通域搜索法实现维文文本的行切分和单词切分;同时针对连体段切分正确率不高的问题,提出一种新的切分方法。首先对字母连体段位于基线上方的部分进行竖直投影来寻找所有可能的切点,然后利用阈值判定法去除误切分。实验证明,该方法提高了印刷体维文的切分正确率,为提高维文识别的正确率打下基础。  相似文献   

14.
字符切分是影响OCR系统识别的关键因素之一.对于中英文混排文档,提出了基于字符类别的识别反馈混排字符切分方法,利用字符特征分类判别出文档中的汉字类、英文、数字和标点符号类、部件类,对汉字类和部件类借助识别技术分别进行处理.该方法结构简单,客易实现,实验结果表明该方法切分效果好,字符类别判断准确.  相似文献   

15.
本文以开发汉字彝文操作系统为例,讨论C语言用于操作系统汉化及少数民族化中的作用和对一些特殊问题的解决方法。  相似文献   

16.
手写体信函地址汉字切分   总被引:3,自引:0,他引:3  
目前多数汉字识别系统仍基于单个汉字的逐个识别,因此对字符进行有效的切分,是离线汉字识别的一项重要工作,根据汉字手段写体的特点,在方差最小原理基础下,提出多步切分算法(粗分-细分-合并)和穿越算法,首先根据字段间间隔,用最小距离聚类的方法,得到5组粗分结果,从中选出最接近理想的一种,用改变类间距离和穿越算法,对较宽的字段进行细分,最后将过细的分割部件合并成一个完整的字,对现场采集的3000封信函进行切分,单字正确率可达90.8%。  相似文献   

17.
随着全球数据信息交换越来越频繁,不同民族文化间的信息交流越来越密切;全球化浪潮席卷的背景下,各国都加强信息化建设,我国也在大力推进Linux系统的应用与研究.古老悠久的彝丈如何在这个先进的操作系统上编码并能正常地显示、输入.处理、传输是民文信息处理领域研究的重点.就GB18030与彝丈的编码与显示问题进行探讨分析,并尝试给出一些解决思路  相似文献   

18.
一种不需分词的中文文本分类方法   总被引:2,自引:1,他引:1  
提出了一种不需分词的n元语法文本分类方法.与传统文本分类模型相比,该方法在字的级别上利用了n元语法模型,文本分类时无需进行分词,并且避免了可能造成有用信息丢失的特征选择过程.由于字的数量远小于词的数量,所以该分类方法与其它在词级别上的分类方法相比,有效地降低了数据稀疏带来的影响.系统地研究了模型中的关键因素以及它们对分类结果的影响.使用中文TREC提供的数据进行实验,结果表明,综合评价指标Fβ=1达到86.8%.  相似文献   

19.
针对铁路货车车号的断裂、倾斜、变形等特点,传统字符分割方法分割精度低的问题,提出一种基于改进包围圆的分割方法。基于铁路货车单行、双行2种排列方式,采用自适应游程算法进行双行车号的分割,鉴于游程算法背景像素前景化的处理特点,预先采用游程算法进行断裂消除,再使用包围圆方法进行字符分割。实验结果表明:在图像质量不高情况下,可以实现良好的分割精度且在分割准确率和鲁棒性方面均优于传统算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号