首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 109 毫秒
1.
在字符识别技术日趋成熟的现状下,单个字符的正确切分及提取已经成为制约字符识别精确度的关键因素。本文针对二手车发票上印刷体的日期数字(阿拉伯数字),对图像二值化处理后,采用垂直方向投影和轮廓特征两种策略进行自适应字符切分及提取。实验结果表明,该方法提高了从图像中定位出来的字符串的切分率,并保证了字符切分和提取的正确率平均达到99%。  相似文献   

2.
印刷体数学公式中存在粘连字符是限制公式识别系统性能提升的主要因素之一。因此提出一种针对公式粘连中字符水平粘连和角标粘连的切分算法。该算法首先以滴水法为指导思想寻找峰和谷,然后根据峰和谷的形态特征、位置关系及对应位置的垂直投影等特点选出候选切分点,最后根据切分点附近的笔画信息确定切分路径。实验结果表明,该方法能够很好的适用于公式中水平和角标的粘连字符的切分。  相似文献   

3.
印刷体蒙古文字识别技术中切分方法的设计与实现   总被引:1,自引:2,他引:1  
文字识别是人工智能的一个重要研究领域.有些民族文字识别的成果已转化为商品化软件.蒙文文字识别的研究还处于起步阶段,蒙古文字的结构和书写方式与其他文种相比有许多特点.印刷体蒙文文字识别技术中字元切分的方法,经过实验其切分正确率在98%以上,并已成功地用于印刷体蒙文识别软件中.  相似文献   

4.
针对传统汉字切分方法中对粘连汉字和重叠汉字切分不准确的问题,提出了基于极小阈值和曲线拟合的垂直投影汉字切分算法.该算法在传统垂直投影法汉字切分的基础上结合极小阈值和曲线拟合进行切分,实验结果表明:相对于传统汉字切分方法,该算法对含有粘连和重叠现象的手写体汉字文本的切分是有效的,从而可使手写体汉字的切分准确率有较大的提高.  相似文献   

5.
本文重点介绍了印刷体蒙古文的结构特征、印刷体蒙古文的切分方法.特征选择种类繁多,从大量模糊特征中选择出有效特征进行分类,再对印刷体蒙古文的切分方法(行切分、字元切分)进行了详细的说明.  相似文献   

6.
一种基于字符轮廓特征的印刷体汉字切分方法   总被引:1,自引:0,他引:1  
针对单一汉字切分方法的不足,提出一种基于字符轮廓凹凸特征的印刷体汉字切分方法,首先对扫描后的印刷体汉字文本图像进行二值化处理,根据整篇汉字字符的左右轮廓凹凸特征,把字符图像切成一个个的汉字行,最后根据每一个汉字行的字符串上下轮廓凹凸特征,把每一个汉字行切分为单独的汉字字符.仿真实验表明,提出的方法对于标准的纯印刷体汉字文本图像,可以得到比较理想的切分效果.  相似文献   

7.
在许多文字识别系统中,字符切分是预处理阶段的重要环节,其目的是从文本图像中分离出字母图像,然后针对切分后的每个字母进行识别。为了达到字符切分的目的首先要切分出文本图像中的每一个连体字母段。本文将彩色图像转换为灰度化的边缘图像,其次对图像进行局域二值化,再进行区域检测,初步实现了图像中维吾尔文字行的定位,然后根据定位结果从图像中切分出文字行,统计切分后的文字行在水平和垂直方向上的像素累计情况,查找最佳切分点,分离出文字行中的字母独立形式或几个字母连成的连体字母段,对后面的字符切分打了很好的基础。实验结果表明,文字行的切分准确率达到92%,字切分准确率达到90%以上。  相似文献   

8.
字符切分的任务是把整个字符串图像中的每个字符切割出来,使其成为单个数字的图像。字符切分是数字字符识别中的关键步骤之一。在图像预处理后,由于小数点粘连造成字符粘连,无法正确切分字符。针对小数点造成的粘连情况,考虑小面积剔除法将小数点去除,保证字符切分正常。小面积剔除法首先将图像中各个部分加以统计得到其面积,然后根据面积的不同确定阈值将小数点与数字字符区分开来,剔除小数点。经过处理之后的图像再进行预处理,使用直线投影切分法将字符切分提取出来。实验表明该方法效果良好。  相似文献   

9.
基于多尺度分形维数的汉语语音声韵切分   总被引:10,自引:0,他引:10  
针对低信噪比环境 ,提出一种汉语语音声韵母切分新方法。以语音信号非线性产生机制中存在混沌特性为依据 ,将普通分形维数扩展为多尺度分形维数 ,用于考察语音信号在不同最大观测分辨率下的局部自相似性。利用稳定声韵母段及其之间过渡段在多尺度分形维数上的不同特性能较好地区分二者。由此针对汉语音节“声母 +韵母”的结构特点设计了一种简单而高效的汉语语音声韵母切分方法。在干净语音测试集下测试 ,切分正确率为 95 .2 % ;在信噪比为10 d B的噪声环境下 ,正确率达到 82 .3%。  相似文献   

10.
文章以维吾尔文为对象,提出了一种汉维对齐的维文语料库获取方法,通过对照汉维特点,首先对维文进行词干切分,并在此基础上借助词干表和词频表进行词性标注,然后对汉维进行对齐,从而实现汉维双语语料库的获取,对维文及其他少数民族语言的分析及研究提供一种可行的方法.  相似文献   

11.
文字识别是图像处理和模式识别的主要研究方向之一。文章提出了一种复杂背景图像中维吾尔字符切分与识别方法,该方法根据维吾尔文字母结构特点,对维吾尔文词语的切分进行了认真地分析,通过对维吾尔文字符边缘特征和笔画分布规律等特点进行研究,提出了比较有效的切分方法,并结合维吾尔文的特有规则,利用维吾尔文周边结构模式识别方法提取结构特征,最后通过计算 Minkowski距离找出最近的类别,输出识别结果。  相似文献   

12.
提出一种基于词间关联度度量的维吾尔文本自动切分方法。该方法从大规模生语料库中自动获取维吾尔文单词Bi-gram及上下文语境信息, 在充分考虑维吾尔文单词间结合规则的前提下, 将相邻单词间的互信息、t-测试差及双词邻接对熵的线性融合作为组合统计量(dmd), 度量文本中相邻单词之间的关联程度。以dmd度量的弱关联的词间位置作为切分点进行自动切分, 得到语义及结构完整的词串, 而不仅仅是以空格隔开的单词。在大规模文本语料上进行的测试表明, 该方法的切分准确率达到88.21%。  相似文献   

13.
手写体信函地址汉字切分   总被引:3,自引:0,他引:3  
目前多数汉字识别系统仍基于单个汉字的逐个识别,因此对字符进行有效的切分,是离线汉字识别的一项重要工作,根据汉字手段写体的特点,在方差最小原理基础下,提出多步切分算法(粗分-细分-合并)和穿越算法,首先根据字段间间隔,用最小距离聚类的方法,得到5组粗分结果,从中选出最接近理想的一种,用改变类间距离和穿越算法,对较宽的字段进行细分,最后将过细的分割部件合并成一个完整的字,对现场采集的3000封信函进行切分,单字正确率可达90.8%。  相似文献   

14.
本文提出了一种新的描述多种印刷体汉字的方法——特征链码法.使用该方法无需先对汉字图像进行细化和平滑处理,可以克服汉字图像位移、不同大小以及一些噪声的影响.实验中针对常用的一级字库约3700个仿宋体、宋体、黑体(理论上还可以扩充到二级字库6700多个印刷体汉字,字体还可以增加楷体等),以及相应的尺寸出现的变化如24×24、24×48、48×48等做了特征抽取和识别试验,实验中还对链码特征库进行了几种预分类.  相似文献   

15.
针对维吾尔语中构形词缀种类多、构形复杂以及发生音变现象等问题, 提出一种基于字符级的维吾尔语形态协同分析方法。该方法最大的特点是同时进行维吾尔语的形态切分、形态标注以及音变还原, 将词素边界、形态标记以及音变信息用一个复合标记描述, 采用字符序列的标注方法进行训练。实验结果显示, 形态切分、形态标注及音变还原的正确率分别达到96.39%, 92.78%和99.79%, 系统总体正确率达92.59%。  相似文献   

16.
彝文文字识别中的文字切分算法设计与实现   总被引:2,自引:0,他引:2  
针对目前国内OCR及其文字切分技术主要应用于汉字、英文等文字的识别,而对于少数民族文字,则缺乏较为实用的文字切分工具的问题,提出了基于少数民族文字识别的文字切分方法.该方法以彝文文字为例进行切分,经实验证明该方法具有较好的切分效果.  相似文献   

17.
Gabor滤波器的纹理分割   总被引:1,自引:0,他引:1  
提出了基于Gabor滤波器和FCM的纹理分割法。讨论了Gabor滤波器的选择。将Gabor滤波器用于提取纹理的特征,通过FCM的聚类来进行分割。将该方法运用于普通纹理图像及自然纹理图像——地震剖面图像的分割,仿真实验证明了方法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号