首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 500 毫秒
1.
提出了一种图像背景下的满文文字提取方法。用数字图像处理的方法对含有图像背景的满文图片进行单字提取,并进行去噪、细化、剪枝等预处理,找到这个单字的主轴,终止点、内部点和交叉点,在主轴上找到临界点,由临界点进行笔画生长从而达到满文文字笔画提取的目的。为了验证方法的可行性,对手写体满文图像、印刷体满文图像和彩色图像中的满文分别进行了文字提取。实验结果表明该方法对满文文字提取率较高,为进一步研究满文的识别奠定了坚实的基础。  相似文献   

2.
提出一种利用计算机图像处理技术进行楷书基本笔画特征提取的方法.从书法笔画图像细化得到笔画骨架出发,提取笔画的全局特征和局部特征,用骨架关键点将笔画分为多个笔段,并结合书法写作特点通过对笔段内部及笔段之间特征进行分析,对书法笔画图像的形体特征选择、提取进行初步的探索.  相似文献   

3.
构建一个提供评测工具的笔画基准测试库, 其中包含一个人工搭建的笔画数据库, 该数据库拥有4种字体的汉字图像以及对应的人工提取的笔画信息。通过比较算法自动提取的笔画结果和数据库中的标准笔画之间的差异, 测试库可以评测笔画自动提取算法的性能。还提出一种新的基于Delaunay三角剖分的方法, 可以有效地从汉字图像中提取出笔画信息。在测试库中对现有的3 种笔画提取方法进行比较, 实验数据表明, 所提出的笔画基准测试库能够对笔画提取算法给出有效的评测, 并且新的算法在汉字笔画提取的性能中效率较高。  相似文献   

4.
针对从背景复杂、视角多变、语言形式多样的场景图像中难以准确提取文本信息的问题,提出了一种基于最大稳定极值区域(MSER)和笔画宽度变换(SWT)场景文本提取方法。该方法结合MSER、SWT算法的优点,采用MSER算法的准确检测文字区域,建立文本候选区域,利用SWT算法计算文本候选区域笔画宽度得到候选文本区域的笔画宽度;根据笔画宽度图,利用连通域标记建立笔画宽度连通图,然后根据笔画宽度连通图,建立笔画连通图的启发性规则,删除非文本候选区域,并根据文本的几何特征分析及局部自适应窗口最大类间方差(Otsu)分割,有效提取出自然场景图像中的文本,文本提取的准确率、召回率及综合性能分别为0.74、0.64及0.68。仿真实验结果表明,在文本视角多变,字符大小、尺寸、字体各异的复杂条件下,所提方法具有较好的鲁棒性,适用于多语言和多字体混合的场景文本提取。  相似文献   

5.
通过对笔画的对称边缘特点与文字几何特征的认识,根据二阶边缘检测算子捕捉边缘点亮暗变化趋势的能力,使用高斯型拉普拉斯算子寻找"边缘点对",并构建来自笔画等窄带区域的"对称边缘点对"样本集.从样本集的分布规律中自适应地定出文字笔画搜索窗的尺度及方向.利用最小生成树算法实现由系列搜索窗得到的所有笔画子区域的关联聚类,通过剪枝、伪区域鉴别和阈值分割,将文字以行(含非水平行)或列的形式提取出来.实验表明,该方法对复杂背景下不同的语言类型、亮暗类型、文字行方向及文字尺度具有适应性,在ICDAR数据集上的查准率和查全率分别达到76%和75%.  相似文献   

6.
基于笔画分析和背景细化的粘连手写汉字切分   总被引:5,自引:0,他引:5  
离线手写汉字的切分是识别的前提,其中粘连手写汉字的切分最为困难。提出一种基于笔画分析和背景细化的粘连手写汉字的切分新方法。对粘连字符图像作细化处理,检测端点、叉点和角点等特征点,根据特征点提取笔段。按笔段的长度、相互之间的位置关系以及投影信息确定切分点。细化粘连字符的背景图像,从切分点出发在细化的背景中选取分割路径,实现粘连手写汉字的切分。实验表明,本方法对于粘连手写汉字具有令人满意的切分效果。  相似文献   

7.
判断书写字迹交叉笔画的时序,可为笔迹检验中确定单字的笔顺特征和确定文件是否发生添加改写等事实提供重要依据。我们制作了钢笔、圆珠笔、签字笔、铅笔、复写纸等常见书写色料书写的交叉笔画实验材料,利用德国蔡司(ZEISS)三维立体显微镜观察笔画交叉部位的表观现象,并用显微照相的方法进行记录、固定,总结了常见的同种和不同种书写工具书写字迹笔画交叉部位的形貌特征。  相似文献   

8.
针对复杂背景中过多的边缘信息与噪声干扰引起笔画宽度检测不准确的问题,提出了一种结合纹理背景抑制的笔画宽度变换文本检测方法.采用Butterworth高通并结合文本纹理特征,实现了在抑制背景的同时有效保留文本区域的信息.通过结合利用加权引导滤波的图像增强技术降低噪声对边缘检测的干扰,使得文本图像的笔画宽度与边缘梯度信息的提取更为准确,从而有效提升了笔画宽度变换文本检测的性能.基于ICDAR数据库的实验结果也验证了该方法的有效性.  相似文献   

9.
提出一种基于文字结构特征的神经网络手写汉字识别策略 ,根据所提取的文字笔画方向、基本轮廓和交叉点等特征 ,采用基于自组织神经网络的模式聚类该方法完成正规手写文字的识别 .该方法提取的笔画轮廓十分准确有效 ,对手写汉字的约束少 ,可识别的汉字数量大 ,在仿真实验中有效地识别了绝大多数手写汉字  相似文献   

10.
为有效利用Android智能终端实现对文本信息的有效识别,提出一种基于谱残差和笔画宽度变换的显著性文本特征提取方法.首先应用基于谱残差的显著性检测获取显著图;然后利用最大熵判别方法分割并建立显著性文字候选区域;最后通过笔画宽度变换算法在候选区域内提取闭合边缘等宽特征.构建基于Android智能终端和服务器的C/S架构实验平台,在MSRA-TD500文字定位数据库与实验室场景数据库中的实验结果表明,该算法可较好地获取图像中的显著性文字特征,在保证运算效率的同时算法性能有所提升.  相似文献   

11.
一种基于字符边界的细化算法   总被引:5,自引:0,他引:5  
字符图像细化能极大地消除图像中的冗余信息量,大大简化字符识别特征的提取过程,提高字符识别的准确性和快速性.对字符进行细化,是字符识别的前提.提出了一种利用字符边界细化字符的算法,每一步都针对单个像素点作处理,并提取笔划单侧边缘点序列作为字符图像骨架.实验结果表明:该算法能较好地保留字符图像的基本信息,快速地去除字符图像中冗余的像素点,有效地解决了交叉点分离,笔段变短等问题,并为连笔笔划的切分提供了有效的方法,具有较好的细化结果.  相似文献   

12.
满文文字识别技术对继承和发扬少数民族文化、研究满清历史、保护和传承非物质文化遗产,促进各民族共同繁荣有着十分重要的历史意义和研究价值。文章讨论了满文识别技术的基本原理和满文文字分割、特征提取、特征匹配识别等关键技术,分析了目前满文文字识别技术的优缺点及发展趋势,为该领域的研究者指明方向,共同促进满文识别技术的发展。  相似文献   

13.
为给满文识别系统提供基元特征和训练测试样本,在对图象进行灰度化、二值化、倾斜校正、行列分割等预处理后,构建了印刷体满文文字多级数据库,包括列文本库、单词库和基元库3个子库。该库的构建为后续满文识别提供了技术支撑。  相似文献   

14.
使用图像处理技术来实现汉字书写学习系统.首先,对系统的两个主要模块,即笔画学习和汉字书写,进行了功能阐述;然后,对系统开发所涉及到的3个主要技术要点进行了实现;最后,通过实验对本文系统和基于Flash技术系统进行了对比分析.实验表明,基于图像处理技术的实现作为开发汉字书写学习系统的一种全新思路,取得了优于基于Flash技术的性能指标.  相似文献   

15.
为解决采用深度学习方法研究满文识别中训练样本匮乏的问题,提出一种使用数据增广方法扩展训练样本集的技术框架。该框架包括字体几何结构变形与图像质量变换两个模块,采用仿射变换、弹性形变等9种数据生成方法,分别模拟满文字符图像的笔画粗细变化、扭曲变形、光照不均、不同视角及背景等情况下的采集效果。在满文识别的研究中,采用该方法将每个类别的字符数据量扩展到7万个。实验表明,该方法生成的数据在一定程度上弥补了训练样本不足的问题,是解决训练样本匮乏问题的有效技术手段。  相似文献   

16.
基于笔画平面抽取和动态网格划分,提出一种笔画平面与模糊隶属度相结合的手写体汉字特征提取方法,该方法克服了汉字特征抽取过程中因笔画粗细不均、笔画长短变形等引起的特征抽取不稳定问题.其基本思想是:用动态网格将汉字图像分别划分为横、竖、撇、捺4个笔画平面,并赋予每个网格中的点模糊隶属度,针对每个网格求加权累积直方图,最终获得汉字特征.基于南京理工大学NUST603HW手写汉字库的实验结果表明,该汉字特征抽取方法是有效的.  相似文献   

17.
在对计算机的汉字识别方法讨论分析之后,本文以汉字的结构特征为基础,提出了一个新的笔划跟踪搜索方法,用来解决手写体汉字的识别问铱,在该方案中采取了速度快、质量好的平滑细化等预处理方法。在特征抽取中采用了定向记忆跟踪和笔划拼接二种方法,从而解决了在笔划抽取中,特别是在笔划经过细化处理后,不可避免地带来某种程度的笔划畸变的情况下,如何正确地抽取笔划特征,找到了一个较完善的处理方法。经过大量的计算机实验,证明该方法切实可行。且已使正确识别率提高到95%以上,误认率低于5%,识别速度小于2秒。  相似文献   

18.
为了实现少数民族文字手写体样本的快速采集,为少数民族文字数据库的建设奠定技术基础,提出一种改进的图像二值化方法和一种基于可接受度的灰面积关联度对比方法;并建设了满文字母模板库和读音数据库,以MATLAB GUI为平台开发了一种少数民族文字手写体采集系统。  相似文献   

19.
碎片图像字符特征提取方法研究   总被引:1,自引:1,他引:0  
字符特征提取是含文字碎片图像拼接的关键环节,直接影响拼接效果。提出了一种包含文字信息的碎片图像特征提取方法,首先,对原始碎片图像进行预处理,分别得到字符和碎片背景的二值图像;然后,利用边缘检测算子提取字符和碎片背景的单像素边缘;最后,利用结构算子检测碎片图像中字符与碎片背景边缘的交叉点,并根据交叉点的信息提取字体边缘方向特征。仿真实验结果表明本文提出的碎片图像字符特征提取方法思路合理,能够快速、准确地提取出碎片图像中的字符特征,为后续的匹配拼接奠定基础。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号