首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
提出一种适用于超多类手写汉字识别的新改型Adaboost算法,采用基于描述性模型的多类分类器(modified quadratic discriminant function,MQDF)作为Adaboost基元分类器,可直接进行多类分类,无需将多类问题转化为多个两类问题处理,其训练复杂度大大低于已有的多类Adaboost算法。算法提出根据广义置信度更新样本权重,实验证明这种算法适用于大规模多类分类问题。为了降低算法的识别复杂度,提出从所有训练后得到的Adaboost基元分类器组中选择一个最优的基元分类器作为最终分类器的方法进行删减。在HCL2000及THOCR-HCD数据集上进行实验证明,所提改型Adaboost算法提高了识别率的有效性,该算法的相对错误率比现有最优算法分别下降了14.3 %,8.1 %和19.5 %。  相似文献   

2.
线性判决分析(lineardiscriminateanalysis,LDA)作为一种经典线性工具已经被广泛地运用在各种模式识别问题中,为了降低参数估计误差对于LDA性能的影响,我们提出了一种改进的线性判决分析(modi-fiedlineardiscriminateanalysis,MLDA)算法,并运用到手写汉字识别中,使得识别率有所提高。在此基础上,针对大类别的汉字识别问题,提出了两级LDA的手写汉字识别方法,即MLDA LDA。在对GB2312—80的1034个汉字类别的350套手写样本的实验表明,这个两级LDA识别策略针识别率较最小距离分类器有着3.77%的提高,较LDA 最小距离分类方法有1.71%的提高,表明方法的有效性。  相似文献   

3.
针对手写汉字中相似汉字的识别问题,构建了一种卷积神经网络(CNN)模型,并给出了其网络拓扑结构,通过随机弹性形变对样本集进行扩展,以提高模型的泛化性能.相似手写汉字的识别实验结果表明:相对于常规的CNN模型,文中CNN模型的手写汉字识别正确率提高1.66%,特别是对于变形的手写汉字,识别正确率提高12.85%;相对于传统的手写汉字识别方法,文中方法的识别错误率降低36.47%,从而验证了文中识别方法的有效性.  相似文献   

4.
基于笔划合并和动态规划的联机汉字切分算法   总被引:4,自引:0,他引:4  
联机手写汉字识别已从单字识别走向多字,乃至整篇文档的识别,字符的正确切分很大程度上决定了系统的性能.为了提高系统对整页文档的切分识别性能,该文提出了一种联机手写汉字的切分算法.通过基于规则的笔划合并将单个笔划合并成字符块,在此基础上,采用动态规划算法,利用字符块的长宽比、大小、间距以及识别信息,寻找出最优的切分路径.同时,对于手写汉字的任意性,提出了一种对汉字外接矩形框进行裁减的调整算法,使外接框并不包含整个汉字.实验证明,该文所提出的算法对于字数较多的多行样本以及存在字符相互粘连的情况,都有着很好的效果.  相似文献   

5.
基于支持向量机在线训练理论,采用MATLAB工具实现了一种在线增量学习算法。该实现方法调用LIBSVM工具包分类器训练函数和样本识别函数,将不能识别的样本作为增量数据重新训练分类器。设计的增量训练用户图形界面系统应用于手写数字的识别,结果表明了实现方法的正确性和有效性,并论证了增量训练能在兼顾新样本出现的情况下提高训练速度,提升手写数字识别的准确率。  相似文献   

6.
提出了一种基于粗网格与模式搜索相结合的支持向量机分类器模型参数优化方法,采用Jaakkola-Haussler误差上界作为模型选择的评价标准.以黎曼几何为理论依据,提出了一种新的保角变换,对核函数进行数据依赖性改进,进一步提高分类器泛化能力.在研究人工非线性分类问题的基础上,将该方法应用于手写相似汉字识别,实验结果表明分类精度得到了明显提高.  相似文献   

7.
无约束手写体支票金额汉字串识别系统   总被引:4,自引:0,他引:4  
针对手写支票金额汉字串分割和识别都十分困难的特点 ,提出了一种基于隐 Markov模型的 ,分割与识别相结合的算法。该算法具有如下的突出优点 :在分割方面 ,将偏旁部首作为分割的基本单位 ,充分考虑无约束手写汉字分割的各种交叠和粘连情况 ,降低了金额汉字串分割的难度 ;在识别方面 ,通过对字符识别结果采用多选 ,利用动态规划算法来对整串字符进行识别 ,提高了汉字串的识别率。作为处理分割困难的汉字串的一种新思路 ,该方法对于其他手写字符识别问题也具有重要的借鉴意义。  相似文献   

8.
为充分利用汉字结构、轮廓、笔画、书写顺序等特征识别相似汉字,提出基于特征向量和笔顺编码的字形相似算法,用以解决形近字检索中准确度不高的问题。算法采用图像处理方法及五笔编码规则将汉字转化为特征向量形式和笔顺编码字符串,引入二值化差值算法和改进后的Jaro-Winkler Distance算法分别对其进行相似度计算,2个相似度分别从不同方面反映汉字的相似程度,吸取2种方法的优势对其进行融合,得到最终字形相似度。实验结果表明,该算法在字形检索中较3元组递归算法准确率提高27.8%,较模板匹配算法、结构方法、神经网络算法执行效率平均提高约66.7%,该算法不仅可以有效解决形近字检索中的准确性问题,同时效率也得以优化。  相似文献   

9.
针对目前垃圾短信的识别算法存在的关键字及频次的规则死板,易于被不法分子探测和规避等问题,提出将局部敏感哈希的K邻近算法应用于垃圾短信分类识别;首先定义特征,然后采用局部敏感哈希算法计算向量距离,通过得到的距离衡量矩阵的相似性,量化矩阵相似程度,对本文中提出的优化模型进行实现和训练;基于短信文本内容,运用词频-逆向文本频率算法生成矩阵,利用局部敏感哈希算法求解最相似样本,记录样本类别,将训练结果导入K邻近算法分类器得到最优近邻,在测试集或验证集上对优化模型垃圾短信分类识别准确率进行评测。结果表明,经过K邻近算法分类器后,优化模型垃圾短信分类识别准确率达到98.7%。  相似文献   

10.
提出了一种基于编辑距离的图像轮廓8方向Freeman链码模板匹配算法度量两个链码序列的相似度进行手写数字字符识别。通过对自备手写数字字符样本库的分类,实验结果表明该算法的有效性。  相似文献   

11.
介绍了手写体汉字特征提取的基本概念,采用了一种叠合网络加权笔画提取方法用于提取有限集汉字特征。通过对径向基函数网络(RBF网络)的模型分析,提出了一种组合RBF网络分类器应用于有限集手写体汉字识别,并利用结合遗传算法和模拟退火算法的混合优化策略进行RBF分类器的训练。  相似文献   

12.
基于BP-bagging的手写体数字识别算法,以BP网络做基本分类器,用Bagging产生多个基本分类器,把每一个手写体数字作为一幅图像,通过扫描提取25维特征,并投影压缩生成5维特征向量,并输入到BP-bagging分类器,用简单多数投票法进行集成,实现手写体数字的分类识别.经反复的实验证明,该手写体数字识别算法具有...  相似文献   

13.
SVM可在训练样本很少的情况下获得很好的分类推广能力。首先分析了用多类SVM算法对车牌中的字符进行识别时存在不可区分的区域问题和采用模糊SVM算法解决该问题的办法,然后讨论了字符特征的提取方法,并根据我国车牌字符的特点分别设计了汉字、字母、数字、字母/数字4个基于模糊多类SVM的字符分类器。最后在MATLAB环境下,采用径向基核函数对算法进行学习训练。实验测试结果表明,该方法可以很好的提高字符识别的速率和效率。  相似文献   

14.
提出一种基于文字结构特征的神经网络手写汉字识别策略 ,根据所提取的文字笔画方向、基本轮廓和交叉点等特征 ,采用基于自组织神经网络的模式聚类该方法完成正规手写文字的识别 .该方法提取的笔画轮廓十分准确有效 ,对手写汉字的约束少 ,可识别的汉字数量大 ,在仿真实验中有效地识别了绝大多数手写汉字  相似文献   

15.
提出了一种手写汉字预分类的新方法.该方法分2步进行,首先采用有监督的扩展ART神经网络(SEART)产生一定数量的预分类组,然后通过模糊逻辑处理将各组字符分别转换成基于非线性加权函数的模糊样板,并通过基于模糊相似测量的匹配算法、相似性测量样板的分级分类进行预分类.测试结果表明,该方法效果良好,预分类正确率达到98.19%.  相似文献   

16.
基于笔划和笔顺的汉字识别算法   总被引:4,自引:0,他引:4  
以笔划为基元结构笔划的顺序来表示汉字的结构信息,在此基础上提出了一种笔写汉字识虽的匹配算法,对于结构类似的汉字,该算法可以通过特征关系予以识别,从而提高汉字的识别率。  相似文献   

17.
在大样本测试集下国内现有成熟的OCR识别软件的首位识别准确率为95%~97%之间,在准确率和方法上仍有提升和改进的空间。提出一种基于概率特征和结构特征融合的自适应文字识别算法,模拟人类学习的模式,通过对训练样本的不断学习去构建汉字在测量空间的概率分布矩阵,然后比对原始图像和标准汉字库中汉字的概率分布矩阵的相似度来达到汉字分类的效果。其中相似度度量准则是从矩阵空间的结构和概率2个角度出发去构建的,充分考虑了结构模式识别和统计模式识别的优缺点。实验结果显示算法在训练样本下的首位识别正确率可以达到99.66%,在1 623张非训练样本文字图像下的首位识别正确率可以达到99.13%,在5 515张非训练样本文字图像下的首位识别正确率可以达到98.57%。可以证明提出的相似度度量方法在文字识别中的有效性。  相似文献   

18.
本文针对在手写字符识别中由于书写习惯和风格的不同造成字符模式不稳定的问题,提出了一种基于流形学习重建的手写体数字识别方法。该方法与传统的流行学习识别方法不同,传统的方法是先对待识别模式进行降维,然后再对降维后的特征进行分类识别;本文提出基于重建的LLE算法(简称RLLE)。该算法首先分别对每一类字符训练样本进行LLE降维,得到每一类字符降维后的向量。然后将待识别字符分别在每一类字符中进行降维,并依据该降维后的矢量在每一类中对字符进行重建。最后选取重建误差最小的为待识别的所属的类。通过对MINST字库的一系列实验表明该算法具有较高的识别率,同时该方法为手写体数字识别的研究提供了一条有效的新途径。  相似文献   

19.
基于融合特征和LS-SVM的脱机手写体汉字识别   总被引:3,自引:0,他引:3  
提出的脱机手写体汉字识别系统主要研究特征提取和分类识别两个模块.特征提取模块主要包括采用基于不变矩和弹性网格技术的串行特征融合方法,所得到的特征向量不仅充分反映了手写体汉字的全局和局部特征,而且具有很强的区分表达能力.分类识别模块将神经网络多类分类策略与最小二乘支持向量机相结合,所得到的分类器不仅识别率高、泛化能力强,而且有效地解决了多类分类问题.实验证明本文提出的识别系统能够取得很好的识别效果.  相似文献   

20.
兼顾连笔和笔顺的联机手写汉字识别方法   总被引:4,自引:0,他引:4  
为解决联机手写汉字识别技术中兼顾连笔和笔顺的难题,提出了联机手写汉字的模糊属性关系图描述和基于知识的松驰匹配方法。该方法能充分描述汉字结构、对手写变形不敏感,并具有良好的连笔字识别能力和适应不同笔顺的特点。基于上述方法,作者实现了一个联机手写汉字识别系统。实验结果表明,本方法能够有效地增加对于低限制书写汉字的识别正确率,并具有较好的抗噪声能力。经过22530汉字测试,首位识别率达98.8%,前十位识别率达99.7%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号