首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
手写体中文的自动识别是中文文档数字化的前提和基础,由于中文字符数目繁多、相似性强、字体种类繁多、书写随意、缺乏统一规范等原因,一直是计算机视觉领域中一个具有挑战性的问题.为解决这一难题,提出了一种基于卷积神经网络的手写体中文识别方法.在经典LeNet-5网络模型的基础上进行改进,提出了一种LeNet-Ⅱ模型.利用改进的Inception模块和空洞卷积,设计了一种并行的双路卷积神经网络结构;两路分支可分别提取手写中文图像中不同尺度的特征,获得多个尺度的特征图像;通过对其进行特征融合,可以达到丰富特征图像多样性、提升识别准确率的目的;最后经过全连接层进行分类.利用经典手写体中文数据集进行训练,利用该模型实现了3 755类手写体中文字符及相关文本的自动识别.实验结果表明,基于改进LeNet-5模型的手写体中文识别方法,在同一训练数据集上的收敛速度和识别准确率明显优于经典LeNet-5模型,对经典数据集的识别准确率可以达到95.21%,也高于其他传统算法;此外,对4幅手写体中文文本的平均识别准确率达到97.30%,超出了人类表现,取得了理想的实际效果.  相似文献   

2.
针对传统的工件识别流程是由人工根据工件的特点设计需要提取的特征,整个过程具有耗时高、成本大、通用性较差和识别准确率不高等问题,改进了经典的卷积神经网络模型AlexNet和LeNet-5,通过将AlexNet网络的输入图像尺寸缩小到120×120,用BN层代替LRN层,减少两层卷积和全连接层,用3×3的卷积核代替第一层卷积层11×11的卷积核;将LeNet-5的输入图像尺寸提升至60×60,用ReLU取代原始Sigmoid激活函数,使用多个小卷积核代替大卷积核;分别使用改进前后的网络模型对工件数据集进行训练、测试.结果表明,改进后的两种网络模型,在测试集上分别达到94.31%和92.75%的平均识别准确率,平均识别时间分别为0.271s和0.321 s,满足生产需求.  相似文献   

3.
张荣梅  张琦  陈彬 《科学技术与工程》2020,20(12):4775-4779
传统的车牌识别算法包括模板匹配、特征统计等方法,但是这些算法依赖于人工提取图像特征,识别准确率低。卷积神经网络LeNet-5算法能够自动提取车牌图像的特征,提高车牌识别准确率。但是目前基于LeNet-5网络结构的车牌识别算法存在识别不完整,运算时间长等缺点。提出基于改进的LeNet-5网络的车牌识别算法,该算法将输入车牌字符图像归一化为32×16大小,并通过删除传统LeNet-5网络中的C5层、修改输出层中神经元个数等,将车牌字符按照汉字和数字/字母的形式识别输出。通过采集大量车牌数据进行训练验证,结果表明:与前人改进的LeNet-5网络结构相比,本文算法在识别率和时间效率上均得到了提高。  相似文献   

4.
以真实场景中拍摄的交通标志图像数据集GTSRB为研究对象,将卷积神经网络与支持向量机相结合,提出一种基于二级改进LeNet-5的交通标志识别算法。该算法首先根据识别系统的实时性要求,对原始LeNet-5结构进行改进;然后用裁剪、灰度化、图像增强和尺寸归一化等操作对原始图像进行预处理,得到32×32的感兴趣区域;接下来,利用数据集GTSRB训练出一个二级改进LeNet-5,其中第一级改进LeNet-5将感兴趣区域中包含的交通标志粗分为6类,第二级改进LeNet-5对粗分类结果进行细分类,识别出交通标志所属的最终类别。实验结果表明,基于二级改进LeNet-5交通标志识别算法因网络模型能够提取交通标志的多尺度特征,识别正确率可达91.76%。  相似文献   

5.
手写体数字因其书写风格差异大、上下文无关及识别准确度要求高等原因导致其识别难度大,针对手写体数字识别的特点及要求,使用深度学习算法进行分类,通过对样本的训练完成手写体数字的识别,同时与SVM算法及BP神经网络分类效果进行对比;实验结果表明深度学习在识别手写体数字时具有更高的准确率。  相似文献   

6.
针对藏文图像文本识别在Android系统上的应用问题,提出了一种基于混合注意力机制神经网络模型(CBAM-LeNet-5)的藏文图像文本识别方法,并采用Android平台研发了APP,实现印刷体藏文文本图像预处理、字丁分割以及识别等功能.经实验,改进后的网络模型比传统的LeNet-5模型识别率提高了2.36个百分点,表...  相似文献   

7.
针对高光谱图像分类中光谱特征的高度非线性问题,提出一种基于多层感知器卷积层和批标准化层的改进卷积神经网络模型,提高模型在光谱域处理的非线性特征提取能力.该算法通过构建七层网络结构,实现多层局部感知结构,逐个像素对光谱信息开展分析,区分不同目标物的光谱信息,将全光谱段集合作为输入,舍去空间信息,利用动量梯度下降训练算法对多层局部感知卷积神经网络训练,实现对不同目标物体光谱特征的提取与分类.实验中,采用两组高光谱遥感影像进行对比分析,以Pavia University数据集为例,在3 600个训练样本情况下,测试集为1 800个样本,本文方法正确率为90.23%,LeNet-5正确率为87.94%,Linear-SVM正确率为90.00%;在21 000个训练样本情况下,测试集为全部样本,本文方法正确率为97.23%,LeNet-5正确率为96.64%,Linear-SVM正确率为92.40%.实验结果表明,在训练集较小的情况下,本文方法优于传统神经网络,能有效提取数据特征,并且在精度上和计算成本上略优于在小样本分类中具有高效和鲁棒性良好的SVM算法.在大规模训练集时,本文方法表现出良好的...  相似文献   

8.
以真实场景中拍摄的街景门牌号码图像数据集SVHN为研究对象,将卷积神经网络与支持向量机相结合,提出了一种基于改进LeNet-5的街景门牌号码快速识别方法.该方法首先对数据进行图像增强预处理,突出有效特征;然后,省去基本LeNet-5中的第3卷积层,并用SVM分类器代替最后输出层中的Softmax分类器,以简化网络结构的同时提高分类效率.在国际公开的SVHN数据集的实验结果表明,改进LeNet-5可以有效识别街景门牌号码,7h便可训练得出结构稳定的网络识别模型,识别率达到90.35%,提高了算法的综合效率.  相似文献   

9.
为了提高自然环境下苹果病虫害的识别准确率和识别效率,提出了具有动态学习特征的VGG-F苹果病虫害识别模型。首先,依据常见的苹果病害和虫害类型构建图像数据集,同时采用Retinex算法对数据集中的含雾图像进行增强处理;然后选择网络层数较少的VGG-F网络模型作为迁移学习对象,并依据数据样本特性对重训练过程进行学习率动态调整,以及基于试验对比选取最佳动量值;最后,利用数据集对三种不同模型进行重训练和识别效果对比测试。数值测试结果表明,相比于原始VGG-F模型和深层模型VGG-19,文中模型将苹果病虫害识别准确率分别提升了5%和0.63%,且该模型的重训练时间最短,从而验证了文中苹果病虫害识别模型的有效性。  相似文献   

10.
史静 《科技信息》2011,(10):134-134
本文主要研究了一种基于BP网络的手写体数字识别方法。根据手写体数字的几何结构提取特征值,将这些特征和大量手写体数字样本送入BP神经网络,最后,使用训练好的BP网络识别手写体数字。结果表明,该识别方案达到了一定的有效性和实用性。  相似文献   

11.
本文通过对现在流行的各种识别技术的分析比较,以及对吾美藏文手写体特征的深入分析研究,提出了一套基于BP神经网络分类器的吾美藏文OCR识别方案。基于该技术,开发出一个吾美藏文识别系统。结果表明,依赖特定人的辅音字母识别率达到95%以上。  相似文献   

12.
张阳  张涛  陈锦  王禹  邹琪 《北京理工大学学报》2019,39(12):1258-1262
网络入侵检测已经广泛运用机器学习模型,但是研究者们多关注模型选择和参数优化,很少考虑数据不平衡的影响,往往会导致少数类入侵样本的检测效果较差.针对该问题,以SMOTE (synthetic minority oversampling technique)数据再平衡算法为研究重点,应用入侵检测数据集KDD99作为原始训练集,使用简单抽样和SMOTE算法生成再平衡训练集.采用多种机器学习模型分别在原始训练集和再平衡训练集进行5折交叉验证.实验结果表明,与原始训练集相比,使用再平衡训练集建模能够在不降低甚至提高多数类样本识别效果前提下,使少数类样本的识别准确率和召回率增强10%~20%.因此,SMOTE算法对不平衡样本下的网络入侵检测有显著的提升作用.   相似文献   

13.
在手写体字符识别研究中,由于书写风格的不同造成了字体变化大,导致识别难度很大,采用面积滤波对数字图像预处理消除离散点,使用Fisher分类器对样本进行分类识别,进行了手写体数字识别研究与实现,分类器识别正确率为96%.  相似文献   

14.
利用卷积神经网络在图像识别方面的优势,提出了一种基于深度卷积神经网的哈萨克手写字母识别方法(DCNN-KLR),成功建立了一种哈萨克手写文字识别模型。 与传统的方法(SVM+HOG)相比,不仅训练方便、速度快,而且提高了哈萨克手写文字的识别率。在5708个数据样本上进行训练和测试,将样本分为33类和100类,正确识别率分别达到93.29%和92.38%。  相似文献   

15.
为解决EEG自动检测的错误率非常高的问题,提出了一种基于深层卷积神经网络(CNN)对脑电图进行异常检测的方法:首先,对多个异构数据源按标准进行重构和预处理,生成了有118 716个样本的训练集和有12 022个样本的测试集;然后,构建有快捷连接的深层CNN模型,以自动化学习ECG特征并进行分类识别;接着,将模型在训练集上进行试验与调参,保存了性能最好的模型参数;最后,在测试集上进行预测.预测结果显示该模型达到了94.33%的分类准确率.通过所提方法对脑电信号进行处理与分析,能够自动提取EEG特征并进行异常识别,从而达到快速检测与辅助诊疗的目的.  相似文献   

16.
单样本学习的目的是利用一个包含大量训练样本的源类别数据集以及每个类别只包含一个训练样本的目标类别数据集来构建一种学习算法,使得算法能够对目标类别空间中的样本进行准确分类.已有的单样本学习算法主要是先利用源类别数据来训练模型,然后在测试时将目标类别训练数据作为支持集来实现对未标注样本的分类,因此在训练时没有有效地利用支持集的信息.为此提出一种在训练阶段和测试阶段同时利用支持集信息的单样本学习算法,基本思想是利用孪生神经网络构建模型并在训练时加入支持集信息,即让不同类别的支持集样本之间的相似度尽可能小.在Omniglot数据集和满文识别问题上的实验结果表明,该算法能取得较好的识别准确率.  相似文献   

17.
以花生检测国家标准GB/T 5497为基础,采用近红外光谱检测技术对花生含水率是否达标进行检测. 实验配制了30个不同含水率的花生样本,其中18个样本含水率达到国家标准,12个未达标,将样本分为训练集和测试集,通过近红外实验获取不同含水率的花生对不同波长光的吸收情况,将采集的数据作为BP神经网络的输入参数,在训练集对神经网络进行学习和训练,然后采用该模型,对测试集花生含水率是否达标进行测试. 实验表明,基于近红外光谱技术和神经网络的识别方法可全部正确识别测试集样本.  相似文献   

18.
数字识别是近年来发展起来的一项新科技,具有广泛的应用前景。该文主要利用MLP网络结构实现手写体数字的识别。首先,设计网络模型对识别精度进行测试。然后提取结构特征并输入网络模型验证其正确性。  相似文献   

19.
KNN算法用于手写数字识别的时候,需要将待识别的手写数字图像(测试集)与一些已知的手写数字图像(训练集)联合在一起求向量之间的最短距离,才能判断待识别数字图像的分类.设计了一种将测试集图像中的数据与尺寸转换为与训练集图像完全相似的转换算法,并在此基础上,将测试集和训练集都转换成有相同列数量的一维向量,进而求出向量之间的距离,并通过编写Python程序对该算法进行了验证.测试结果表明,该方法对手写数字图像的正确识别率能够达到95%以上.  相似文献   

20.
基于BP-bagging的手写体数字识别算法,以BP网络做基本分类器,用Bagging产生多个基本分类器,把每一个手写体数字作为一幅图像,通过扫描提取25维特征,并投影压缩生成5维特征向量,并输入到BP-bagging分类器,用简单多数投票法进行集成,实现手写体数字的分类识别.经反复的实验证明,该手写体数字识别算法具有...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号