首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
在文字识别领域中,手写体识别比印刷体识别更具挑战性.藏文手写体识别已经成为重要的研究课题之一.本文提出了一种基于卷积神经网络LeNet-5模型的藏文手写数字和字母识别方法.分别采集藏文数字手写体样本和字母手写体样本17768和77636例,并对其进行预处理;然后按8∶2划分成训练集和测试集,并在CNN(LeNet-5)模型上进行训练.经过测试,数字和字母识别准确率分别达到98.81%和97.89%.  相似文献   

2.
针对传统的工件识别流程是由人工根据工件的特点设计需要提取的特征,整个过程具有耗时高、成本大、通用性较差和识别准确率不高等问题,改进了经典的卷积神经网络模型AlexNet和LeNet-5,通过将AlexNet网络的输入图像尺寸缩小到120×120,用BN层代替LRN层,减少两层卷积和全连接层,用3×3的卷积核代替第一层卷积层11×11的卷积核;将LeNet-5的输入图像尺寸提升至60×60,用ReLU取代原始Sigmoid激活函数,使用多个小卷积核代替大卷积核;分别使用改进前后的网络模型对工件数据集进行训练、测试.结果表明,改进后的两种网络模型,在测试集上分别达到94.31%和92.75%的平均识别准确率,平均识别时间分别为0.271s和0.321 s,满足生产需求.  相似文献   

3.
以真实场景中拍摄的街景门牌号码图像数据集SVHN为研究对象,将卷积神经网络与支持向量机相结合,提出了一种基于改进LeNet-5的街景门牌号码快速识别方法.该方法首先对数据进行图像增强预处理,突出有效特征;然后,省去基本LeNet-5中的第3卷积层,并用SVM分类器代替最后输出层中的Softmax分类器,以简化网络结构的同时提高分类效率.在国际公开的SVHN数据集的实验结果表明,改进LeNet-5可以有效识别街景门牌号码,7h便可训练得出结构稳定的网络识别模型,识别率达到90.35%,提高了算法的综合效率.  相似文献   

4.
张荣梅  张琦  陈彬 《科学技术与工程》2020,20(12):4775-4779
传统的车牌识别算法包括模板匹配、特征统计等方法,但是这些算法依赖于人工提取图像特征,识别准确率低。卷积神经网络LeNet-5算法能够自动提取车牌图像的特征,提高车牌识别准确率。但是目前基于LeNet-5网络结构的车牌识别算法存在识别不完整,运算时间长等缺点。提出基于改进的LeNet-5网络的车牌识别算法,该算法将输入车牌字符图像归一化为32×16大小,并通过删除传统LeNet-5网络中的C5层、修改输出层中神经元个数等,将车牌字符按照汉字和数字/字母的形式识别输出。通过采集大量车牌数据进行训练验证,结果表明:与前人改进的LeNet-5网络结构相比,本文算法在识别率和时间效率上均得到了提高。  相似文献   

5.
以真实场景中拍摄的交通标志图像数据集GTSRB为研究对象,将卷积神经网络与支持向量机相结合,提出一种基于二级改进LeNet-5的交通标志识别算法。该算法首先根据识别系统的实时性要求,对原始LeNet-5结构进行改进;然后用裁剪、灰度化、图像增强和尺寸归一化等操作对原始图像进行预处理,得到32×32的感兴趣区域;接下来,利用数据集GTSRB训练出一个二级改进LeNet-5,其中第一级改进LeNet-5将感兴趣区域中包含的交通标志粗分为6类,第二级改进LeNet-5对粗分类结果进行细分类,识别出交通标志所属的最终类别。实验结果表明,基于二级改进LeNet-5交通标志识别算法因网络模型能够提取交通标志的多尺度特征,识别正确率可达91.76%。  相似文献   

6.
为了准确快速地识别原煤中的煤和矸石,基于机器视觉的方式,采取经典卷积神经网络模型对煤和矸石图像进行识别分类;利用在以实验室环境下采集的小批量煤和矸石图像数据,运用数据增强技术扩充数据集,在深度学习框架中搭建各种经典卷积神经网络模型,对采集的数据集进行训练、验证和测试,获得各经典网络的训练准确率和损失函数曲线,并结合训练...  相似文献   

7.
为了获取铭牌图像中的基本参数信息,提出一种基于深度学习的端到端文本识别模型TDRN(Text Detection and Recognition Network)。模型避免了图像裁剪和字符分割,将文本看作一个序列,使用BLSTM(Bidirectional Long Short-term Memory)来获取上下文关系。同时,将文本检测和文本识别整合在同一个网络中共同训练,共享卷积层,以提高整体性能,在文本识别中还引入了注意力机制。模型在公共场景文本数据集SVT(Street View Text)上测试表现良好,F值为68. 69%,高于一般的端到端文本识别模型。与传统铭牌识别方法相比,TDRN准确率更高,鲁棒性更强,能适应复杂的电力场景变化。  相似文献   

8.
岩性识别对地质勘查和储层评价具有重要意义,科学有效地开展岩性自动识别的相关研究能够有效地为勘查过程提供指导,减少工作的盲目性和冗杂性。针对常见的砂岩地层,选择三类砂岩,基于室内微钻试验台,设计钻杆转速、钻孔深度和钻孔位置三个变量,检测钻进过程中产生的振动和声音特征信号。将采集的振动和声音信号预处理,提高信噪比,生成数据集。将振动和声音的数据集按6∶2∶2的比例划分为训练集、验证集和测试集,之后分别构建二维卷积神经网络和一维卷积神经网络并使用训练集和验证集训练岩性识别模型,最后运用未经训练的测试集验证模型准确率。模型训练完成后,以频谱图为数据集的振动信号识别模型准确率达到95.19%,以梅尔频率倒谱系数为数据集的声音信号识别模型准确率达到73.58%。研究结果表明,不同岩性在钻进过程中产生的振动和声音信号具有不同信号特征,基于振动和声音信号的岩性自动识别方法可以较好地实现几类砂岩的自动识别,这为地质勘查时的岩性自动识别提供了参考与依据。  相似文献   

9.
基于改进VGG-16模型的英文笔迹鉴别方法   总被引:1,自引:0,他引:1  
笔迹鉴别是通过对待测文本和样本笔迹的相似度进行比较,来判定笔迹是否相同的一种检验技术,其在司法鉴定、法庭科学以及金融领域合同确认等多个领域都有广泛的应用.传统英文笔迹鉴别方法是通过比对被鉴别文本与模板的相似程度来实现,效率低,准确度差.近年来,随着深度神经网络技术的飞速发展,利用其自主学习的优势提取相关特征,可以大大提高笔迹鉴别的准确率.传统VGG-16模型在图像分类上一直表现良好,但由于网络结构一直采用顺次连接的方式,导致训练时间过长,参数调整难度大,且不能很好地提取图像的细微特征,因此对笔迹鉴定的效果不够理想.本文通过对传统VGG-16卷积神经网络模型进行改进,提出了一种CC-VGG网络模型,利用复合卷积层替换部分卷积层,实现了手写体英文笔迹的自动鉴别.在公开的CVL和ICDAR2013数据集上,该模型取得了较好的鉴别效果,平均正确率分别达到92.7%和86.9%,与现有算法相比准确率均有所提高.此外,建立了一个包含130类、共26 000张图片的手写英文笔迹图像数据集EI130,在该数据集上该模型也取得了较高的准确率.与其他算法的对比实验证明了本文算法在训练时间上具有优越性;此外,在多个数据集上的实验结果也证明了本文算法的有效性和先进性.  相似文献   

10.
【目的】为了探究深度学习方法用于林业树种图像智能识别的可行性,提出一种基于深度学习方法的自动识别树种新方法。在TensorFlow框架下,对卷积神经网络(CNN)模型进行改进,对7类树种图像进行自动识别研究。【方法】首先,在图像库建立时,为增加特征选择多样性,选择树木的树皮和树叶图像,保留自然背景;另外,考虑到同一树种在不同树龄条件下树皮图像存在差异,因此加入不同树龄的树皮图像,并用胸径指标来表示树龄大小。其次,对每类树种图像随机挑选100张作为测试集,剩余数据集全部作为训练集。通过反复试验比较不同CNN结构设置、卷积层数量、全连接层层数、学习率等对结果的影响。采用Adam算法代替传统的随机梯度下降(SGD)算法,对模型进行优化,用指数衰减法对学习率进行调节,在交叉熵函数中加入L2正则项对权重进行惩罚,并采用Dropout策略和ReLU激励函数,以避免训练过程中过拟合现象。最后,确定适合试验要求的13层CNN结构,同时比较深度学习方法和传统人工特征识别方法的差异,与已有的树种图像识别方法做对比。【结果】提出的13层树种图像识别模型,对训练集和测试集取得了理想的识别效果,识别率分别为96.78%、91.89%,在未参与训练的验证集上取得了96%的平均准确率。相对于已有的人工特征识别方法,所提出的方法识别效率和准确度更高。【结论】基于改进的卷积神经网络树种识别模型识别效果明显高于传统方法,说明所提出的方法能够应用于树种识别,可为林业树种图像自动识别提供一条新思路。  相似文献   

11.
手写数字识别在数据的自动读取、银行支票识别、邮政编码自动识别等领域有重要的实际应用价值.为了提高手写数字识别的准确率,提出一种将卷积神经网络与批量归一化(BN)网络结合来提取手写数字图片特征、并用支持向量机(SVM)进行分类的手写数字识别方法.经实验验证,所提出的手写数字识别方法准确率达到99.6%,相比于Vgg-16、Xception等改进卷积网络的识别准确率有较大的提高.  相似文献   

12.
针对传统图像识别算法过程繁琐、特征提取困难等问题,提出一种基于深度特征学习的图像自适应目标识别算法。首先对每层网络单个特征图的输入进行批量归一化(BN)处理,其次采用参数化线性修正单元PReLU对参数进行自适应调节,比较BN算法作用在激活函数前后输出的表现性能,构建自适应卷积神经网络模型CNN-BN-PReLU.实验从网络层数、卷积核数目、网络优化及经典卷积神经网络模型4个方面进行比较分析,结果表明,在DDSM数据集上,CNN-BNPReLU较优化前准确率提高了8.5%,训练时间大幅减少71.83%,其敏感度、特异度及AUC值均有显著提升,分别达到了96%,87%和0.91,识别效果远高于LeNet-5和AlexNet,具有较好的应用价值。  相似文献   

13.
花卉图像类内差异性大和类间相似性高使得花卉图像分类较难.传统花卉分类方法和普通卷积神经网络很难完整地表达花卉图像的特征,故而分类效果不理想.为提高花卉分类准确率,提出改进的InceptionV3网络用于花卉图片的分类.采用迁移学习的方法,将在大规模数据集上训练的InceptionV3网络用于花卉图像数据集的分类,对其中的激活函数进行改进.在通用Oxford flower-102数据集上的实验表明:该模型在花类图像分类任务中比传统方法和普通卷积神经网络分类准确率高,且比未改进的卷积神经网络准确率高,迁移过程准确率达到81.32%,微调过程准确率达到92.85%.  相似文献   

14.
针对传统稳态视觉诱发电位(SSVEP)脑电信号目标识别方法分类精度低、提取特征不充分、方法复杂且耗时等问题,提出一种基于多尺度特征融合卷积神经网络的SSVEP信号分类识别方法(SSVEP-MF)。利用小波变换将多通道SSVEP信号整合转化为二维图像作为输入样本集;建立多尺度特征融合卷积神经网络模型(MFCNN),该模型利用三层二维卷积核实现图像样本不同尺度特征的充分提取,构建多尺度特征融合单元对不同层级特征进行融合,并通过全连接等操作完成模型的训练;将样本集输入到MFCNN模型中实现脑电信号特征自适应提取及端到端分类。所提SSVEP-MF方法能够充分提取信号各层级特征,实现短时间视觉刺激下SSVEP信号的有效识别,并具有较高的目标识别效率。实验结果表明,在1 s刺激时长时,相比传统功率谱密度分析方法、典型相关分析方法以及普通卷积结构方法,所提方法的识别准确率分别提升了18.57%、20.08%及7.03%,有效提高了基于稳态视觉诱发电位范式下脑机接口的信号识别性能。  相似文献   

15.
为解决精细车型识别中特征不具有代表性,且识别准确率低的问题,提出了基于多尺度跃层卷积神经网络(CNN)的车型识别方法。通过多个不同尺度的跃层卷积神经网络,提取适用于精细车型识别的低层局部特征和高层全局特征,并分别训练Softmax分类器。利用自适应方式融合方法,将多个单一尺度跃层卷积神经网络的识别结果进行融合,调整不同网络对识别结果的贡献。实验中车型识别准确率达到97.59%。实验结果表明多尺度跃层卷积神经网络适用于精细的车型识别,并能提高识别的准确率。  相似文献   

16.
针对识别字轮式表盘数字时,出现耗时长、双半字符识别率不高、模型参数过大等问题,提出了一种改进残差网络的字轮式数字表盘识别算法。首先,对采集的表盘原始图像进行预处理操作,得到包含完整字符图像和双半字符图像的数据集;其次,对ResNet-18网络进行优化改进,引入深度可分离卷积和Dropout函数;最后,加载数据集进行训练和测试。实际验证结果表明:改进后的残差网络模型识别准确率达99.8%,模型参数大小减小到7.71 MB左右,模型平均推理时间缩短至12 ms左右。  相似文献   

17.
针对目前手绘草图识别难度大,识别准确率低且主要以手工提取特征为主,提出一种新的卷积神经网络结构DCSN( Deeper-CNN-Sketch-Net) 进行手绘图像识别。DCSN 模型是根据手绘草图的特点进行设计,如在首层采用了更大的卷积核获取草图的结构信息和更小的步长尽可能多保留特征信息,通过增加网络层数加深网络深度等。为进一步提高识别准确率,针对手绘草图的特点提出了两种新的数据增强方法,小图形缩减策略和尾部移除策略增加数据集的多样性,并利用扩充的数据集训练DCSN 网络。经实验验证,所提出的模型在目前最大的手绘图像数据集上可以取得70. 5% 的识别准确率,超过了目前存在的几种主流的手绘草图识别方法。  相似文献   

18.
针对传统机器学习方法在采用运动传感器数据的人体运动识别领域中识别效果严重依赖人工特征且准确率受限的问题,提出一种改进的卷积网络与双层长短期记忆网络的深层混合(VGGLSTM)模型以实现特征自提取并进行运动识别。该模型结合传感器数据层状、时序的结构特点,将多维传感器数据类比于图像的RGB矩阵进行适应性处理;由一维串联卷积网络与双层长短期记忆网络复合而成。实验结果表明,在开源的人体运动识别(HAR)数据集和无线传感器信息控掘(WISDM)数据集上采用该模型的人体运动识别方法的平均准确率分别达到了97.17%和96.53%,该模型可以有效避免复杂的特征工程,在人体运动识别问题中具有很好的准确性和适应性。  相似文献   

19.
为弥合抽象图像底层视觉特征与高层情感语义间的鸿沟,同时缓解抽象图像情感识别所固有的小样本缺陷,将两层迁移学习策略引入传统的卷积神经网络,提出一种基于两层迁移卷积神经网络的抽象图像情感识别模型.该模型利用深度特征的层次性,首先通过大规模通用图像数据集来学习提取普适的底层图像特征;然后利用抽象图像风格分类数据集来学习提取抽象图像的专有高层语义特征;最后采用抽象图像情感识别数据集来微调整个网络.MART数据集上的实验结果表明,与传统的抽象图像情感识别方法相比,所提出的模型能够有效地提高识别精度.  相似文献   

20.
针对粘连、扭曲,且存在干扰噪声的验证码图像识别性能欠佳的问题,结合卷积神经网络提出一种通用的基于图像分割的验证码字符识别方法。首先对传统Otsu阈值分割算法的阈值选取策略进行改进,提出基于局部最优阈值分割的Otsu法对验证码图像进行二值化处理。其次,采用改进的融合字符积分投影特性的复杂验证码字符分割方法对存在粘连情况的字符进行二次分割。最后,将分割得到的单个字符归一化后直接输入到基于卷积神经网络的LeNet-5模型中进行训练和识别,并输出识别结果。大量网站验证码图像的实验测试结果表明,提出的方法对粘连、扭曲,且存在干扰噪声的字符验证码图像有着较高的识别率和适应性,有效克服经典方法对于不同种类验证码识别的针对性和局限性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号