首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 390 毫秒
1.
张荣梅  张琦  陈彬 《科学技术与工程》2020,20(12):4775-4779
传统的车牌识别算法包括模板匹配、特征统计等方法,但是这些算法依赖于人工提取图像特征,识别准确率低。卷积神经网络LeNet-5算法能够自动提取车牌图像的特征,提高车牌识别准确率。但是目前基于LeNet-5网络结构的车牌识别算法存在识别不完整,运算时间长等缺点。提出基于改进的LeNet-5网络的车牌识别算法,该算法将输入车牌字符图像归一化为32×16大小,并通过删除传统LeNet-5网络中的C5层、修改输出层中神经元个数等,将车牌字符按照汉字和数字/字母的形式识别输出。通过采集大量车牌数据进行训练验证,结果表明:与前人改进的LeNet-5网络结构相比,本文算法在识别率和时间效率上均得到了提高。  相似文献   

2.
为解决AlexNet网络模型在中药饮片图像识别中存在的识别准确率和鲁棒性不够理想的问题,以常见的50种中药饮片为研究对象,对AlexNet网络模型进行改进优化。首先通过拍摄以及搜索引擎获取中药饮片图像,并对图像进行数据扩充以及细节增强预处理。其次对AlexNet网络模型进行优化改进,通过缩减原网络的卷积核个数和卷积核大小、使用全局平均池化(global average pooling, GAP)替代全连接层以减少网络参数;去除局部响应归一化(local response normalization, LRN)层、引入批量归一化(batch normalization, BN)层和使用Lion优化算法替代随机梯度下降(stochastic gradient descent, SGD)优化算法以提高网络训练速度;使用Mish激活函数替代ReLU激活函数和引入通道注意力机制SENet网络以提高模型的识别精度。实验结果表明,改进后的网络模型相比于AlexNet网络模型,平均识别率提高了6.1%,平均损失率下降了14.4%,网络参数由原来的60 M缩减至1 M,该结果表明在中药饮片数据集上,改进...  相似文献   

3.
以样本少且欠均衡的高信噪比秦简文字图像为研究对象,提出一种基于改进的轻量级AlexNet网络模型的秦简文字识别算法。首先,构建秦简单文字图像数据集,对其进行增强降噪、图像归一化等预处理操作;其次,调整AlexNet网络模型结构,构建4层卷积层与池化层的顺序连接,并在前2层卷积层分别融入InceptionA与InceptionC结构,以分解卷积的形式对秦简文字进行局部特征提取,选取ReLU函数作为模型的激活函数,并在全连接层融入Dropout层进一步防止模型出现过拟合现象;最后,调用Softmax分类器完成秦简文字图像识别。研究结果表明:该网络模型在轻量化与识别准确率的表现上具有明显的优势,平均识别耗时为635 ms,识别准确率达到了99.89%,识别效果良好,可为秦简文字识别理论研究提供参考。  相似文献   

4.
以真实场景中拍摄的交通标志图像数据集GTSRB为研究对象,将卷积神经网络与支持向量机相结合,提出一种基于二级改进LeNet-5的交通标志识别算法。该算法首先根据识别系统的实时性要求,对原始LeNet-5结构进行改进;然后用裁剪、灰度化、图像增强和尺寸归一化等操作对原始图像进行预处理,得到32×32的感兴趣区域;接下来,利用数据集GTSRB训练出一个二级改进LeNet-5,其中第一级改进LeNet-5将感兴趣区域中包含的交通标志粗分为6类,第二级改进LeNet-5对粗分类结果进行细分类,识别出交通标志所属的最终类别。实验结果表明,基于二级改进LeNet-5交通标志识别算法因网络模型能够提取交通标志的多尺度特征,识别正确率可达91.76%。  相似文献   

5.
针对传统LeNet-5卷积神经网络用于交通标志等多种类识别任务中,存在识别正确率低、网络容易过拟合以及梯度消失等问题进行改进。引入Inception卷积模块组来提取目标丰富的特征,同时增加网络的深度。引入BN (batch normalization)层对输入批量样本进行规范化处理;同时改用性能更好的Relu激活函数,并使用全局池化层代替全连接层,合理改变卷积核的大小和数目。研究结果表明,改进LeNet-5网络能够有效解决过拟合和梯度消失等问题,具有较好的鲁棒性;网络识别率达到98. 5%以上,相比CNN (convolutional neural network)+SVM (support vector machine)提高了约5%,比传统的LeNet-5网络提高了3%。可见,改进后的LeNet-5网络图像识别的准确率得到显著提高。  相似文献   

6.
针对传统图像识别算法过程繁琐、特征提取困难等问题,提出一种基于深度特征学习的图像自适应目标识别算法。首先对每层网络单个特征图的输入进行批量归一化(BN)处理,其次采用参数化线性修正单元PReLU对参数进行自适应调节,比较BN算法作用在激活函数前后输出的表现性能,构建自适应卷积神经网络模型CNN-BN-PReLU.实验从网络层数、卷积核数目、网络优化及经典卷积神经网络模型4个方面进行比较分析,结果表明,在DDSM数据集上,CNN-BNPReLU较优化前准确率提高了8.5%,训练时间大幅减少71.83%,其敏感度、特异度及AUC值均有显著提升,分别达到了96%,87%和0.91,识别效果远高于LeNet-5和AlexNet,具有较好的应用价值。  相似文献   

7.
手写体中文的自动识别是中文文档数字化的前提和基础,由于中文字符数目繁多、相似性强、字体种类繁多、书写随意、缺乏统一规范等原因,一直是计算机视觉领域中一个具有挑战性的问题.为解决这一难题,提出了一种基于卷积神经网络的手写体中文识别方法.在经典LeNet-5网络模型的基础上进行改进,提出了一种LeNet-Ⅱ模型.利用改进的Inception模块和空洞卷积,设计了一种并行的双路卷积神经网络结构;两路分支可分别提取手写中文图像中不同尺度的特征,获得多个尺度的特征图像;通过对其进行特征融合,可以达到丰富特征图像多样性、提升识别准确率的目的;最后经过全连接层进行分类.利用经典手写体中文数据集进行训练,利用该模型实现了3 755类手写体中文字符及相关文本的自动识别.实验结果表明,基于改进LeNet-5模型的手写体中文识别方法,在同一训练数据集上的收敛速度和识别准确率明显优于经典LeNet-5模型,对经典数据集的识别准确率可以达到95.21%,也高于其他传统算法;此外,对4幅手写体中文文本的平均识别准确率达到97.30%,超出了人类表现,取得了理想的实际效果.  相似文献   

8.
以真实场景中拍摄的街景门牌号码图像数据集SVHN为研究对象,将卷积神经网络与支持向量机相结合,提出了一种基于改进LeNet-5的街景门牌号码快速识别方法.该方法首先对数据进行图像增强预处理,突出有效特征;然后,省去基本LeNet-5中的第3卷积层,并用SVM分类器代替最后输出层中的Softmax分类器,以简化网络结构的同时提高分类效率.在国际公开的SVHN数据集的实验结果表明,改进LeNet-5可以有效识别街景门牌号码,7h便可训练得出结构稳定的网络识别模型,识别率达到90.35%,提高了算法的综合效率.  相似文献   

9.
随着物联网的兴起、电子商务的蓬勃发展,依据图像特征对商品进行有效检索和分类具有重要应用价值.针对传统图像分类方法提取特征复杂,浅层卷积神经网络分类效果不佳的问题.本文对经典的AlexNet进行改进,优化了卷积核的尺寸,改变了各层连接,提出了一种分类效果更好的卷积神经网络结构.通过对8种商品进行测试训练,本文网络的分类准确率达到了91.2%,分类结果明显高于AlexNet的85.9%.  相似文献   

10.
针对目前现有交通标志识别算法耗时长、识别率低等问题,提出了一种改进的LeNet-5卷积神经网络模型(Improved LeNet-5Convolutional Neural Network,ILN-CNN).首先,对原有的LeNet-5卷积神经网络模型构造2个相对独立的不同卷积核的子卷积网络,用于加快特征提取;其次,增加子网络中卷积核的个数,以增强网络区分不同交通标志的能力;最后,添加激活函数ReLU,增加Dropout层,以达到加快函数收敛,避免CNN过度拟合,降低神经元间互适应的效果.实验结果表明:与传统的系统结构相比,ILN-CNN对交通标志的识别准确率达到93.558%;比BP神经网络模型、支持向量机分类算法分别提高了12.206%和4.018%,并且在识别时间上具有一定的优势.  相似文献   

11.
Caffe是目前广泛应用于计算机视觉处理的深度学习框架之一,支持卷积神经网络的模型训练与预测。本文利用caffe支持的AlexNet卷积神经网络分别基于加载与不加载基础模型两种模式对五类动物图片进行分类学习与训练,发现加载基础模型的网络模型收敛耗时仅2.77 s,测试集准确率接近100%,实用测试准确率达到99%,且训练与测试损失曲线高度重合,但另一模式的网络模型收敛耗时多达68.89 s,测试集准确率仅为95%,实用测试准确率仅94%,且训练与测试损失曲线存在严重分化。图像分类不仅可以对不同物类的图像进行准确分类,同样可以对不同属性、状态或特性的图像进行准确分类。  相似文献   

12.
结合机器人的工作原理以及卷积神经网络(CNN)在图像分类中的应用,提出了一种基于卷积神经网络的壁面障碍物检测识别算法.首先,以壁面障碍物准确识别为目标,构建壁面障碍物图像库;然后,通过对VGG-16网络简化后进行优化,得到适合壁面障碍物准确识别的卷积神经网络模型.在此基础上,设计该网络由输入层、4层卷积层、2层池化层、1层全连接层以及输出层组成,进一步利用3×3卷积核对训练样本进行卷积操作,并将所获取的特征图以2×2领域进行池化操作.重复上述操作后,通过学习获取并确定网络模型参数,得到最佳网络模型.实验结果表明,障碍物的识别准确率可达99.0%,具有良好的识别能力.  相似文献   

13.
基于改进卷积神经网络的苹果叶部病害识别   总被引:2,自引:0,他引:2  
针对苹果病害叶片图像病斑区域较小导致的传统卷积神经网络不能准确快速识别的问题,提出基于改进卷积神经网络的苹果叶部病害识别的网络模型.首先,将VGG16网络模型从ImageNet数据集上学习到的先验知识迁移到苹果病害叶片数据集上;然后,在瓶颈层后采用选择性核(selective kernel,简称SK)卷积模块;最后,使用全局平均池化代替全连接层.实验结果表明:与其他传统网络模型相比,该模型能更准确快速捕获苹果病害叶片上微小的病斑.  相似文献   

14.
关生  周延森 《科学技术与工程》2022,22(36):16108-16115
针对卷积神经网络模型待训参数量过大、多层网络导致特征和梯度消失等问题,论文提出了一种基于拆分层和Inception-ResNet的卷积神经网络模型用于入侵检测。首先将网络流量数据转化为具有空间相关性的图像以适用于卷积神经网络的输入;然后使用Inception-ResNet卷积层增加网络深度,减少模型训练参数数量以及消除梯度消失问题,拆分层在降低图像尺度时基本保持图像原有分类特征;最后采用NSL-KDD数据集对改进模型进行训练和测试。测试结果表明,改进模型相对于Inception-ResNet模型具有更高的检测准确率和少数类样本召回率以及更好的训练时间性能。  相似文献   

15.
为了从广域视角准确提取道路交通信息,提出了一种用于无人机视频车辆自动识别的改进Faster R-CNN模型.该模型以基于ZF网络的Faster R-CNN为原型,优化调整学习策略、训练图像尺寸、学习率等模型参数,调整RPN网络卷积核并引入SoftNMS算法,增加1~3个特征提取卷积层和激活层.基于无人机交通视频构建了训练图像集,对现有Faster R-CNN模型及改进模型进行训练和测试.结果显示,与采用Step学习策略的模型相比,采用学习策略Inv的模型车辆识别平均准确率提高了0.4%~9.4%.引入SoftNMS算法的模型比引入前的模型平均准确率提高了0.1%~7.9%.提出的改进模型平均准确率为94.6%,较基于ZF的Faster R-CNN模型、基于VGGM的Faster R-CNN模型和基于VGG16的Faster R-CNN模型分别提高了13.1%、13.1%和4.1%,且训练时间减少约3%,对多种场景的视频车辆检测具有较好的适用性.  相似文献   

16.
针对目前的人脸识别算法在面对不同姿态下的人脸图像时识别率低的问题,提出了一种基于改进的卷积神经网络的算法。该算法通过对经典的卷积神经网络LeNet-5 的卷积核数目、卷积核尺寸、池化层方式和正则化手段等参数进行了优化改进,从而能对多姿态人脸图像特征进行有效提取。仿真实验结果表明,该算法在识别率与识别时间上均有显著提高。  相似文献   

17.
为了有效解决类间相似度高、类内差异化大、数据类别不平衡的皮肤病变识别,提出了基于改进AlexNet的可变形卷积网络皮肤病变识别算法. 构建改进的AlexNet可变形卷积网络模型,增加采样偏移量,使不同位置的卷积核采样点可根据图像内容自适应变化,自动调整不同尺度或感受野,提取比标准卷积更精细的特征. 使用交叉熵损失函数和焦点损失函数的加权损失函数,削弱易分类样本在训练中所占的权重,使模型专注于相似度高、易错分的样本,解决样本比例不平衡的问题,优化模型的识别率. 在HAM10000数据集上进行仿真实验,主客观的实验结果表明, 提出的方法在7种皮肤病变上的识别优于现有方法,具有更高的准确性、特异性和鲁棒性.   相似文献   

18.
针对现有的基于深度学习检测缺陷的方法虽然可以保证分类的准确率,但其检测速度慢,模型占用内存大,难以满足在线检测系统的实时性要求等问题,提出了一种基于深度学习的偏光片缺陷实时检测算法。首先,设计了一个新的并行模块用于构建偏光片缺陷检测网络,模块将不同尺寸大小的卷积核相混合,与传统的卷积层相比,可以融合不同尺度的特征并能提取到更丰富的缺陷特征;用深度可分离卷积替代模块中的标准卷积,这可以大大减少网络的参数量和乘法累计运算量(MACCs).其次,用非对称卷积代替并行模块中的深度可分离卷积得到并行非对称卷积模块,可以进一步减少网络的参数量。最后,使用全局均值池化层代替全连接层,大大减少了网络的参数量。实验结果表明,偏光片缺陷分类模型平均每张图片的测试时间为108 ms,模型在测试集上的准确率达到99.4%,同时模型占用内存为0.583 MB,能够满足工业中偏光片缺陷检测的实时性要求。  相似文献   

19.
西红柿的成熟度对于采摘、运输和销售至关重要。针对西红柿需要在特定环境下识别问题,从种植现场拍摄图片来制作数据集,提出了一种基于双维度注意力机制的西红柿成熟度分类方法。首先通过tensorflow搭建卷积神经网络,网络中加入了改进的CBAM(convolutional block attention module)模块提取西红柿的成熟度和所在位置信息,即在通道注意力模块中并行一个共享多层感知器后的平均池化层;然后使用Adam优化器更新参数,此方法不仅缓解了网络中直接加入CBAM模块出现的不稳定问题,而且加快了损失函数的下降速度;最后通过调节学习率并使用混淆矩阵计算验证集的准确率获取最佳模型。实验结果表明,本文所提网络在训练了30个Epoch后损失函数稳定下降,搭建软件测试平台进行测试后得到准确率为99%,单张图片检测时间为1.5 s。检测时间和测试准确率均优于AlexNet网络,Grad-CAM可视化结果显示本文所提网络提取目标信息的效果优于AlexNet网络和改进之前的CBAM模块。本文所提方法适用于任意背景下的瓜果品级分类。  相似文献   

20.
在文字识别领域中,手写体识别比印刷体识别更具挑战性.藏文手写体识别已经成为重要的研究课题之一.本文提出了一种基于卷积神经网络LeNet-5模型的藏文手写数字和字母识别方法.分别采集藏文数字手写体样本和字母手写体样本17768和77636例,并对其进行预处理;然后按8∶2划分成训练集和测试集,并在CNN(LeNet-5)模型上进行训练.经过测试,数字和字母识别准确率分别达到98.81%和97.89%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号