首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
张荣梅  张琦  陈彬 《科学技术与工程》2020,20(12):4775-4779
传统的车牌识别算法包括模板匹配、特征统计等方法,但是这些算法依赖于人工提取图像特征,识别准确率低。卷积神经网络LeNet-5算法能够自动提取车牌图像的特征,提高车牌识别准确率。但是目前基于LeNet-5网络结构的车牌识别算法存在识别不完整,运算时间长等缺点。提出基于改进的LeNet-5网络的车牌识别算法,该算法将输入车牌字符图像归一化为32×16大小,并通过删除传统LeNet-5网络中的C5层、修改输出层中神经元个数等,将车牌字符按照汉字和数字/字母的形式识别输出。通过采集大量车牌数据进行训练验证,结果表明:与前人改进的LeNet-5网络结构相比,本文算法在识别率和时间效率上均得到了提高。  相似文献   

2.
针对花样滑冰运动人体运动轨迹复杂、动作类型多样、普通人肉眼难以区分且常规的行为识别方法识别准确率低的问题,提出了一种基于时空图卷积网络与多通道注意力机制融合方法 (SAT-GCN)的花样滑冰动作识别算法。该算法首先将视频提取成连续的单独帧,使用OpenPose算法提取人体骨骼关键点数据,降低背景噪声干扰;然后使用时空图卷积算法对骨骼关键点数据进行动作分类。算法对时空图卷积算法进行改进,加入了多通道时空注意力机制融合模块,使得模型更加关注重要的关键点、时间帧片段、特征;使用时序卷积网络(TCN)提取人体骨架关键点在时间序列上的特征;使用SoftMax对提取后的特征进行动作分类。在花样滑冰数据集FSD-10和公开的人类行为数据集Kinetics-Skeleton上进行训练和测试,与改进前的时空图卷积网络(ST-GCN)进行对比,本文所提算法的预测准确率在2个数据集上均有所提升,验证了多通道注意力机制融合方法在花样滑冰选手动作检测任务中的有效性。  相似文献   

3.
为提高复杂信道环境下无线通信系统对调制信号的检测识别能力,以及针对当前调制识别方法存在的模型复杂、计算量大、输入数据特征不完备等问题。提出一种改进的深度学习算法模型,对真实无线环境下的9种常见调制信号进行识别研究。该算法通过对原始的同相正交(in-phase quadrature, IQ)数据进行幅度相位计算,以此增加模型输入数据的特征信息,采用改进的密集神经网络(dense neural network, DenseNet)对常见调制信号进行识别分类。实验结果表明:在相同的训练数据样本中,相比其他深度学习调制识别算法,改进算法性能最优。在信噪比为0时,DenseNet平均识别率达到84.6%。改进的IQ输入数据明显提高了无线信号的检测识别率,在信噪比为-10 dB和-5 dB时,调制信号的识别率提高了10%。  相似文献   

4.
为了对灾难场景图像进行快速分析和识别,提出了一种基于多分辨率卷积神经网络和残差注意力机制(attention module)相结合的图像分类模型.首先,对灾难场景数据集进行预处理,在相同类型的条件下将其随机划分为训练集和测试集.基于改进的卷积神经网络(convolutional neural network,CNN),提取训练集的图像特征.使用训练集图片的特征进行训练,并且在测试集图片上实现分类测试.选取DenseNet、Xception和MobileNetV2三种模型,以灾难场景数据集(Disaster_Data_Scenes)为数据集进行实验验证.结果表明:改进的Xception和MobileNetV2网络在灾难场景数据集上进行的图像分类实验测试,比原网络精度分别提升了4.56%和3.04%.其中改进的DenseNet网络比原网络模型精度分别提升9.13%、17.88%和10.27%.可见改进的卷积神经网络模型的分类精度得到有效提高.  相似文献   

5.
针对复杂实际场景中模糊、污损、扭曲、倾斜等车牌图像关键信息缺失以及新能源车牌背景与字符对比度低难以识别的问题,提出了一种编解码结构的车牌图像超分辨率网络。首先,构建一种基于编解码结构的车牌重构生成器网络,利用编码器对车牌图像的纹理、字符等特征进行提取,解码器对车牌特征进行重构;然后,设计一种基于语义监督的判别器网络,在网络损失中引入了对抗损失与CTC(connectionist temporal classification)损失,增强生成器网络对车牌图像语义特征的表征能力;最后,基于VGG16网络提取车牌顶角点特征,利用坐标变换方法对车牌图像进行矫正,进一步提高重构清晰度与识别准确率。采用所提网络在自建XAUAT-Parking数据集和公开CCPD数据集上进行超分辨率重构与识别实验,结果表明:所提网络在CCPD数据集上的平均峰值信噪比可达25.5 dB,结构相似性(SSIM)可达0.989;在XAUAT-Parking数据集上峰值信噪比可达26.6 dB,结构相似性可达0.997。研究结果表明,该网络有较好的车牌图像超分辨率重建效果,而且对车牌关键信息缺失问题具有较强的鲁棒性。  相似文献   

6.
研究基于传统FCN算法下的不同比例的多尺度特征融合对于复杂场景下道路提取准确度的提高.针对复杂的航拍道路场景,设计了针对于农田环境下的FROBIT农田道路数据集,并使用全卷积神经网络(FCN)对FROBIT农田道路数据集和Massachusetts城市道路数据集进行道路提取工作.本文基于传统的FCN的网络,对其反卷积方式进行改进,采用粒子群算法(PSO)设计了不同比例的多尺度特征融合.通过将本文提出的Multi-Scale FCN网络与传统的FCN神经网络在FROBIT数据集和Massachusetts道路数据集上进行对比实验,结果表明Multi-Scale FCN网络相比于传统的FCN神经网络在提取精度上得到了提高.   相似文献   

7.
针对传统卷积神经网络对远距离视频目标识别效果差的原因,本文提出一种改进的基于SSD卷积网络的视频目标检测模型.首先,对数据集进行剪裁,旋转等预处理,提高网络检测泛化能力,其次,采用coco数据集Mobilenet_SSD预训练模型,由于其具有轻量级网络模型特点,减少计算开销,减少内存占用量.然后,再结合voc2012数据集进行二次训练微调处理,加快训练收敛速度,使用自定义数据集能有效检测特定场景目标,能够有效识别远距离场景下视频目标物体.实验结果表明,改进的网络检测模型适用于远距离目标检测,减少计算量,降低硬件内存资源消耗,提高网络模型性能和检测精确度,具有较好的鲁棒性.  相似文献   

8.
为了解决传统的基于人工特征的负面表情识别方法在面部无遮挡、姿态非倾斜的人脸表情图像上表现良好,但是在复杂场景下的识别效果较差的问题,提出了一种基于改进的卷积神经网络的负面表情识别方法.首先利用卷积神经网络的无监督特征学习的特性,预训练两个不同拓扑结构的卷积神经网络,用以提取表情特征;然后融合这些特征,训练分类性能更强的支持向量机.改进后的卷积神经网络算法具有较好的鲁棒性和泛化能力,在训练数据库ICML-fer2013上取得了86.2%的识别率,在测试数据库CK+,GENKI和JAFFE上分别取得了81.6%,87.0%和80.8%的识别率.  相似文献   

9.
针对目前人脸表情识别存在准确率不高、模型复杂和计算量大的问题,文章提出了一种基于八度卷积改进的人脸表情识别模型(OCNN):使用改进的八度卷积进行特征提取,提高对细节特征的提取效果,降低特征图的冗余,在不增加参数的同时减少运算量,以提高特征提取性能;利用DyReLU激活函数来增强模型的学习和表达能力;使用自适应平均池化下采样层代替全连接层,以减少参数;将模型在大规模数据集上进行预训练,并在FER2013、FERPlus、RAF-DB数据集上进行模型性能验证实验。实验结果表明:训练后的模型权重为10.4 MB,在人脸表情识别数据集FER2013、FERPlus和RAF-DB上的准确率分别达到73.53%、89.58%和88.50%;与目前诸模型相比,OCNN模型的准确性高且计算资源消耗低,充分证明了该模型的有效性。  相似文献   

10.
针对复杂驾驶场景下的目标检测问题,提出一种基于扩张卷积特征自适应融合的目标检测算法.采用单阶段目标检测网络RetinaNet作为基本框架,其包含卷积特征提取、多尺度特征融合以及目标分类与回归子网.为提高网络对多尺度特征的提取能力,设计了基于不同扩张率组合的残差卷积分支模块,以获取不同感受野下的目标特征图;然后,将不同尺度下的特征通过网络自适应学习的参数融合后输出,用于后续的目标预测;最后在大规模且多样化的复杂驾驶场景数据集BDD100K上进行实验.结果 表明,利用扩张残差卷积分支模块与特征自适应融合算法能够分别将网络的平均精度均值由0.330提升至0.338与0.344,并在采用扩张卷积特征自适应融合的情况下达到了0.349.所提算法能够有效提升目标检测算法在复杂驾驶场景下的检测性能.  相似文献   

11.
为提升在不同复杂场景下的车辆检测性能,提出一种基于改进Mask R-CNN的车辆检测算法。在算法的主干网络ResNet50中引入PSA极自注意力机制提升主干网络特征提取能力;在特征金字塔顶层网络中添加一个带有ECA注意力机制的分支与原分支进行特征融合,缓解顶层特征由于通道降维造成的信息损失。重新设计了卷积检测头使得边框回归更为准确。同时,使用余弦退火算法和Soft-NMS算法来优化训练过程和后处理结果。实验结果表明,改进的Mask R-CNN车辆检测算法相比原Mask R-CNN算法在复杂场景下具有更高的检测精度,在CNRPark-EXT测试集中平均精确度提高3.8%,在更具挑战性的MiniPark测试集中平均精确度提高7.9%。  相似文献   

12.
针对现有的车牌识别系统在遇到复杂条件,例如暗光、遮挡、多车牌、能见度低等情况时,难以有效地定位并识别车牌,提出了一种基于卷积神经网络的车牌自动识别系统.在车牌定位阶段综合应用3种定位方式对车牌进行初步定位检测,然后使用CNN模型对检测到的候选车牌进行判断;在车牌字符识别阶段,将分割出的字符输入到设计好的卷积神经网络模型中进行训练,得到的输出结果即为识别的车牌字符.在5906张车牌图像和非车牌图像以及36261张字符图片上的实验结果表明:提出的车牌识别系统对车牌和字符的识别率分别达到了94%和96.4%,明显优于传统的车牌识别方法,具有极高的实用性,可以满足绝大多数场景的使用需求.  相似文献   

13.
肺结节作为肺癌早期诊断的重要特征,对其识别和类型判断具有重要意义.目前使用迁移学习的识别算法存在着源数据集与目标数据集差距过大问题,对于肺结节特征提取不足,导致效果不佳.故此提出了基于卷积神经网络的改进神经网络模型.将预训练的GooLeNet Inception V3网络与设计的特征融合层结合,提高网络对特征的提取能力;为确定最佳组合方式,对各组以准确率为标准进行测试.实验在LUNA16肺结节数据集上进行.进行分组测试结果表明,改进的网络准确率达88.80%,敏感度达87.15%.在识别准确率和敏感性指标上,与GooLeNet Inception V3算法相比,分别提高了2.72,2.19个百分点.在不同数据集比例下进行实验,同样达到了更优的效果,具有更好的泛化能力.可以给临床诊断提供相对客观的指标依据.  相似文献   

14.
针对Frustum-PointNets的实例分割网络结构单一且卷积深度较深、易出现特征丢失和过拟合,检测准确率较低的问题,提出了一种改进的Frustum-PointNets网络。该网络首先构建深度残差网络并融入实例分割网络,提高特征提取能力,解决深层网络的退化问题;引入双重注意力网络以增强特征,提高分割效果;运用Log-Cosh Dice Loss解决样本不均衡,加快网络训练;使用Mish激活函数保留特征信息;最后基于Kitti和SUN RGB-D两个数据集进行实验验证本文算法的有效性。实验结果表明,本文算法相对于Frustum-PointNets,在Kitti数据集中,3D框检测精度提高了0.2%~13.0%;鸟瞰图的3D框检测精度提高了0.2%~11.3%。在SUN RGB-D数据集中,本文算法的3D框检测精度提高了0.6%~16.2%,平均检测精度(m AP)提高了4.4%。实验验证,本文算法在室外和室内场景中获得较好的目标检测及分割效果。  相似文献   

15.
以真实场景中拍摄的街景门牌号码图像数据集SVHN为研究对象,将卷积神经网络与支持向量机相结合,提出了一种基于改进LeNet-5的街景门牌号码快速识别方法.该方法首先对数据进行图像增强预处理,突出有效特征;然后,省去基本LeNet-5中的第3卷积层,并用SVM分类器代替最后输出层中的Softmax分类器,以简化网络结构的同时提高分类效率.在国际公开的SVHN数据集的实验结果表明,改进LeNet-5可以有效识别街景门牌号码,7h便可训练得出结构稳定的网络识别模型,识别率达到90.35%,提高了算法的综合效率.  相似文献   

16.
以真实场景中拍摄的交通标志图像数据集GTSRB为研究对象,将卷积神经网络与支持向量机相结合,提出一种基于二级改进LeNet-5的交通标志识别算法。该算法首先根据识别系统的实时性要求,对原始LeNet-5结构进行改进;然后用裁剪、灰度化、图像增强和尺寸归一化等操作对原始图像进行预处理,得到32×32的感兴趣区域;接下来,利用数据集GTSRB训练出一个二级改进LeNet-5,其中第一级改进LeNet-5将感兴趣区域中包含的交通标志粗分为6类,第二级改进LeNet-5对粗分类结果进行细分类,识别出交通标志所属的最终类别。实验结果表明,基于二级改进LeNet-5交通标志识别算法因网络模型能够提取交通标志的多尺度特征,识别正确率可达91.76%。  相似文献   

17.
在信息化和智能化高度发展的大数据时代,身份信息安全面临着种种挑战,传统的身份识别技术已不能满足公众安全需求。为解决传统唇纹识别算法中图像预处理过程复杂、特征提取困难和识别周期较长等问题,提出基于卷积神经网络的唇纹识别算法,搭建一个轻量型神经网络LNet-6(lightweight network-6)。该网络模型具有参数计算量少、模型文件小和可移植性强等优势。直接输入原始数据集,简化图像预处理步骤,通过卷积层自动提取特征信息和下采样操作降低模型训练参数,避免了图像特征提取算法的复杂设计。在测试集上获得了97.97%的识别率,验证了该方法的有效性。  相似文献   

18.
针对在复杂场景下传统算法对运动目标分类精度不高且无法直接输出关键点空间坐标这一问题,本文提出了一种基于改进Mask R-CNN的运动目标定位方法。该方法在TensorFlow 框架下采用自制数据集预训练提取多尺度的卷积,将采集到的网络视频流通过RoIAlign算法处理获得像素级的特征并匹配SIFT特征点建立空间坐标系统,在空间约束下结合Kalman filtering补偿运动轨迹,通过投影变换矩阵将像素坐标转换为世界坐标。实验表明该方法提高了模型在干扰背景下的鲁棒性,平均误差在8cm以内,实现了在复杂场景下可以获得实时高精度的定位信息。  相似文献   

19.
基于粗糙集的车牌字符识别方法   总被引:4,自引:0,他引:4  
提出了一种基于粗糙集理论的车牌字符识别的方法,通过粗糙集的属性约简,有效地压缩了图像的特征数目,提高了运行效率,并且采用基于影响因子的图像判别算法,有效地提高了识别的准确率.以在高速公路收费站实地拍摄的车牌图像为样本,经过车牌的定位、分割,以及字符的分割,选取其中的300幅字符图像作为训练集,100幅字符图像作为测试集,实验结果表明:将训练集图像作为输入,正确识别率为100%;将测试集作为输入,正确识别率为86%。  相似文献   

20.
场景识别一直是图像处理领域的重要问题之一,对研究移动机器人定位、计算机视觉等方面具有重要意义.然而,室内场景的复杂性与无序性使室内场景识别研究面临许多挑战.传统的手工提取特征无法充分描述室内场景的信息,而卷积神经网络提取的特征能够包含丰富的场景语义和结构信息,且对于平移、比例缩放、倾斜等形式的变形具有高度不变性,因此提出了应用基于卷积神经网络的GoogLeNet网络模型来完成识别任务的方法.该网络模型在深度学习框架Caffe上对MIT_Indoor数据集的识别准确率为59.7%,高于使用传统手工提取特征的算法的准确率,对比结果说明了深度卷积神经网络在室内场景识别问题上的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号