首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 203 毫秒
1.
通过对YOLOX-S模型引入可变形卷积神经网络和焦点损失函数(Focal loss),解决原YOLOX-S模型车窗识别准确率较低的问题.首先,通过在YOLOX-S模型的主干特征提取网络中引入可变形卷积神经网络,对卷积核中的各采样点引入偏移量,以便在原始图像中提取到更具有表征的信息,从而提高车窗识别的精准度;其次,使用Focal loss替代原模型中的二元交叉熵损失函数,Focal loss能缓解正负样本不平衡对训练的影响,其在训练过程中更关注难样本,从而提高了模型对车窗目标的识别性能;最后,为验证改进算法的性能,实验收集并标注15 627张图片进行训练和验证.实验结果表明,改进后的车窗识别算法的平均目标精度提高了3.88%.  相似文献   

2.
针对传统食品图像识别方法提取特征能力差、准确率差、运行效率差和卷积神经网络识别相似食品图像难度大等问题, 提出了一种新的食品图像识别模型ChinaFood-CNN, 以实现对食物的精准分类; 在多分类损失函数SoftmaxWithLoss的基础上, 针对食品图像类间相似性大的问题, 提出了最大类间距损失函数(MCSWithLoss), 以增大相似类之间的距离, 实现相似类的区分; 针对随机选取样本时的训练集冗余问题, 在网络模型训练时使用负样本选择算法.实验结果表明:ChinaFood-CNN模型对食品图像的识别准确率达69.2%, 分别比AlexNet、VGG16、ResNet模型提升了17.6%、16.8%和3.6%.  相似文献   

3.
洞库类目标是高价值识别目标,针对洞库类目标样本数据难以获得、样本内部数据相似度较高、人工设计识别特征方法局限性较大、普通深度网络需要海量数据等问题,提出了结合元学习和深度卷积网络的元-卷积网络(MCNN),并融合持续学习理论的洞库类目标识别方法(MCNN-LLS).首先结合深度卷积网络、元学习的理论建立元-卷积网络,该网络可利用旧知识指导新知识的训练,利用小样本数据即可训练得到识别能力较高的深度洞库模型;然后融合持续学习理论,建立持续学习系统(LLS),设计专家审核模型判别深度洞库模型的识别结果,并引入潜在任务、模型异步更新等方法,达到模型持续学习、持续更新的效果.实验表明,本文方法所需样本数量少,对洞库类目标识别准确率高,且识别能力可随识别过程中新数据的积累逐步提高.   相似文献   

4.
以样本少且欠均衡的高信噪比秦简文字图像为研究对象,提出一种基于改进的轻量级AlexNet网络模型的秦简文字识别算法。首先,构建秦简单文字图像数据集,对其进行增强降噪、图像归一化等预处理操作;其次,调整AlexNet网络模型结构,构建4层卷积层与池化层的顺序连接,并在前2层卷积层分别融入InceptionA与InceptionC结构,以分解卷积的形式对秦简文字进行局部特征提取,选取ReLU函数作为模型的激活函数,并在全连接层融入Dropout层进一步防止模型出现过拟合现象;最后,调用Softmax分类器完成秦简文字图像识别。研究结果表明:该网络模型在轻量化与识别准确率的表现上具有明显的优势,平均识别耗时为635 ms,识别准确率达到了99.89%,识别效果良好,可为秦简文字识别理论研究提供参考。  相似文献   

5.
为解决AlexNet网络模型在中药饮片图像识别中存在的识别准确率和鲁棒性不够理想的问题,以常见的50种中药饮片为研究对象,对AlexNet网络模型进行改进优化。首先通过拍摄以及搜索引擎获取中药饮片图像,并对图像进行数据扩充以及细节增强预处理。其次对AlexNet网络模型进行优化改进,通过缩减原网络的卷积核个数和卷积核大小、使用全局平均池化(global average pooling, GAP)替代全连接层以减少网络参数;去除局部响应归一化(local response normalization, LRN)层、引入批量归一化(batch normalization, BN)层和使用Lion优化算法替代随机梯度下降(stochastic gradient descent, SGD)优化算法以提高网络训练速度;使用Mish激活函数替代ReLU激活函数和引入通道注意力机制SENet网络以提高模型的识别精度。实验结果表明,改进后的网络模型相比于AlexNet网络模型,平均识别率提高了6.1%,平均损失率下降了14.4%,网络参数由原来的60 M缩减至1 M,该结果表明在中药饮片数据集上,改进...  相似文献   

6.
针对传统的工件识别流程是由人工根据工件的特点设计需要提取的特征,整个过程具有耗时高、成本大、通用性较差和识别准确率不高等问题,改进了经典的卷积神经网络模型AlexNet和LeNet-5,通过将AlexNet网络的输入图像尺寸缩小到120×120,用BN层代替LRN层,减少两层卷积和全连接层,用3×3的卷积核代替第一层卷积层11×11的卷积核;将LeNet-5的输入图像尺寸提升至60×60,用ReLU取代原始Sigmoid激活函数,使用多个小卷积核代替大卷积核;分别使用改进前后的网络模型对工件数据集进行训练、测试.结果表明,改进后的两种网络模型,在测试集上分别达到94.31%和92.75%的平均识别准确率,平均识别时间分别为0.271s和0.321 s,满足生产需求.  相似文献   

7.
针对目前SAR(Synthetic Aperture Radar)图像中样本人工标记成本高、传统算法分类识别较低的情况,提出一种基于改进半监督阶梯网络(Semi-supervised Ladder Network,SSLN)的SAR图像分类识别方法 .首先在原SSLN模型的解码器网络中使用卷积神经网络代替全连接层,对编码器输出的每层数据进行全局深度特征提取,这样做有利于图像降噪,实现对输出数据的重构.其次,为解决SAR图像各类数据集分布不均衡的问题,同时提高网络的泛化性能,对阶梯网络训练层中各类别损失函数的权重进行优化,根据各类别样本数所占总样本数的比重,对少样本类别损失函数调高权重,对多样本类别损失函数调低权重.在公开数据集MSTAR(Moving and Stationary Target Automatic Recognition)上的实验表明,改进后的半监督阶梯网络分类的识别准确度明显优于SSLN算法,且具有更好的泛化性.  相似文献   

8.
基于卷积神经网络的合成孔径雷达图像目标识别   总被引:1,自引:1,他引:0  
为了解决现有合成孔径雷达(SAR)图像目标识别算法识别率不高、泛化能力不足的问题,提出一种基于卷积神经网络的SAR图像目标识别模型CMNet网络。通过设计针对SAR图像特点的特征提取网络,在损失函数中引入中心损失与Softmax损失联合监督训练过程,兼顾类内聚合和类间分离,提高算法精度和泛化能力。网络模型中所有卷积层后引入批量归一化层加快模型收敛速度、防止过拟合。实验使用美国运动和静止目标获取与识别数据库进行测试,10类目标平均识别率达到99. 30%。结果表明,提出的CMNet网络模型具有较高的识别率和泛化能力,在公开数据集上取得较好结果。  相似文献   

9.
针对腹部CT图像中淋巴与周围结构相似、对比度低、难识别导致淋巴分割精度较低的问题,提出一种基于空洞卷积和双通道注意力机制的改进密集U型对称语义分割模型D-DenseUnet。将空洞卷积和双通道注意力机制嵌入密集块连接的U型网络结构中,提升模型提取整体特征的能力;为了缓解数据不平衡问题,采用复合损失函数作为改进的密集U型模型D-DenseUnet的损失函数,结合数据扩增和早停法防止过拟合,通过余弦退火衰减学习策略进行优化,最终实现腹膜后淋巴分割。实验结果表明,所提的分割模型在腹膜后淋巴CT图像中能够较好分割淋巴,平均相似系数、交并比和召回率分别为0.796,0.804,0.679,优于传统的Unet网络和密集U型DenseUnet网络。  相似文献   

10.
针对经典U型卷积网络在细胞核分割过程中对距离相近目标的边界较难区分、对模糊目标产生误识别等问题,提出一种改进的U型卷积网络(DU-Net)模型。为增强目标边界特征,提出一种梯度融合方法,计算样本梯度信息并将梯度图多尺度融合至U-Net编码器。解码器浅层特征通过卷积上采样密集连接至深层特征,增加特征的复用性。针对梯度消失问题,DU-Net模型在每个卷积层后采用批归一化和ReLU激活结构。针对经典U-Net模型对模糊目标的误识别问题,提出一种改进的交叉熵损失函数,该损失函数降低了模糊背景点对模型的干扰,同时提高了模型对小目标的识别能力。在2018年数据科学碗公布的670张图片、约29 500个细胞核的公开数据集上验证了DU-Net模型,结果表明,模型的预测结果与真实标签在Dice系数和Jaccard相似系数两项评价指标上分别达到95.9%和91.0%,性能优于U-Net和SegNet编码器,显著优于经典卷积神经网络模型FCN-8s。  相似文献   

11.
基于迁移学习和AlexNet的驾驶员行为状态识别方法   总被引:1,自引:0,他引:1  
为了解决传统基于神经网络算法的驾驶员行为状态识别系统精度过于依赖大量训练样本的问题,本文提出将迁移学习理论和AlexNet引入到驾驶员行为状态的识别研究中。首先对驾驶员行为特征及状态进行深入分析,对驾驶员7种驾驶状态进行了定义,构建了驾驶员状态信息采集系统;然后对基于卷积神经网络的驾驶员状态识别方法研究,建立了驾驶员状态数据集,构建了基于AlexNet卷积神经网络的状态监测系统,通过迁移学习完成了卷积神经网络识别模型。最后通过实验验证了本文提出的驾驶员状态识别算法对7种驾驶员状态识别的有效性。实验表明:该系统准确率达到97.8%,且在实验设备中运行速度达到70帧/分钟,满足较高的准确率要求与实时性要求。  相似文献   

12.
为了解决语音识别中由网络加深导致的低层特征消失、参数量大及网络训练困难的问题,基于Inception V3网络的非对称卷积思想,提出了一种改进的密集连接卷积神经网络(densely connected convolutional neural networks, DenseNet)模型。根据语音识别的长时相关性,通过密集连接块建立起不同层之间的连接关系,从而保存低层特征、加强特征传播;为了得到尺度更丰富的声学特征,将卷积核的范围进行扩大;利用非对称卷积思想分解卷积核,以减少参数量。实验结果表明,相较经典深度残差卷积神经网络模型和原始DenseNet模型,提出的模型在THCHS30数据集上的语音识别性能更好,在保证识别率的情况下,还减少了网络参数量,提高了模型训练效率。  相似文献   

13.
针对佤语语谱图的识别无需考虑清、浊音的影响这一特征.利用傅里叶变换将佤语转换为对应的语谱图信息,将深度卷积神经网络的AlexNet模型用于佤语语谱图识别.实验表明,语谱图识别可以有效解决语音识别过程中清、浊音对实验识别结果的干扰,实验准确率达到96%.  相似文献   

14.
针对目前的人脸识别算法在面对不同姿态下的人脸图像时识别率低的问题,提出了一种基于改进的卷积神经网络的算法。该算法通过对经典的卷积神经网络LeNet-5 的卷积核数目、卷积核尺寸、池化层方式和正则化手段等参数进行了优化改进,从而能对多姿态人脸图像特征进行有效提取。仿真实验结果表明,该算法在识别率与识别时间上均有显著提高。  相似文献   

15.
从图像中提取多种特征向量堆叠为一个高维特征向量用于图像语义分割,会导致部分特征向量的分类能力减弱或丢失。针对此问题,提出了一种结合深度卷积神经网络AlexNet和条件随机场的图像语义分割方法。利用预训练好的AlexNet模型提取图像特征,再通过条件随机场对多特征及上下文信息的有效利用来实现图像的语义分割。与利用传统经典特征的方法进行对比,实验结果表明:在利用AlexNet模型提取特征进行图像语义分割时,Conv5层为最有效的特征提取层,在Stanford background和Weizmann horse数据集下的识别准确率分别为81.0%和91.7%,均高于其他2种对比方法,说明AlexNet可以提取更有效的特征,得到更高的语义分割精度。  相似文献   

16.
近年来卷积神经网络(convolutional neural network,CNN)在行为识别任务中取得了较大的进展.然而,现有的神经网络方法往往只注重高层语义信息的利用,对浅层特征信息挖掘利用不够.针对这一问题,提出一种基于3D卷积(convolution 3D,C3D)的多尺度3D卷积神经网络的行为识别方法.该方法受到特征金字塔结构的启发,在原C3D的基础上融合C3D的浅层特征信息,实现端到端的行为识别.同时该方法以现有的深度学习理论为基础,利用迁移学习的思想,将C3D和该方法中相同模块部分的参数迁移到本方法中,以降低模型的训练时间.通过在UCF101数据集上进行实验,实验结果表明,提出行为识别方法的分类精度达到84.56%,分类效果优于原C3D分类网络.  相似文献   

17.
针对传统卷积神经网络严重依赖数据量的问题, 提出一种基于均值迭代阈值分割法和卷积神经网络的图像识别算法, 通过均值迭代阈值分割法过滤图像背景, 并基于AlexNet构造新的卷积神经网络. 与其他常用的卷积神经网络进行对比实验结果表明, 在样本数量不足的图像识别任务中, 该算法识别效果较理想, 与其他卷积神经网络相比, 具有更高的识别准确度、 更低的识别误差和更快的收敛速度.  相似文献   

18.
针对传统卷积神经网络严重依赖数据量的问题, 提出一种基于均值迭代阈值分割法和卷积神经网络的图像识别算法, 通过均值迭代阈值分割法过滤图像背景, 并基于AlexNet构造新的卷积神经网络. 与其他常用的卷积神经网络进行对比实验结果表明, 在样本数量不足的图像识别任务中, 该算法识别效果较理想, 与其他卷积神经网络相比, 具有更高的识别准确度、 更低的识别误差和更快的收敛速度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号