首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 171 毫秒
1.
为解决图像分类中深度卷积神经网络(Convolutional neural networks,CNN)中较为复杂的人工网络设计与调参问题,提出基于ResNet模块的进化卷积、神经网络(Evolutionary convolutional neural network,ECNN)的自动设计方法,并将其运用到图像分类中.该方法基于ResNet模块与2D卷积层,采用进化算法(Evolutionary algorithm,EA)对网络结构及参数进行优化.在NLM官方发布的疟疾数据集下进行实验,不同比例的测试集划分可以达到95.6%的分类准确率,文中算法与AlexNet、VGG16、Xception等人工设计的深度学习分类算法进行了比较,实验结果表明,其准确率提升了约1%.在斯坦福大学发布的Stanford cars车辆图像数据集中进行了算法泛化验证,结果表明,文中算法在不同比例数据的测试中准确率均在94.5%以上,将该算法与深度学习分类算法VGG16进行比较,准确率效果相当,模型测试图像分类耗时仅为VGG16耗时的1/13,且训练参数量较少.两组对比测试实验数据表明,相比人工设计的深度学习算法,本文方法具有较好的图像分类性能与较快的图像分类速度.  相似文献   

2.
提出了一种基于卷积神经网络(CNN)的人眼检测及眼睛睁闭状态分类的方法.首先,训练1个用于检测人眼中心点的卷积神经网络,当输入人脸图像时,网络能快速检测到双眼中心点,并输出中心点对应的坐标值;根据中心点坐标值可以确定眼睛区域,得到人眼图像;然后将人眼图像输入到1个用于判断眼睛睁闭状态的分类网络,得到眼睛的睁闭状态.试验结果表明:本文提出的方法有效可行,眼睛定位的准确率可达96%,状态分类准确率可达97.07%.相比传统方法,该方法具有较好的鲁棒性和应用前景.  相似文献   

3.
针对交通安全中疲劳驾驶状态识别问题,使用单一的疲劳驾驶特征的方法识别率较低,本文提出一种基于面部多特征加权和的疲劳识别方法.通过人眼状态检测算法提取眼部疲劳参数,即持续闭眼时间、闭眼帧数比、眨眼频率,通过打哈欠状态检测得到打哈欠次数和打哈欠持续时间,通过头部运动状态分析得到点头频率,建立融合以上六个特征的驾驶疲劳状态检测模型来评估驾驶员的疲劳等级并进行相应的预警.实验测试数据选自NTHU驾驶员疲劳检测视频数据集的部分数据.经实验调整后,发现该方法的识别准确率较高,识别效果好.  相似文献   

4.
花卉图像类内差异性大和类间相似性高使得花卉图像分类较难.传统花卉分类方法和普通卷积神经网络很难完整地表达花卉图像的特征,故而分类效果不理想.为提高花卉分类准确率,提出改进的InceptionV3网络用于花卉图片的分类.采用迁移学习的方法,将在大规模数据集上训练的InceptionV3网络用于花卉图像数据集的分类,对其中的激活函数进行改进.在通用Oxford flower-102数据集上的实验表明:该模型在花类图像分类任务中比传统方法和普通卷积神经网络分类准确率高,且比未改进的卷积神经网络准确率高,迁移过程准确率达到81.32%,微调过程准确率达到92.85%.  相似文献   

5.
为解决疲劳驾驶检测中人眼状态识别的难点,提出一种基于人脸关键点的疲劳检测方法.首先从摄像头实时采集驾驶员图像;然后经过Ada Boost方法检测出图像中最大的人脸,并完成人眼定位和人眼睁闭状态判断;最后使用PERCLOS算法判别驾驶员的疲劳状态.其中人眼睁闭状态判定采用基于Dlib库的关键点检测方法,通过计算上下眼睑的距离判断人眼睁闭状态.采集了1 000组人眼状态的数据之后进行分析,在闭眼时99%的状态值都小于2,而眼睛全睁时99%的状态值都大于2.4,当状态阈值设置为2时基于人脸关键点的检测算法正确率最高.试验结果表明,基于人脸关键点的检测算法在头部倾斜等姿态下和光线不好的情况下仍能很好地检测出驾驶员的疲劳状态,具有较强的鲁棒性.  相似文献   

6.
由于光照变化、头部姿态等因素的影响,现有的疲劳驾驶检测精度仍有待提高。针对该问题,提出一种基于迁移学习的眼睛状态识别网络(Gabor and LBP-convolutional neural networks,GL-CNN),该网络是由Gabor特征和LBP特征通过迁移学习加入卷积神经网络(convolutional neural networks, CNN)调制组成的。首先用多任务级联卷积神经网络(multi-task CNN,MTCNN)检测驾驶员的人脸和双眼,然后经过眼睛筛选机制获取待检测的单只眼睛,通过GL-CNN识别眼睛的睁闭状态,最后根据PERCLOSE准则判断驾驶员的疲劳状态。实验结果表明,该算法具有较高的准确率,可以检测多种姿态眼睛的状态,同时满足实时性的要求。  相似文献   

7.
成品红木材质识别是一个困扰消费者的难题,现有的木材纹理识别系统多数是针对木材微观的细胞图像进行识别,限制了其应用。该文提出了一种通过成品红木家具表面纹理,识别其所属木材种类的方法,并以鸡翅木、酸枝木、檀香紫檀、染料紫檀4类树种为例,进行方法验证。首先,采集上述4种家具表面的纹理图像,生成自建数据集。其次,分析经典的VGG16、ResNet50、Inception-v4、ResNeXt50和ResNeXt101 5个网络在此数据集上的识别能力,得出ResNeXt50的识别准确率最高(94.02%),但在真实使用场景下识别率依旧较低(69.91%)。最后,提出了融合全局和局部特征的全局-局部模型,此模型以ResNext50网络为基础,将其修改为特征提取器,分别提取出图像中的整体木纹特征和局部细节特征,再将这两种特征融合在一起,此模型提高了特征提取的信息量,比传统的单一特征提取模型有更好的泛化能力。结果表明,本文构建的全局-局部模型在测试集中对4种成品红木家具表面纹理分类的准确率为99.07%,优于ResNeXt网络的平均准确率95.50%和最佳准确率98.36%,且在真实使用场景下准确率为...  相似文献   

8.
针对多数淡水鱼类识别方法特征的提取进程复杂,在自然外部场景下很难进行高效识别问题,构造了残差模型及注意力机制相融合的ResNet50-SE-Fish网络对不同发育程度的8种淡水鱼类进行识别,并测试构造的网络识别性能.研究在原残差块内添加SE模块,增加所关注特征数据权重,减小外部场景噪声以及背景无关特征数据权重,并使用迁移学习来对不同发育程度幼鱼、成鱼特征数据进行识别.通过Grad-CAM方法对ResNet50-SE-Fish网络每个残差块提到的淡水鱼类特征数据可视化以解释注意力表示作用,并与7种常用网络所提到的热力图比较,以评估网络对淡水鱼类特征数据提取能力.结果表明,ResNet50-SE-Fish网络对不同发育程度淡水鱼类有很高的识别精度,验证时准确率高达95.53%,测试时准确率达90.16%,相较于AlexNet、VGG16、ResNet18、GoogleNet、VGG19、ResNet34、ResNet50,测试时准确率依次增大14.93%、6.32%、2.51%、3.55%、3.69%、2.14%、1.73%,注意力机制利用调节通道关注程度能够提高模型淡水鱼类特征的提取效果...  相似文献   

9.
何敏  齐程程  陈家雪  户莹 《科学技术与工程》2021,21(35):15144-15151
针对当前地下管网CCTV检测缺陷中存在自动化程度偏低及依赖专业人员技术水平的问题,综合采用图像处理和深度学习技术构建了辅助检测人员快速、准确地识别管道缺陷类型的智能方法。首先,收集十类典型缺陷图像,对其进行图像处理生成样本集;在此基础上,以深度卷积神经网络AlexNet和ResNet50为基础框架,使用预训练AlexNet和ResNet50网络迁移学习管道缺陷特征,通过敏感性分析优化了分类网络参数,然后,通过测试集验证了管道缺陷智能分类模型的准确性,并结合具体工程实例验证建立方法的有效性。结果表明:两类管道缺陷智能分类模型在测试集上分别达到92.00%和96.50%的准确率,实际工程实例准确率达到了85.41%和87.94%,且ResNet50的分类效果更优,具有较好工程适应性。图像处理和深度学习技术可提高排水管道缺陷分类的自动化与准确率,值得进一步进行推广。  相似文献   

10.
为了提高青光眼检测的准确率,降低青光眼的危害,本文提出一种基于多任务学习的青光眼智能诊断方法,将U-Net网络和VGG16网络结合,U-Net网络和VGG16网络共用U-Net网络的编码器部分,通过U-Net网络得到杯盘比(cup-to-discratio,CDR),并且将CDR作为眼底图像的特征之一输入VGG16网络,实现眼底图像的青光眼分类。实验使用REFUGE挑战数据集进行验证,网络模型在训练后得到的工作特性曲线下面积为0.978 8,且视盘和视杯的分割准确率分别达到0.874 5和0.962 4,对比其他使用相同数据集的方法,本方法具有更高的青光眼分类准确率。  相似文献   

11.
基于面部特征的驾驶员疲劳判断是应用最广泛的方法,而眼睛睁闭程度最直接表达驾驶员的精神状态。传统的眼睛检测方法受环境、传输、头部姿态的影响,眼睛的定位精度不高,从而导致疲劳分析不准确。本文提出一种基于脸部图像灰度差进行眼睛检测的方法,正常情况下在人脸上半部只有眼睛进行睁闭的活动,故眼部区域灰度会发生变化,由此来进行标定。该方法主要包括基于adaboost算法的人脸识别、图像预处理、眼睛的检测、积分投影法计算眼睛的高宽比以及基于PERCLOS准则的驾驶员疲劳判断。最后分别基于头部左转、右转和正视三种情况下进行实验,根据结果表明该方法能够较好的进行眼睛的检测,对于进行驾驶员的疲劳判断有极大的意义。  相似文献   

12.
为在驾驶员佩戴眼镜的情况下也能准确有效地检测疲劳状态, 提出一种判断是否佩戴眼镜的方法, 并建 立了基于眼睛与嘴部状态的疲劳驾驶检测系统。 对该系统中有关目标检测、 特征提取与图像识别等算法进行 研究。 首先, 采用 Adaboost 算法通过人脸分类器从视频帧中检测人脸区域, 并根据面部器官几何分布规则粗检 眼睛与嘴部区域; 其次, 基于大律法自适应二值化, 采用垂直积分投影法判断是否配戴眼镜, 根据灰度直方图 统计特征值法判断戴眼镜的眼部区域状态, 另外, 利用似圆度判断嘴部打哈欠情况; 最后, 利用 PERCLOS (Percentage of Eyelid Closure over the Pupil)值识别眼睛疲劳状态, 利用打哈欠频率识别嘴部疲劳状态。 当检测 到驾驶员处于疲劳状态, 则及时给出疲劳警告。 实验结果表明, 该方法可有效解决眼镜对检测的干扰, 并适用 于不同光照与环境。 同时, 在戴眼镜情况下对于眼睛与嘴部疲劳状态的判断优于其他方法。 基本满足疲劳检 测系统对良好的实时性、 稳定性与鲁棒性等要求。  相似文献   

13.
为解决由于疲劳驾驶导致交通事故的问题,采用视频图像分析技术处理疲劳的相关特征,运用基于训练的 Adaboost 人脸检测算法精确定位司机脸部和眼睛区域,实时采集眼睛二值化区域面积,采用阈值比较法进行眨眼判断,并提取眼皮疲劳参数 AECS( Average Eyelid Closing Speed) 和 PERCLOS( Percent Eyelid Closure over the Pupil Time) ,进行综合疲劳状态分析,最终确定是否疲劳驾驶。实验结果显示,人脸和人眼检测的精度都有较大程度提高,设计的软件可实时监测驾驶员疲劳状态,有效防止疲劳驾驶。  相似文献   

14.
在机动车驾驶员疲劳状态监控过程中,为了实时地跟踪驾驶员的眼部位置,定位并跟踪眼睛,进而判断眼睛的状态,提出了一种基于OpenCV的人眼识别和跟踪的视频图像检测方法。在VC++开发平台上,结合OpenCV相关封装函数和外接的摄像头,编写程序实现了对人眼的识别和跟踪。编译运行结果表明,该算法可靠性高,能够满足驾驶员眼睛监测的初步要求,在正常情况下能够检测出人眼,准确度较好,具有一定的实用性。  相似文献   

15.
针对传统食品图像识别方法提取特征能力差、准确率差、运行效率差和卷积神经网络识别相似食品图像难度大等问题, 提出了一种新的食品图像识别模型ChinaFood-CNN, 以实现对食物的精准分类; 在多分类损失函数SoftmaxWithLoss的基础上, 针对食品图像类间相似性大的问题, 提出了最大类间距损失函数(MCSWithLoss), 以增大相似类之间的距离, 实现相似类的区分; 针对随机选取样本时的训练集冗余问题, 在网络模型训练时使用负样本选择算法.实验结果表明:ChinaFood-CNN模型对食品图像的识别准确率达69.2%, 分别比AlexNet、VGG16、ResNet模型提升了17.6%、16.8%和3.6%.  相似文献   

16.
疲劳驾驶是导致交通意外的一个重要原因,在车上装一个疲劳检测系统有助于预防交通事故的发生。现实条件下,司机的头和眼睛是不断运动的,使得疲劳特征提取变得比较困难,再加上外部干扰和光线条件的影响,准确判断司机的疲劳状态是一个具有挑战性的问题。本文介绍了一种利用支持向量机检测驾驶员疲劳状态的方法。首先采集驾驶员的头部视频,然后对视频图像进行处理,提取眼睛、嘴的视觉特征和点头频率变化情况,最后利用支持向量机依据这些特征来判断司机的疲劳状态。通过模拟实验,疲劳检测的准确率达到97.80%,表明该方法适合于驾驶员的疲劳检测。  相似文献   

17.
针对嵌入式设备内存小及多分类准确率低等导致驾驶员检测问题,提出经过深度可分离卷积网络改进而成的,快速下采样网络(fast downsampling network,MF-Net)驾驶状态识别系统.即将快速下采样策略应用于深度可分离卷积网络,在12层内执行32倍下采样,以有效降低计算成本、增加信息容量并实现性能改进.实验结果表明:与VGG(visual geometry group)和ResNet 50等其他卷积神经网络(CNN)模型相比,所提出的MF-Net模型深度可分离卷积大大减少参数量,快速下采样方案的运用增加了网络的信息容量,不仅模型较小且在驾驶员状态分类方面能够表现出更好的性能.同时,信息容量的增加可以对更多信息进行编码,加深对图像内容的理解,有利于之后的嵌入式系统移植.  相似文献   

18.
为防范因陆空通话差错造成航空不安全事件风险,基于管制员认知过程,从无线电频率、是否使用管制员母语、陆空通话语速和指令复杂程度4个维度分析陆空通话对管制员监听差错的影响。选取52名管制员作为被试,使用E-prime搭建实验平台模拟管制员监听机组复诵场景,分析被试在不同场景下监听陆空通话绩效。结果表明:无线电频率干扰、陆空通话使用非母语、复杂指令会导致管制员监听差错的显著差异。本研究为强化陆空通话管理,有助于提高空中交通安全水平。  相似文献   

19.
为提高驾驶员疲劳检测的准确性, 提出一种改进的眼睛状态检测方法。利用“参考白冶算法对原始帧图像做光照补偿处理, 基于肤色特征检测出人脸; 利用积分投影法将人脸和眼睛分割出来, 结合眉毛和眼睫毛之间距离的变化、眼睛区域黑色像素点的个数变化这两个参数对眼睛的状态做出判断。若连续5 帧图像眼睛均为闭合状态, 则系统给出疲劳警报。实验结果表明, 利用两个参数检测的准确率高于单个参数检测的准确率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号