首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 203 毫秒
1.
综合利用彩色和深度信息,采用多数据模式的特征提取策略,提出一种基于卷积-递归神经网络和费舍尔向量的RGB-D 物体识别方法. 对于彩色图像和深度图像,分别利用卷积-递归神经网络和卷积-费舍尔向量-递归神经网络提取物体的纹理及形状特征. 为了更加全面的获取物体信息的特征表述,引入了灰度图像和表面法向量作为原始数据的补充,并利用卷积-递归神经网络提取特征. 最后,将4 种数据模式下提取到的特征融合起来,输入到softmax 分类器中实现RGB-D 物体识别. 在标准的RGB-D 数据库中对算法进行验证,所提算法可以有效提高物体识别率.  相似文献   

2.
【目的】为解决因土壤图像纹理复杂、没有结构性特征导致的传统卷积神经网络模型难以提取其中关键性特征、识别准确率低的问题,提出了一种大核注意力(large kernel attention,LKA)机制模块与ResNet模型融合的土壤种类识别网络模型VAR(visual attention ResNet),以解决土壤种类样本不平衡和难分类样本造成的模型泛化能力弱的问题。【方法】以ResNet为主干网络,在主干中引入LKA机制,减少其中的残差块,构建土壤种类识别网络VAR,并改进网络的焦点损失函数(Focal Loss)。【结果】1) 与传统模型ResNet18、ResNet34、VGG、GooleNet、VAN等相比,VAR模型在特定模型参数下对紫色土土壤图像数据集中土壤种类的识别精度更高;2) 用3种不同大小VAR模型之一的VAR_small与以ResNet18为主干并嵌入传统注意力机制SE、CBAM、ECA和SK的网络进行对比,实验结果显示LKA机制在土壤识别方面更加优秀;3) 改进的Focal Loss可让VAR更能注意到难分类的土壤图像样本。【结论】将LKA机制模块与ResNet模型融合的土壤种类识别网络模型VAR增强了网络提取土壤图像中关键性结构特征能力,同时还减少了网络参数,能更加有效地识别土壤种类。  相似文献   

3.
针对现实生活中垃圾分类知识普及不够,许多城市和学校都面临着垃圾分类困难的问题,利用神经网络对分类问题的高效性和准确性,通过一种基于ResNet网络和SENet网络的深度残差收缩网络实现垃圾图像分类。通过对Garbage数据集进行筛选得到实验所需数据集,并对ResNet进行改进,将SENet和软阈值化操作加入ResNet结构中。实验结果表明,该方法通过网络训练和超参数调整,得到了较好的识别率,在校园垃圾分类中获得了较好的识别效果,具有一定可行性。  相似文献   

4.
提出一种采用高光谱图像的人脸识别算法.根据人脸肤色在可见光范围内的光谱特征进行波段选择并依据人脸结构特征,对选定波段的灰度图像进行Gabor特征提取.最后分别进行特征层上的融合识别和决策层上的融合识别.特征层融合的权重系数由反射率和正确识别率共同决定,决策层融合算法采用"最高票当选制"原则.利用香港理工大学的高光谱人脸数据库对进行验证.结果证明,本文算法在识别速度和正确识别率方面都得到了显著改善,在3幅训练样本情况下,正确识别率达到96.5%.相对于全波段参与识别,识别速度提高了约3倍.   相似文献   

5.
手语作为表达信息的一种方式,是聋哑人与外界交流的最主要途径。随着人工智能技术的发展,新型、自然、便捷的人机交互方式已经成为当今各行业交互方式的新趋势。传统手语识别方法普遍存在背景干扰严重、特征提取不完整及识别准确率低的缺点。针对以上问题进行研究,提出基于彩色-深度(RGB-D)图像的手语识别算法。在静态孤立词手语识别的基础上测试,实验对比结果表明,基于RGB-D的方法能得到比传统手语识别算法更好地性能;利用深度信息处理图像,有效地去除了场景中光照、背景的干扰,同时结合肤色信息去除非手形部分;采用概率神经网络(PNN)手语分类器对孤立词的识别准确率超过90%,取得了较高的识别率。  相似文献   

6.
手语作为表达信息的一种方式,是聋哑人与外界交流的最主要途径。随着人工智能技术的发展,新型、自然、便捷的人机交互方式已经成为当今各行业交互方式的新趋势。传统手语识别方法普遍存在背景干扰严重、特征提取不完整及识别准确率低的缺点。针对以上问题进行研究,提出基于彩色-深度(RGB-D)图像的手语识别算法。在静态孤立词手语识别的基础上测试。实验对比结果表明,基于RGB-D的方法能得到比传统手语识别算法更好地性能;利用深度信息处理图像,有效地去除了场景中光照、背景的干扰,同时结合肤色信息去除非手形部分;采用概率神经网络(PNN)手语分类器对孤立词的识别准确率超过90%,取得了较高的识别率。  相似文献   

7.
针对目前矿工行为数据集构建不全面、行为识别实时性较差、对相似行为的细粒性识别精度较低等问题,提出了一种端到端的自主学习行为特征并实现行为分类的识别方法。首先,对原始矿工行为视频进行特征提取,生成用来描述时间特征的光流图以及可以描述空间特征的三原色(RGB)图像,使用双流网络对提取的特征进行学习并得到行为分类结果;然后,引入量子遗传算法对双流网络进行改进,对网络中待训练参数进行量子编码,将双流网络在测试集上的代价函数值作为适应度函数。采用量子交叉、量子门旋转实现种群个体的进化。构建了包含50种矿工行为的数据集,在该数据集上利用双流法进行行为识别。研究结果表明:使用量子遗传算法优化后的3种双流网络的识别准确率,比优化前分别提升了1.01%,0.87%和0.32%。通过与其他矿工行为识别算法进行对比,本文所提方法在两种数据集上识别率分别达到90.36%和72.29%,均优于其他几种识别算法,准确率最大差距达到22.36%,证明了本文所提方法的有效性。  相似文献   

8.
为了解决中小学生坐姿不正确的问题,本文提出了一种基于视频的学生坐姿检测与纠正方法的解决方案,采用计算机视觉领域中的运动目标检测技术,实时监控学生的坐姿,并对不正确的姿势进行提醒与纠正.系统首先对学生坐姿进行视频采集,并由背景差分法得到基本准确的前景图像;然后对图像进行高斯滤波和形态学处理;再利用经验阈值对图像进行二值化处理;最后利用形态学滤波和区域面积检测法得到当前的学生姿态,与正常姿态进行对比后,对不正确的姿态进行提醒和纠正.  相似文献   

9.
针对粘连、扭曲,且存在干扰噪声的验证码图像识别性能欠佳的问题,结合卷积神经网络提出一种通用的基于图像分割的验证码字符识别方法。首先对传统Otsu阈值分割算法的阈值选取策略进行改进,提出基于局部最优阈值分割的Otsu法对验证码图像进行二值化处理。其次,采用改进的融合字符积分投影特性的复杂验证码字符分割方法对存在粘连情况的字符进行二次分割。最后,将分割得到的单个字符归一化后直接输入到基于卷积神经网络的LeNet-5模型中进行训练和识别,并输出识别结果。大量网站验证码图像的实验测试结果表明,提出的方法对粘连、扭曲,且存在干扰噪声的字符验证码图像有着较高的识别率和适应性,有效克服经典方法对于不同种类验证码识别的针对性和局限性。  相似文献   

10.
为实现杂草精准防控、快速识别棉田杂草,本文基于低空无人机技术拍摄棉田苗期影像,以幼苗和杂草为研究对象,提出了一种改进Faster R-CNN的棉田杂草识别方法。改进1:特征提取网络采用融合FPN的ResNet50代替VGG16来训练模型,并对比VGG16、ResNet50和MobileNetv2的分类效果;改进2:针对Faster R-CNN模型设计适合小目标的锚尺度,其中对应的anchor尺度为{8×8,16×16,32×32},比例为{1∶2,1∶1,2∶1};改进3:训练过程在通过特征提取阶段后,采用双线性插值操作,避免两次量化对物体识别产生的影响;改进4:添加2个Dropout层,分别在特征提取网络之后的2个全连接层上,避免模型产生过拟合现象,增加了网络的鲁棒性。研究表明:融合FPN的ResNet50训练的的平均精确率比VGG16提高了3.82%,与ResNet50和MobileNetv2相比分别高出5.05%和18.38%,说明Faster R-CNN使用融合FPN的ResNet50具有最佳的性能,改进的Faster R-CNN模型对单张图像平均识别时间为0.289 s,平均...  相似文献   

11.
针对传统坐姿识别系统中传感器数量多和系统较复杂导致成本过高等问题,设计一种基于少量体压传感器和支持向量机(SVM)算法的坐姿识别方法.首先,设计一种由少量薄膜压力传感器构成的体压传感阵列,将其置于坐垫内部;然后,利用该传感阵列采集不同坐姿的体压数据,并绘制相应的体压分布等高线图;最后,以体压数据作为特征向量,结合支持向量机算法建模,以实现坐姿分类自动识别.测试结果表明:少量体压传感器也能获取不同坐姿的体压分布特征;SVM坐姿分类模型在熟悉样本下的坐姿识别准确率达98.3%,在陌生样本下的坐姿识别准确率达92.5%.  相似文献   

12.
为实现玉米病害图像快速、准确识别,提出了一种基于非对称注意力机制残差网络(asymmetric convolution attention resnet,ACA-Resnet)的图像检测模型.在残差网络的基础上,通过引入非对称卷积结构减少参数量,加快模型训练速度,同时引入注意力机制,改善模型的表达能力,提高检测准确率.为减小由于病害图片数量不足而造成的过拟合现象,采用迁移学习的方法提高模型的稳定性和泛化能力.结果 表明,ACA-Resnet经过ImageNet数据集预训练后对玉米病害图像的平均识别准确率可达到97.25%,较VGG-16、Inception-V3和ResNet50等网络分类效果更好,相较于Resnet50训练速度明显提升.可见本文方法训练速度快,识别精度高,可为玉米病害检测提供借鉴.  相似文献   

13.
针对现有基于振动信号的诊断模型泛化能力差,而深度学习网络对计算量和存储量要求高的问题,提出轻量级融合密集连接网络与残差神经网络的故障诊断模型.首先,利用格拉姆角场将原始时序信号映射为灰度图像,充分利用二维卷积神经网络的性能;然后,融合密集连接网络和残差神经网络的优点构建融合网络模型,并通过鬼影模块降低其性能消耗,形成轻量级和高识别率的深度网络.实验结果表明,该改进的融合深度学习模型在比传统模型具有更强的鲁棒性和适用性的同时,还拥有极低的浮点运算量与参数量资源占用,证明了该方法在滚动轴承故障诊断领域是有效的、可行的.  相似文献   

14.
In this paper,a new type of neural network model - Partially Connected Neural Evolutionary (PARCONE) was introduced to recognize a face gender. The neural network has a mesh structure in which each neuron didn't connect to all other neurons but maintain a fixed number of connections with other neurons. In training,the evolutionary computation method was used to improve the neural network performance by change the connection neurons and its connection weights. With this new model,no feature extraction is needed and all of the pixels of a sample image can be used as the inputs of the neural network. The gender recognition experiment was made on 490 face images (245 females and 245 males from Color FERET database),which include not only frontal faces but also the faces rotated from-40°-40° in the direction of horizontal. After 300-600 generations' evolution,the gender recognition rate,rejection rate and error rate of the positive examples respectively are 96.2%,1.1%,and 2.7%. Furthermore,a large-scale GPU parallel computing method was used to accelerate neural network training. The experimental results show that the new neural model has a better pattern recognition ability and may be applied to many other pattern recognitions which need a large amount of input information.  相似文献   

15.
针对人脸识别中识别精度低的问题,提出一种基于深度学习的跨年龄人脸识别算法.该方法创新性地将方向梯度直方图(Histogram of Oriented Gradient,HOG)和中心对称局部二值模式(Center Symmetric Local Binary Pattern,CSLBPS)组合方法用于人脸图像特征提取,获得包含结构和强度信息的图像融合特征,然后使用二叉树对特征信息进行降维,降维特征作为深度信念网络的可视层输入量,弥补深度新信念网络无法达到图像局部特征要求的缺陷.通过训练好的深度网络模型对测试样本进行学习,在深度信念网络的最顶层对特征进行分类识别.实验结果表明,该方法能高精度实现人脸识别,且与其他方法比较,该方法性能优于其他方法,说明该方法具有可行性和有效性.  相似文献   

16.
张荣梅  张琦  陈彬 《科学技术与工程》2020,20(12):4775-4779
传统的车牌识别算法包括模板匹配、特征统计等方法,但是这些算法依赖于人工提取图像特征,识别准确率低。卷积神经网络LeNet-5算法能够自动提取车牌图像的特征,提高车牌识别准确率。但是目前基于LeNet-5网络结构的车牌识别算法存在识别不完整,运算时间长等缺点。提出基于改进的LeNet-5网络的车牌识别算法,该算法将输入车牌字符图像归一化为32×16大小,并通过删除传统LeNet-5网络中的C5层、修改输出层中神经元个数等,将车牌字符按照汉字和数字/字母的形式识别输出。通过采集大量车牌数据进行训练验证,结果表明:与前人改进的LeNet-5网络结构相比,本文算法在识别率和时间效率上均得到了提高。  相似文献   

17.
为解决大学校园的垃圾回收分类问题, 提出了一种基于卷积神经网络和归一化技术的垃圾图像分类方法, 不需要对输入的图像进行复杂的处理, 网络模型即可根据算法提取图像特征, 通过加入群组归一化(GroupNormalization)和网络模型各层之间的协作, 克服传统分类算法的缺点, 实现对垃圾图像的分类。 实验表明,该识别方法具有较高准确率, 可以较好识别不可回收及可回收垃圾。  相似文献   

18.
为解决边缘设备端车牌识别系统适应性差和识别率低的问题,提出一种基于深度学习处理单元(DPU)的车牌识别系统设计方法.该方法首先将车牌识别网络进行改造使其可在DPU上运行,并通过压缩与激励(SE)模块组合优化神经网络识别率.将DPU部署在现场可编程门阵列(FPGA)上,调用神经网络对视频图像进行车牌识别,设计出可兼顾新能源车牌的车牌识别系统.实验结果表明,以大规模数据集作为图像输入,车牌识别系统的平均识别准确率可达94.1%,运行速率可达4 ms.  相似文献   

19.
为了在数据集过小时更好的训练卷积神经网络,本文提出一种方法通过训练GAN(生成对抗网络)生成新的样本进行图像数据增强。扩充后的数据集应用于训练图像分类模型,得到了不错的效果。针对Herlev宫颈细胞数据集的二分类问题,本文首先使用原始训练集训练GAN,生成了大量高质量的高分辨率细胞图像,将每类训练集扩充到24 000例。然后使用扩充后的训练集进行分类网络训练,在Resnet迁移学习的验证集准确率高达97%,高于仿射变换扩充的数据集的训练结果93%,可见本文方法可以有效地实现图像的数据增强。本文方法也可用于其他领域的图像数据增强。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号