首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 125 毫秒
1.
针对车标识别准确率的问题,提出一种基于ResNet-18模型改进残差网络的车标识别算法.首先,利用残差网络并对其进行改进,使用改进的线性修正单元Leaky ReLU激活函数代替原激活函数;其次,调整传统的残差网络结构,将批量标准化和激活函数放在卷积层前,并减少网络参数以加速网络训练.实验结果表明,改进后的残差网络模型识...  相似文献   

2.
面部微表情具有持续时间短、强度低等特点,因此微表情识别的准确率较低,且当前提出的基于深度学习的微表情识别方法难以理解网络模型的决策原因,以至于难以应用于实际.针对该问题提出一种基于残差单元的可解释时空卷积网络用于微表情识别的方法,该方法通过使用时空卷积网络,将微表情视频帧序列作为输入,并解释网络模型参数与特征,在实现模型可解释性的同时,提高了微表情识别的准确率.在CASME2、SMIC和SAMM数据集上对提出方法进行验证,实验结果表明,本文方法优于目前大部分基于深度学习的微表情识别方法.  相似文献   

3.
微表情顶点帧蕴含着丰富的微表情信息,为了准确地检测出微表情顶点帧,本文提出了一种基于光流特征的神经网络分类,并利用先验知识规则进行取舍的检测方法. 该方法针对固定滑窗大小内的图像进行光流信息提取,利用双输入特征提取网络对x, y方向的光流信息进行时空特征提取,并进行分类,经根据微表情先验知识所设计的取舍规则后处理后,改善了检测准确度. 实验结果表明,在数据集CASMEⅡ上测试,顶点定位率(apex spotting rate,ASR)指标达到了0.945,F1-score指标达到了0.925.   相似文献   

4.
针对识别字轮式表盘数字时,出现耗时长、双半字符识别率不高、模型参数过大等问题,提出了一种改进残差网络的字轮式数字表盘识别算法。首先,对采集的表盘原始图像进行预处理操作,得到包含完整字符图像和双半字符图像的数据集;其次,对ResNet-18网络进行优化改进,引入深度可分离卷积和Dropout函数;最后,加载数据集进行训练和测试。实际验证结果表明:改进后的残差网络模型识别准确率达99.8%,模型参数大小减小到7.71 MB左右,模型平均推理时间缩短至12 ms左右。  相似文献   

5.
针对现有机器人基于深度网络的地形识别方法准确率低、网络训练时间长且需要大量训练数据的问题,提出一种基于深度残差网络与迁移学习的地形识别方法。首先,基于Resnet网络构建一种深度残差网络;其次,利用现有Imagenet大型数据集对构建的深度残差网络进行预训练,作为预训练网络,保留预训练网络除全连接层的训练权重,实现预训练网络大规模的参数迁移;最后,利用自建地形图像数据集对深度残差网络的全连接层进行训练,实现深度残差网络微调。实验结果表明,通过迁移学习的方法,利用深度残差网络对石子路、水泥路、砖地、沥青、草地、泥地6种自建地形图像进行分类,平均准确率达到了99.3%,同时网络训练时间也显著降低。  相似文献   

6.
为了改善图像表情和图像序列表情识别效果,针对传统表情识别特征提取复杂和效果不理想问题,提出了一种深度残差网络和局部二值模式(local binary patterns,LBP)相结合的特征提取方法,利用深度残差网络提取数据集的空域特征,长短期记忆网络(long short-term memory,LSTM)处理时域特征,实现空域与时域特征的结合。研究了不同层数的残差网络、不同形式的LBP算子以及其他网络结构对人脸表情识别的影响,对比了支持向量机和随机森林实现的序列表情识别算法。在Cohn-Kanade数据集和AFEW6.0数据集上进行了验证,实验结果表明,算法在验证集上的准确率分别为73.1%和58.4%,相比其他算法有一定程度的提升。  相似文献   

7.
为了探索深度学习在掌纹识别领域的应用,提出了一种利用残差网络技术自动提取掌纹特征的方法,该方法根据掌纹的几何特征对掌纹图像进行预处理,将预处理后的掌纹图像进行归一化得到一个二维图像矩阵,作为残差网络的输入,再利用随机梯度下降算法对网络进行迭代训练,获取最优的网络参数,最后使用分类器Softmax对掌纹进行分类识别.模型在香港理工大学的掌纹数据库上进行了实验验证,实验结果证实了利用残差网络对掌纹进行分类的可行性,并取得了不错的分类效果.  相似文献   

8.
为了提高癫痫脑电图(EEG)的识别精度,提出一种基于改进残差网络的癫痫脑电自动识别算法。首先对EEG信号进行归一化,然后利用改进的残差模块构建一维深度残差网络,将其用于自主学习EEG的内在特征,最后利用Softmax分类器实现癫痫的自动识别。为了评估模型的性能,采用十折交叉验证对波恩大学的癫痫数据集进行实验。实验结果表明,该算法能够有效识别癫痫EEG类别,具有较高的识别准确率。  相似文献   

9.
在微表情识别系统中,常规的特征融合方法会引入冗余或干扰特征,因而会影响识别准确率和效率。针对上述问题,提出一种基于双支路核化群稀疏学习(Two-Branch Kernelized Groups Sparse Learning, TB-KGSL)的特征选择方法,并将其应用于微表情识别系统。首先,提取多个人脸区域的3个正交平面上局部二值模式(Local Binary Patterns from Three Orthogonal Planes, LBP-TOP)和多个方向上的单方向梯度直方图(Histogram of Single Direction Gradient, HSDG)两组不同类型的特征;然后,使用TB-KGSL模型从上述两组特征中分别选择有效区域的LBP-TOP特征和有效方向上的HSDG特征;最后,将选择的LBP-TOP和HSDG特征进行拼接融合,得到紧凑且可鉴别的特征,并使用基于支持向量机(Support Vector Machine, SVM)的分类器进行微表情分类。实验结果验证了TB-KGSL的可行性和有效性,并在CASME II和SMIC数据集上分别达到68.63%和7...  相似文献   

10.
车载动态场景下,为了提高基于视频手势识别的准确率和鲁棒性,提出了一种基于关键点的残差全连接网络手势识别算法.对在不同车辆平台、不同运动条件下采集的不同光照强度的视频数据进行归一化等预处理后提取视频帧的关键点,以关键点个数为准则进行了关键帧选取以提高运算性能和降低算法复杂度,将从关键帧中所提取的关键点送入残差全连接网络实现连续手势的识别.在不同光线与车内环境下,所提算法对6类动态手势的平均识别准确率达到96.72%,相较3D卷积神经网络(C3D)、卷积神经网络(convolutional neural network,简称CNN)、长短时记忆网络(long short-term memory network,简称LSTM)和双流网络,其识别率分别提升了10.72%,6.40%,5.17%和4.50%.实验结果验证了所提算法在车载环境下连续手势识别的有效性.  相似文献   

11.
微表情持续时间短、表达强度低,给训练有效模型带来了挑战。针对此问题,提出了一种基于像素特征的微表情识别方法。对图像序列的面部区域进行裁剪,消除背景噪声;将每一帧的像素矩阵与第一帧(中性表情)做差处理,提取面部变化;对做差的结果累加,进一步突出面部表情;使用搭建的浅层CNN网络进行分类。在3个公共微表情数据集组成的交叉数据集上进行K折(K-fold)交叉验证实验中,所提方法的3个评价指标ACC(accuracy)、UF1(unweighted F1-score)和UAR(unweighted Average Recall)分别达到了0.830 4、0.782 7和0.794 4,表明了该方法的有效性。与LBP-TOP等8个模型的对比实验中,所提方法的指标明显优于对比模型,验证了该方法的优越性。  相似文献   

12.
针对单点多盒检测器(single shot multibox detector,SSD)对小目标识别率低的问题,提出一种基于残差网络和改进特征金字塔(feature pyramid networks,FPN)的RP-SSD(residual and pyramid SSD)算法,并将其应用于油田安防领域。为了得到小物体更多的信息,首先在特征金字塔中增加上采样模块,并在上采样模块之后添加预测模块,之后采用空洞卷积增大Conv4_3的感受野。RP-SSD网络变深,针对RP-SSD在反向传播过程中存在梯度爆炸或梯度消失的问题,采用跳层连接的方式改进基础网络。RP-SSD在PASCAL VOC测试的准确率(meanaverage precision,mAP)为78.9%,比SSD提高了1.7%,其中对于目标较小的bottle类提高了8.9%。实验结果表明,RP-SSD对小目标检测的性能提高显著,同时RP-SSD在GTX 1080Ti上测试的速度为32帧/s,可见RP-SSD可以达到实时处理的要求。  相似文献   

13.
针对目标识别需求,对基于神经网络的深度学习方法展开研究。由于深度学习模型中包含了对数据的先验假设,因此人工设计神经网络需要领域内专家丰富的先验知识,且具有劳动密集与时间成本高的缺点。为了获得超越专家个人经验、表现更好的网络,采用一种可微神经结构搜索的高效结构搜索方法,将搜索空间放宽为连续的空间,然后通过梯度下降来优化体系结构的验证集性能,从而找到面向目标识别的最优神经网络结构。仿真实验结果表明,将基于神经网络结构搜索的目标识别方法应用于"低慢小"类目标识别是可行的。  相似文献   

14.
针对目前利用人脸特征进行性别和年龄识别率较低的问题, 提出一种基于改进高分辨率网络(improved high-resoultion net, IHRNet)的新方法. 首先, 在IHRNet中融合具有少量参数和较高识别率的MobileNetV3结构, 结合高分辨率网络自身具有的多尺度特征提取优势, 有效提升了人脸特征识别的准确率; 其次, 为降低过拟合风险, 网络先采用IMDB-WIKI人脸数据集进行预训练, 然后加载预训练模型在Adience人脸数据集中进行训练和测试; 最后, 与ResNet50,HRNet,MobileNetV3三种同类算法进行对比. 实验结果表明, IHRNet在年龄及性别识别上的准确率分别高达82%,95%, 比同类算法分别平均提升9%和3%, 且参数量较未改进时下降36%, 验证了改进算法的有效性.  相似文献   

15.
针对目前利用人脸特征进行性别和年龄识别率较低的问题, 提出一种基于改进高分辨率网络(improved high-resoultion net, IHRNet)的新方法. 首先, 在IHRNet中融合具有少量参数和较高识别率的MobileNetV3结构, 结合高分辨率网络自身具有的多尺度特征提取优势, 有效提升了人脸特征识别的准确率; 其次, 为降低过拟合风险, 网络先采用IMDB-WIKI人脸数据集进行预训练, 然后加载预训练模型在Adience人脸数据集中进行训练和测试; 最后, 与ResNet50,HRNet,MobileNetV3三种同类算法进行对比. 实验结果表明, IHRNet在年龄及性别识别上的准确率分别高达82%,95%, 比同类算法分别平均提升9%和3%, 且参数量较未改进时下降36%, 验证了改进算法的有效性.  相似文献   

16.
为准确识别视频目标个体完整行为动作序列, 增强视频行为识别精度, 提出一种基于超限学习机的深度网络时间分组行为识别方法。 首先按照人体行为关键姿态个数明确行为识别模型的状态数量, 建立人体运动行为多尺度结构关联, 把运动轨迹及边缘轮廓小波矩的不同尺度特征引入行为模型中, 获取人体运动行为概略特征; 其次利用视频分组稀疏抽样法, 将视频分割成等时长分组, 运用标准反向传播法优化模型参数, 实现低成本视频级时间建模, 并确保建模过程信息完整性; 最后根据隐含层激活函数输出及对应输出层权重系数,得到灵敏度解析式, 按照灵敏度参数对隐含节点进行排序, 删除次要节点, 实现深度网络时间分组行为的精准识别。 仿真实验结果表明, 该方法具备较高水准的识别精度, 且耗时少, 拥有极强的鲁棒性。  相似文献   

17.
SAR-BagNet模型是一种应用于合成孔径雷达(SAR)图像识别的可解释深度学习模型。为了使SAR-BagNet模型在具有可解释性的同时具有较高的识别精度,以SAR-BagNet模型为基础,在模型框架中加入了空间注意力和坐标注意力机制,并在MSTAR实测数据集上进行了实验。实验结果表明,空间注意力和坐标注意力机制增强了SAR-BagNet模型的全局信息获取能力,能够在不降低其可解释性的基础上,有效提高模型的识别精度和决策合理性。  相似文献   

18.
摘 要:当前在深度学习上对烟雾图像和视频识别较少,目前存在的问题是烟雾视频图像第一帧识别率低,覆盖范围小,自适应较差的情况。本文算法改变了ResNet结构,实现精确的烟雾区域检测。在实验中经过5000张不同烟雾图像的数据集学习,实验结果准确地识别了烟雾图片,为大范围的火灾烟雾报警提供了一种有效方案。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号