首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对传统机器学习方法在采用运动传感器数据的人体运动识别领域中识别效果严重依赖人工特征且准确率受限的问题,提出一种改进的卷积网络与双层长短期记忆网络的深层混合(VGGLSTM)模型以实现特征自提取并进行运动识别。该模型结合传感器数据层状、时序的结构特点,将多维传感器数据类比于图像的RGB矩阵进行适应性处理;由一维串联卷积网络与双层长短期记忆网络复合而成。实验结果表明,在开源的人体运动识别(HAR)数据集和无线传感器信息控掘(WISDM)数据集上采用该模型的人体运动识别方法的平均准确率分别达到了97.17%和96.53%,该模型可以有效避免复杂的特征工程,在人体运动识别问题中具有很好的准确性和适应性。  相似文献   

2.
面部微表情具有持续时间短、强度低等特点,因此微表情识别的准确率较低,且当前提出的基于深度学习的微表情识别方法难以理解网络模型的决策原因,以至于难以应用于实际.针对该问题提出一种基于残差单元的可解释时空卷积网络用于微表情识别的方法,该方法通过使用时空卷积网络,将微表情视频帧序列作为输入,并解释网络模型参数与特征,在实现模型可解释性的同时,提高了微表情识别的准确率.在CASME2、SMIC和SAMM数据集上对提出方法进行验证,实验结果表明,本文方法优于目前大部分基于深度学习的微表情识别方法.  相似文献   

3.
通过设计多组实验策略,在TU-Berlin手绘草图数据集中,对AlexNet、GoogLeNet、VggNet和ResNet四种经典深度卷积神经网络结构进行手绘草图识别对比实验,结果表明相比其他网络结构,ResNet在手绘草图识别任务上具有更好的性能.  相似文献   

4.
针对传统指纹识别方法存在准确率低、推理速度慢等问题,提出了一种应用于指纹识别和匹配的深度学习模型Finger-mixNet指纹识别算法。Finger-mixNet模型基于卷积神经网络和Transformer结构进行关联融合,包括两个核心模块共同表征指纹识别任务的深度特征。Network-C模块基于卷积神经网络获取浅层纹理特征,Network-TC模块基于自注意力机制和卷积共同捕捉指纹深度特征信息,在获得对重点区域注意力的同时,具有比传统卷积更小的计算开销。为证明模型的有效性,在自建的指纹数据集和公共数据集中对模型进行了测试,在自建数据集中Finger-mixNet达到了97.1%的识别准确率,在公共数据集中也取得了98.3%的识别准确率,除此之外Finger-mixNet在保持高识别率同时在上述两种数据集中均能保持200FPS的识别速度。  相似文献   

5.
将传统卷积神经网络应用于小数据集上,LeNet模型准确率低并且收敛速度慢,VggNet等模型存在过拟合问题.针对小数据集提出一种改进LeNet模型,该模型在LeNet基础上使用ReLU函数替换sigmoid来提高收敛速度,加入1*1卷积增加模型深度并利用其改变维度的特点来提高识别准确率,通过分解卷积和提出改进Dropout方法减少过拟合.结果表明:改进LeNet模型分类自制小龙虾数据集,比LeNet收敛速度快6000步并且准确率提高约15%,比VggNet和ResNet过拟合程度明显减少;将改进LeNet模型推广应用于开源数据集MNIST和Fashion-MNIST上,改进模型也有良好的表现.  相似文献   

6.
高扬  王晨  李昭健 《科学技术与工程》2021,21(24):10401-10406
车道线检测是实现当前汽车辅助驾驶和未来无人驾驶汽车的关键,深度学习技术在近年来迅猛发展,在图像识别、图像分割、语音识别及数据预测等方面都取得了出色成绩。结合深度学习技术对无人驾驶汽车环境感知中的车道线检测进行了相应的研究,提出一种基于深度学习的车道线识别算法。对比研究已有算法,针对其中的信息融合问题,提出了一种新的特征图上下文信息融合方法,将该方法与VGG(Visual Geometry Group)网络相结合提出融合上下文信息的车道线识别网络VGG-FF,进一步加入空洞卷积提出融合空洞卷积及上下文信息的车道线识别网络VGG-FFD。将该网络模型在公开数据集以及自制数据集上进行了性能测试,实验结果表明该模型具有良好的识别效果。  相似文献   

7.
针对人脸情绪识别类内差异大,类间差异小的特点,结合学生人脸图像的线上课堂情绪识别的场景,提出多尺度空洞卷积模块提取不同空间尺度特征的稠密深度神经网络模型,实现自然场景下学生人脸图像识别.该模型主要由多尺度空洞卷积和DenseNet神经网络两个子网络组成,其中多尺度空洞卷积由不同空洞率的四分支网络提取不同尺度特征,空洞卷积减小特征图尺寸,减少DenseNet内存资源占用;最后在DenseNet网络中结合Adam优化器和中心损失函数.使用稠密网络的旁路连接,加强情绪特征传递和复用.研究结果表明:基于稠密深度神经网络的情绪识别网络模型能够有效提高情绪分类的准确率,模型对预处理后的FER2013+数据集识别准确率达到93.99%,可为线上教学反馈提供技术支持.  相似文献   

8.
当前大多基于卷积神经网络的3D骨架人体行为识别模型没有充分挖掘骨架序列所蕴含的几何特征,为了弥补这方面的不足,文章在AIF-CNN模型的基础上进行改进,提出多流融合网络模型(MS-CNN)。在此模型中,新增一种几何特征(kernel特征)作为输入,起到了丰富原始特征的作用;新增多运动特征,使模型学习到更加健壮的全局运动信息。最后,在NTU RGB+D 60数据集上进行消融实验,分别在NTU RGB+D 60数据集、NTU RGB+D 120数据集上,将MS-CNN模型与19、8个行为识别模型进行对比实验。消融实验结果表明:MS-CNN模型采用joint特征与kernel特征融合,其识别准确率比与core特征融合的高;随着多运动特征的增多,MS-CNN模型的识别准确率有所提高。对比实验结果表明:MS-CNN模型在2个评估策略下的识别准确率超过了大部分对比模型(包括基准AIF-CNN模型)。  相似文献   

9.
针对传统的工件识别流程是由人工根据工件的特点设计需要提取的特征,整个过程具有耗时高、成本大、通用性较差和识别准确率不高等问题,改进了经典的卷积神经网络模型AlexNet和LeNet-5,通过将AlexNet网络的输入图像尺寸缩小到120×120,用BN层代替LRN层,减少两层卷积和全连接层,用3×3的卷积核代替第一层卷积层11×11的卷积核;将LeNet-5的输入图像尺寸提升至60×60,用ReLU取代原始Sigmoid激活函数,使用多个小卷积核代替大卷积核;分别使用改进前后的网络模型对工件数据集进行训练、测试.结果表明,改进后的两种网络模型,在测试集上分别达到94.31%和92.75%的平均识别准确率,平均识别时间分别为0.271s和0.321 s,满足生产需求.  相似文献   

10.
针对人体活动传感器数据的时序性特点,以及当前机器学习算法过度依赖手工特征提取的问题,提出了一种融合卷积神经网络和双向长短期记忆网络的深度学习模型(CNN-BiLSTM)进行人体活动识别(HAR)。首先对人体活动数据进行样本分割,然后采用卷积神经网络(CNN)自动提取人体活动数据的特征,再通过双向长短期记忆网络(BiLSTM)学习人体活动数据特征在时间序列上前后两个方向的相关性,最后利用softmax分类器实现对人体活动分类。DaLiAc公开数据集上的仿真实验结果表明,基于CNN-BiLSTM网络的人体活动识别方法对13种人体活动的识别准确率达到了97.7%,与仅具备时间特征学习的LSTM网络和BiLSTM网络相比,具有更好的识别分类效果。  相似文献   

11.
针对不平衡难分类条件下空中目标群组意图快速识别的难题,提出一种基于滑动窗口估计的时空卷积自注意力网络模型的意图识别方法。该方法根据特征数据的特点对其使用滑动窗口的预先处理,通过时空卷积网络快速提取多维时序特征数据的流信息;然后采用自注意力机制捕捉每个特征数据的关键特征并优化权重。仿真结果表明该方法有效提升了不平衡样本中难分类样本意图识别的训练效率和分类的准确率。  相似文献   

12.
针对经典U型卷积网络在细胞核分割过程中对距离相近目标的边界较难区分、对模糊目标产生误识别等问题,提出一种改进的U型卷积网络(DU-Net)模型。为增强目标边界特征,提出一种梯度融合方法,计算样本梯度信息并将梯度图多尺度融合至U-Net编码器。解码器浅层特征通过卷积上采样密集连接至深层特征,增加特征的复用性。针对梯度消失问题,DU-Net模型在每个卷积层后采用批归一化和ReLU激活结构。针对经典U-Net模型对模糊目标的误识别问题,提出一种改进的交叉熵损失函数,该损失函数降低了模糊背景点对模型的干扰,同时提高了模型对小目标的识别能力。在2018年数据科学碗公布的670张图片、约29 500个细胞核的公开数据集上验证了DU-Net模型,结果表明,模型的预测结果与真实标签在Dice系数和Jaccard相似系数两项评价指标上分别达到95.9%和91.0%,性能优于U-Net和SegNet编码器,显著优于经典卷积神经网络模型FCN-8s。  相似文献   

13.
针对目前人脸表情识别存在准确率不高、模型复杂和计算量大的问题,文章提出了一种基于八度卷积改进的人脸表情识别模型(OCNN):使用改进的八度卷积进行特征提取,提高对细节特征的提取效果,降低特征图的冗余,在不增加参数的同时减少运算量,以提高特征提取性能;利用DyReLU激活函数来增强模型的学习和表达能力;使用自适应平均池化下采样层代替全连接层,以减少参数;将模型在大规模数据集上进行预训练,并在FER2013、FERPlus、RAF-DB数据集上进行模型性能验证实验。实验结果表明:训练后的模型权重为10.4 MB,在人脸表情识别数据集FER2013、FERPlus和RAF-DB上的准确率分别达到73.53%、89.58%和88.50%;与目前诸模型相比,OCNN模型的准确性高且计算资源消耗低,充分证明了该模型的有效性。  相似文献   

14.
为解决小样本沥青路面破损图片在分类识别中存在的识别精度差的问题,选择常见的5种路面破损类型,提出了一种基于VGG的浅层深度卷积神经网络模型的路面破损图像分类方法. 首先,将采集到的图像集进行预处理并自制成数据集. 其次,设置三种不同的批处理量尺寸和两种不同的网络层数作训练,选择最适合该网络模型的尺寸,得到浅层VGG模型. 将处理后的路面图片直接作为模型的输入,作模型的训练、验证及测试. 最后,将模型试验结果与支持向量机及目前主流的深度卷积神经网络模型的试验结果进行对比. 结果表明:浅层VGG模型在训练集、验证集及测试集的分类准确率接近,对路面破损图像的分类识别准确率都达到98%以上,表现出模型良好的识别能力;与支持向量机及目前主流的网络模型试验结果相比,浅层VGG网络模型训练耗时少且泛化能力更强,模型提取到的特征更丰富,可获得更加全局的信息. 可见,浅层VGG模型在对小规模图像的分类识别中具有显著优势,同时相比其他方法更具鲁棒性,结果更精确.  相似文献   

15.
针对花样滑冰运动人体运动轨迹复杂、动作类型多样、普通人肉眼难以区分且常规的行为识别方法识别准确率低的问题,提出了一种基于时空图卷积网络与多通道注意力机制融合方法 (SAT-GCN)的花样滑冰动作识别算法。该算法首先将视频提取成连续的单独帧,使用OpenPose算法提取人体骨骼关键点数据,降低背景噪声干扰;然后使用时空图卷积算法对骨骼关键点数据进行动作分类。算法对时空图卷积算法进行改进,加入了多通道时空注意力机制融合模块,使得模型更加关注重要的关键点、时间帧片段、特征;使用时序卷积网络(TCN)提取人体骨架关键点在时间序列上的特征;使用SoftMax对提取后的特征进行动作分类。在花样滑冰数据集FSD-10和公开的人类行为数据集Kinetics-Skeleton上进行训练和测试,与改进前的时空图卷积网络(ST-GCN)进行对比,本文所提算法的预测准确率在2个数据集上均有所提升,验证了多通道注意力机制融合方法在花样滑冰选手动作检测任务中的有效性。  相似文献   

16.
传统地形识别算法,主要建立在人工提取特征和训练分类器的前提上,其通用能力有限且准确度不高,或者需要大量的数据集训练基础,这种方法训练的网络模型参数较大且预测耗时较长,不利于移植到移动端。因此,运用迁移学习思想,提出了一种基于深度迁移网络的地形识别算法。采用轻量级卷积神经网络MobileNetV3,在爬虫获取和自建适量数据集基础上,对神经网络进行迁移学习。首先,采用图像分类数据集ImageNet上的预训练成果,根据预训练模型权重对MobileNetV3网络进行初始化,实现对模型大规模共享参数的迁移;然后,通过在自建数据集GXU-Terrain6上进行新的训练,微调模型参数,进而得到新的分类模型;最后,利用训练好的模型对地形类别进行预测,从而完成识别任务。提出算法在GXU-Terrain6测试集上取得了93.00%的平均预测准确率。实验结果表明,基于深度迁移的地形识别算法运用较少数据,可获得较高的识别准确率,网络实时性好,适合向移动端移植。  相似文献   

17.
鉴于卷积神经网络能够自动学习和获取图像特征,提出一种基于RetinaNet模型的火焰检测算法.首先RetinaNet在残差网络之上使用特征金字塔网络作为骨干网计算和生成丰富的卷积特征金字塔,然后通过分类子网络和边框预测子网络分别对骨干网的输出进行分类和回归,通过调整训练策略和参数,最后在自建数据集上使用该算法得到的火焰检测模型实现了实时的端到端火焰识别与定位,对复杂目标背景下的小火点检测也保持较高的检测准确率,对火灾初期的检测预警有一定的实用意义.  相似文献   

18.
针对轻量级卷积神经网络MobileNet应用于人脸识别实时性较差、准确率不高等问题,提出一种改进MobileNet的网络模型—MobileDeepViT。首先,鉴于MobileNet模型有效减少网络参数量特点,本网络以MobileNet为核心,构建具有7层MobileNetV2、3层特征提取层、1层标准卷积和点卷积的深度学习网络;其次,在人脸特征提取过程中引入DeepViT,使网络更有效学习人脸特征;最后,该网络与Inception_ResNetV1和MobileNetV1在相同的数据集CASIA-WebFace上进行训练,在LFW测试数据集上对训练模型进行评估,并在相同条件下对同一人的不同照片进行欧式距离和实时性测试。实验结果显示:该网络在模型参数更小的情况下,准确率比后二者分别提升了0.21%和0.72%、欧式距离测试结果也比后二者更小,预测时间更短,表明改进后的模型参数量减少、实时性更好、精度和鲁棒性提高。  相似文献   

19.
岩屑的岩性识别是地质工作中的一项重要内容。为解决传统人工鉴别岩性的低效问题和通用机器学习模型在岩屑岩性识别上的不适用性:包括准确率欠佳、网络参数冗杂、网络效率低下,针对岩屑图像的特征设计了一种岩屑图像的语义分割网络Debseg-Net,该网络采用编解码结构,卷积与转置卷积结合实现对岩屑图像特征的提取与像素级分类,采用深度可分离卷积减少参数量从而可进一步加深网络,使用跳级连接避免迭代过程中的信息丢失。同时提出了一种高效的岩屑图像自标记方法。经多次实验,Debseg-Net在以10口探井收集的640张共计5类岩屑图像数据集上,识别准确率达到98.43%,平均交并比达到90.01%,领先同类型分割网络2.59至7.04个百分点,在实现数字化岩屑录井进程中提供了方法。  相似文献   

20.
针对3D卷积神经网络捕获的动作特征中时域属性信息的稳健性不足,提出一种时域属性校正方法.通过独创的属性映射法抽象出网络特征数据的时域属性,对比各组特征的属性信息后,对信息差异过大的特征数据进行校正.校正后的模型将增强特征之间的时域一致性,使卷积神经网络模型的动作分类性能得到优化.使用3D的ResNeXt-101作为仿真验证的基础模型,显著提升了该模型在两个常用动作分类数据集上的测试准确率,在使用了预训练模型后也能够保持良好的优化效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号