首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 406 毫秒
1.
为了解决语音识别中由网络加深导致的低层特征消失、参数量大及网络训练困难的问题,基于Inception V3网络的非对称卷积思想,提出了一种改进的密集连接卷积神经网络(densely connected convolutional neural networks, DenseNet)模型。根据语音识别的长时相关性,通过密集连接块建立起不同层之间的连接关系,从而保存低层特征、加强特征传播;为了得到尺度更丰富的声学特征,将卷积核的范围进行扩大;利用非对称卷积思想分解卷积核,以减少参数量。实验结果表明,相较经典深度残差卷积神经网络模型和原始DenseNet模型,提出的模型在THCHS30数据集上的语音识别性能更好,在保证识别率的情况下,还减少了网络参数量,提高了模型训练效率。  相似文献   

2.
为了对灾难场景图像进行快速分析和识别,提出了一种基于多分辨率卷积神经网络和残差注意力机制(attention module)相结合的图像分类模型.首先,对灾难场景数据集进行预处理,在相同类型的条件下将其随机划分为训练集和测试集.基于改进的卷积神经网络(convolutional neural network,CNN),提取训练集的图像特征.使用训练集图片的特征进行训练,并且在测试集图片上实现分类测试.选取DenseNet、Xception和MobileNetV2三种模型,以灾难场景数据集(Disaster_Data_Scenes)为数据集进行实验验证.结果表明:改进的Xception和MobileNetV2网络在灾难场景数据集上进行的图像分类实验测试,比原网络精度分别提升了4.56%和3.04%.其中改进的DenseNet网络比原网络模型精度分别提升9.13%、17.88%和10.27%.可见改进的卷积神经网络模型的分类精度得到有效提高.  相似文献   

3.
针对传统的工件识别流程是由人工根据工件的特点设计需要提取的特征,整个过程具有耗时高、成本大、通用性较差和识别准确率不高等问题,改进了经典的卷积神经网络模型AlexNet和LeNet-5,通过将AlexNet网络的输入图像尺寸缩小到120×120,用BN层代替LRN层,减少两层卷积和全连接层,用3×3的卷积核代替第一层卷积层11×11的卷积核;将LeNet-5的输入图像尺寸提升至60×60,用ReLU取代原始Sigmoid激活函数,使用多个小卷积核代替大卷积核;分别使用改进前后的网络模型对工件数据集进行训练、测试.结果表明,改进后的两种网络模型,在测试集上分别达到94.31%和92.75%的平均识别准确率,平均识别时间分别为0.271s和0.321 s,满足生产需求.  相似文献   

4.
针对人脸情绪识别类内差异大,类间差异小的特点,结合学生人脸图像的线上课堂情绪识别的场景,提出多尺度空洞卷积模块提取不同空间尺度特征的稠密深度神经网络模型,实现自然场景下学生人脸图像识别.该模型主要由多尺度空洞卷积和DenseNet神经网络两个子网络组成,其中多尺度空洞卷积由不同空洞率的四分支网络提取不同尺度特征,空洞卷积减小特征图尺寸,减少DenseNet内存资源占用;最后在DenseNet网络中结合Adam优化器和中心损失函数.使用稠密网络的旁路连接,加强情绪特征传递和复用.研究结果表明:基于稠密深度神经网络的情绪识别网络模型能够有效提高情绪分类的准确率,模型对预处理后的FER2013+数据集识别准确率达到93.99%,可为线上教学反馈提供技术支持.  相似文献   

5.
针对现有恶意代码检测模型对恶意代码及其变种识别率不高,且参数量过大这一问题,将轻量化卷积Ghost、密集连接网络DenseNet与通道域注意力机制SE相结合,提出一种基于Ghost-DenseNet-SE的恶意代码家族检测模型.该模型为压缩模型体积、提升识别速率,将DenseNet中的标准卷积层替换为轻量化Ghost模块;并引入通道域注意力机制,赋予特征通道不同权重,用以提取恶意代码的关键特征,提高模型检测精度.在M alim g数据集上的实验结果表明,该模型对恶意代码家族的识别准确率可以达到99.14%,与AlexNet、VGGNet等模型相比分别提高了1.34% 和2.98%,且模型参数量更低.该算法在提升分类准确率的同时,降低了模型复杂度,在恶意代码检测中具有重要的工程价值和实践意义.  相似文献   

6.
针对传统身份识别方法识别准确率低、模型复杂且运算速度慢等问题,提出一种新的基于轻量级密集连接卷积神经网络(DenseNet)和紫蜂协议(ZigBee)的指纹识别方法.首先,构建指纹识别系统的整体模型,并对该模型进行适当的裁剪以缩减模型复杂度.其次,通过筛选指纹图像、增强有效指纹以及扩充增强后的数据等操作,对采集到的ZigBee协议指纹信息进行预处理.然后,以传统深度残差网络的基本思想为依据,通过前馈的方式改变层间的连接关系并构建轻量级DenseNet.最后,以相同的样本数据为基础分别对轻量级DenseNet模型、普通DenseNet模型和3种传统基于机器学习的身份识别算法模型进行训练.试验结果表明:所提出的基于轻量级DenseNet模型的识别准确度最高,为98.24%,且该模型的运行速度最快,与普通DenseNet模型相比,其模型复杂度降低了94%以上.  相似文献   

7.
结合机器人的工作原理以及卷积神经网络(CNN)在图像分类中的应用,提出了一种基于卷积神经网络的壁面障碍物检测识别算法.首先,以壁面障碍物准确识别为目标,构建壁面障碍物图像库;然后,通过对VGG-16网络简化后进行优化,得到适合壁面障碍物准确识别的卷积神经网络模型.在此基础上,设计该网络由输入层、4层卷积层、2层池化层、1层全连接层以及输出层组成,进一步利用3×3卷积核对训练样本进行卷积操作,并将所获取的特征图以2×2领域进行池化操作.重复上述操作后,通过学习获取并确定网络模型参数,得到最佳网络模型.实验结果表明,障碍物的识别准确率可达99.0%,具有良好的识别能力.  相似文献   

8.
针对轻量级卷积神经网络MobileNet应用于人脸识别实时性较差、准确率不高等问题,提出一种改进MobileNet的网络模型—MobileDeepViT。首先,鉴于MobileNet模型有效减少网络参数量特点,本网络以MobileNet为核心,构建具有7层MobileNetV2、3层特征提取层、1层标准卷积和点卷积的深度学习网络;其次,在人脸特征提取过程中引入DeepViT,使网络更有效学习人脸特征;最后,该网络与Inception_ResNetV1和MobileNetV1在相同的数据集CASIA-WebFace上进行训练,在LFW测试数据集上对训练模型进行评估,并在相同条件下对同一人的不同照片进行欧式距离和实时性测试。实验结果显示:该网络在模型参数更小的情况下,准确率比后二者分别提升了0.21%和0.72%、欧式距离测试结果也比后二者更小,预测时间更短,表明改进后的模型参数量减少、实时性更好、精度和鲁棒性提高。  相似文献   

9.
针对原始C3D卷积神经网络参数量庞大,以及在压缩网络参数的同时进一步提高视频数据集中人体行为的识别率的问题,提出一种改进型C3D卷积神经网络模型。首先,采用全局平均池化和卷积分类操作取代全连接层,形成全卷积网络形式,之后在模型中分别引入卷积核为(3×3×3)和(1×1×1)的三维卷积层,并在此基础上采用卷积核为(3×1×7)和(3×7×1)的三维卷积层对多个(3×3×3)卷积层合并。最后,将所提方法在数据集UCF101和HMDB51上进行训练测试,并与当前深度学习现有流行算法进行比较。实验结果表明,本文所提方法与原始C3D网络模型相比,在UCF101数据集和HMDB51数据集上识别率分别提高了8.9%和7.9%,参数量压缩为原来的32.9%,并且在模型压缩和识别率上也均优于其他方法。  相似文献   

10.
针对卷积神经网络在交通标志识别实时性不好,对设备硬件要求过高的缺点,提出了一种具有实时性,高精度的基于轻量型卷积神经网络的改进网络。一方面引入深度可分离卷积和激活函数Mish,加快网络的训练和识别速度,降低对硬件设备的要求;另一方面通过对网络架构及层次的改进,同时合理改变卷积核的大小和数目,加强图片特征的表达与传递。在BelgiumTSC交通标志数据集上的实验结果表明,改进后网络明显提高了网络训练速度,同时识别精度也略高于原网络,验证了改进方法的有效性。通过与其他模型相比,该模型能够更快速准确完成交通标志识别任务,验证了该方法的可行性。  相似文献   

11.
针对原有双流时空卷积网络模型中网络深度不足,从而导致人体行为识别结果偏低的问题,针对该网络模型进行改进,且融入Kinect骨骼序列数据.对于输入数据,通过Kinect相机对人体动作转化为骨骼序列;改进双流卷积网络模型是在原有的模型框架下,用RestNet-50网络结构替代原VGG-16网络结构,再对数据进行一系列处理.在HMDB-51和UCF-101两个公开数据集上进行模型的训练和验证,其识别结果分别为70.8%和91.4%,通过对比结果表明,本文提出的改进双流卷积网络融合Kinect骨骼数据能够有效提升人体行为识别的正确率.  相似文献   

12.
针对车标识别准确率的问题, 提出一种基于ResNet-18模型改进残差网络的车标识别算法. 首先, 利用残差网络并对其进行改进, 使用改进的线性修正单元Leaky ReLU激活函数代替原激活函数; 其次, 调整传统的残差网络结构, 将批量标准化和激活函数放在卷积层前, 并减少网络参数以加速网络训练. 实验结果表明, 改进后的残差网络模型识别准确率达99.8%.  相似文献   

13.
针对目前中文命名时实体识别方法中存在的中文边界识别困难、模型梯度、文本特征不够充分等问题,提出了一种融合词性特征与双向时间卷积网络的中文命名时实体识别模型。该模型提出使用XLNet预训练语言模型生成对应的词嵌入表示,融合后使用双向时间卷积网络提取文本前向特征与后向特征。实验中对时间卷积网络的空洞因子、卷积层数和卷积核数进行参数实验并分析其影响原因,结果表明,该模型与其他模型相比,能够更准确且有效地提取文本中的实体。  相似文献   

14.
为了解决银行、邮局等场合的实时数字识别问题,提出了一种优化的卷积神经网络(Convolutionnal Neural Network,CNN)数字识别方法。以Lenet-5模型为基础改进了卷积神经网络结构并推导了改进后的前向和反向传播算法,将改进的卷积神经网络在手写、印刷数字组合数据库上进行测试,分析了不同样本数量、训练迭代次数等参数对识别准确率的影响,并与传统算法进行比较分析。结果表明改进后的CNN结构简单,处理速度快,识别准确率高,具有良好的鲁棒性和泛化性,识别性能明显高于传统网络结构。  相似文献   

15.
针对传统图像分类方法在花卉图像上存在分类效果不佳的问题,提出一种改进Xception网络的方法。首先结合Res2net中的多尺度模块来提高模型特征信息的丰富度,提出Multi_Xception网络,接着使用1×1卷积核对多尺度深度可分离卷积模块的输入特征图进行信道压缩,减少模型参数的同时进一步丰富模型特征信息,提出Multi2_Xception网络。将改进模型应用于Flowers Recognition花卉数据集分类,实验结果表明,该方法相较于原算法分类准确率提升了1.64%,F1-score提升了0.018,验证了多尺度Xception网络的有效性。  相似文献   

16.
针对检测模型参数量大,难以在嵌入式设备上部署等问题,设计了一种改进的YOLOv4目标检测算法.该算法使用轻量化的MobileNetV1替换CSPDarketnet53主干特征提取网络,并将后续网络中的3×3卷积替换为深度可分离卷积,极大地减少了模型的参数量;在检测头加入NAM注意力模块,增强网络对细节信息的提取能力;采用SDIoU Loss作为边框回归损失,在加快收敛速度的同时提高了检测精度.实验表明:与YOLOv4-CSPDarknet53相比,改进算法在PASCAL VOC07+12数据集上训练出来的模型大小为47.19 M,约为原来的五分之一,FPS提升了40(f/s),mAP提升了2.4%.与YOLOv4-Tiny、YOLOv5s、YOLOv7等目标检测算法相比,具有兼顾检测速度与精度的特点.  相似文献   

17.
汪志成  赵杰  沈博韬  王哲 《科学技术与工程》2023,23(33):14278-14286
针对婴儿全身运动质量评估问题,本文基于姿势识别对婴儿运动特征进行提取与分析,提出基于ResNet和反卷积层的婴儿姿势热力图识别模型,平均识别率达到86.9%;利用婴儿的二维姿势坐标,建立基于DenseNet的3D人体姿势识别模型,使用1D卷积网络及1D连接层,实现婴儿的2D姿势坐标到3D姿势坐标的升维推算;使用四元数作为空间向量表示方式,对婴儿主要肢体运动的角度、角速度、角加速度进行提取,并提出基于SVM的由婴儿肢体运动角度特征进行判定的婴儿异常行为识别模型。针对模型参数过多的问题,在保证模型整体识别率的情况下,使用主成分分析的方式对模型进行特征降维,提高整体识别速度,将维度由18维度降低至8维度后,整体运行时间减少近50%,且对于不同的视频样品均能正确分类。  相似文献   

18.
为改善现有火焰检测算法参数量大、训练时间长等缺点,本研究提出基于YOLOv4改进的轻量级火焰检测算法。算法以YOLOv4为基本框架,采用MobileNet v3作为主干网络,利用深度可分离卷积替代YOLOv4中颈部网络和检测网络的3×3普通卷积,并将激活函数更换为H-swish函数,构建出一种轻量级火焰检测算法。不仅参数大幅度减少,而且能提升火焰检测精确度,降低火焰漏报率。实验证明,在相同的训练条件下,本研究提出的算法参数量个数降为YOLOv4的18%,训练时间减少44%。当检测相同火焰图像时,与MobileNet v3-DW-YOLOv4算法相比,本研究算法的精确度提升1%,检测速度为每秒46帧,能更好地嵌入到终端设备上进行实时检测。  相似文献   

19.
为解决现有的超分辨率模型不能很好的恢复图像的纹理细节和模型训练困难等问题,结合现有的残差网络和GoogleNet中的Inception模块对其进行改进。通过将5×5的卷积核替换为两个级联的3×3的卷积核、使用LeakyReLU作为激活函数和删除池化层等方法对原始的Inception模块进行改进,然后在模型中多次级联改进后的Inception模块。实验结果表明,与双三次插值算法、SRCNN和VDSR算法相比,改进后的模型能获得更高的峰值信噪比(PSNR)和结构相似性指数(SSIM),并且在视觉效果上也有明显的改善。  相似文献   

20.
针对传统卷积神经网络层级较为浅,对物体识别精确度较低的原因,利用改进的深层卷积网络VGG16模型检测视频运动目标.首先,预处理过程中对数据集进行剪裁和旋转操作,补充数据集数量,以解决前期图像资源不足等问题;其次,在PASCAL VOC数据集上先预训练模型,接着加载自定义视频数据集对预训练模型进行第二次训练.实验结果表明,该网络模型能很好用于视频目标识别,提高了检测精确度,有效减少网络参数计算量,降低硬件内存资源消耗,具有较强的鲁棒性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号