首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
为了解决双目视觉中的立体匹配问题、减少立体匹配网络的参数数量、降低算法的计算复杂度、提高算法的实用性。在PSMNet立体匹配网络的基础上进行改进,提出了一种具备浅层结构与宽阔视野的立体匹配算法——SWNet。浅层结构表示网络层数更少、参数更少、处理速度更快;宽阔视野则表示网络的感受野更宽广,能够获取并保留更多的空间信息。SWNet由特征提取、3D卷积和视差回归3个部分构成。在特征提取部分,引入了深色空间金字塔结构(Atrous Spatial Pyramid Pool,ASPP),用于提取多尺度的空间特征信息,设计了特征融合模块,将不同尺度的特征信息有效地融合起来以构建匹配代价卷;3D卷积神经网络利用堆叠的编码解码结构进一步对匹配代价卷进行规则化处理,获得不同视差条件下特征点之间的对应关系;最后,采用回归的方式得到视差图。SWNet在SceneFlow和KITTI 2015两个公开的数据集上均取得了优异的表现,与参考算法PSMNet相比,参数数量下降了48.9%,且误匹配率仅有2.24%。  相似文献   

2.
刘文龙  陈春雨 《应用科技》2022,(2):49-54,62
为解决跌倒动作的检测和空间定位问题,本文以YOLOv3目标检测算法为基础,提出了一种全新的用于人跌倒动作识别的检测架构.本算法将视频拆分成一系列的图片序列,并在图片序列中指定关键帧.通过3D卷积神经网络提取视频序列中的时间维度特征,2D卷积神经网络提取关键帧中的空间维度特征,经通道融合机制在不同尺度的预测特征层进行通道...  相似文献   

3.
从低分辨率图像中提取特征图恢复高分辨率图像中的高频信息是超分辨率重建的一个关键问题,针对该问题提出一个新的基于卷积神经网络的超分辨率重建算法.网络结构由卷积层与子像素卷积组成,特征提取网络中卷积层提取低分辨率图像的特征,重建网络中子像素卷积神经网络作为上采样算子.针对不能充分利用多级特征图的问题,采用跳跃连接和特征图联结在特征提取网络末端跨通道融合特征图,同时降低特征图的维度.并在此基础上再次提取特征图应用于重建.实验结果表明,算法在PSNR、SSIM和人类视觉效果上与其他基于深度学习的算法相比有着显著的提高.  相似文献   

4.
针对传统卷积神经网络(CNN)稀疏的网络结构无法保留全连接网络密集计算的高效性和在实验过程中卷积特征利用率低造成的分类结果不准确或收敛速度较慢的问题,提出了一种基于CNN的多尺度方法结合反卷积网络的特征提取算法(MSDCNN)并对腺癌病理图像进行分类。首先,利用反卷积操作实现不同尺度特征的融合,然后利用Inception结构不同尺度卷积核提取多尺度特征,最后通过Softmax方法对图像进行分类。在腺癌病理细胞图像进行的分类实验结果表明,在最后的卷积特征尺度相同的情况下,MSDCNN算法比传统的CNN算法分类精度提高了约14%,比同样基于多尺度特征的融合网络模型方法分类精度提高了约1.2%。  相似文献   

5.
针对输电通道下施工车辆与输电线之间距离难以计算、工程车辆检测精度较低等问题,提出一种改进Mask RCNN的工程车辆分割算法.首先将特征提取网络中的卷积替换为动态卷积,使网络训练时可以根据输入图像及时调整卷积核的大小,有效提高模型性能;然后在网络中添加NAM注意力机制,提高网络对工程车辆的关注度;最后修改特征融合网络为ssFPN,防止特征融合时信息丢失,加强语义融合,提高模型检测精度.对比试验结果表明,与改进前基于ResNet50的Mask RCNN算法相比,改进后算法提高了对工程车辆的检测精度,mAP提高了4.1%,后续处理得到的车辆轮廓精确,证明了改进后算法的有效性.  相似文献   

6.
洪叁亮 《应用科技》2023,(5):54-57+65
针对AIZOO开源人脸口罩检测算法FaceMaskDetection存在较严重的人脸口罩分类精度低的缺陷,本文设计了高精度轻量级人脸口罩分类模型,提出快速特征提取模块FastBlock和基于多层级特征融合的轻量级人脸口罩分类网络(Light MaskNet)。FastBlock减少深度可分离(depthwise, DW)卷积和1×1卷积中间张量的通道数量,进一步降低计算成本,从而提高了特征提取速度。不同层级之间的特征融合可以增大模型的广度,提高模型的鲁棒性。实验结果表明,该人脸口罩分类模型精度可达98.852%,中央处理器(central processing unit, CPU)推理时间仅为9.8 ms,图形处理器(graphics processing unit, GPU)可实现亚毫秒级运算,仅牺牲少量计算资源就能弥补FaceMaskDetection精度低的缺陷,可很好地满足计算资源有限的边缘设备、移动端等的应用需求。  相似文献   

7.
为了降低YOLOv3算法的计算量和模型体积,提高对小目标的检测能力,本文提出一种基于Ghost卷积和通道注意力机制级联结构,将其作为YOLOv3算法的特征提取网络,以减少网络计算量;在小目标预测支路引入S-RFB模块,扩大模型的感受野,更好地利用上下文信息,以提高对小目标的检测能力;使用CIOU损失作为边界框位置损失项,以加速模型的收敛.利用高斯噪声对训练样本进行数据增强,提高模型的鲁棒性.在UA-DETRAC数据集上进行实验,实验结果表明,相比于YOLOv3算法,基于Ghost卷积和通道注意力机制级联结构的G-YOLO算法的平均精度提高了2.7%,模型体积减小了67%,在复杂道路交通环境中具有良好的检测效果.  相似文献   

8.
在工业生产制造过程中,由于生产失误致使产品表面缺陷不仅影响产品质量,同时也会损害企业形象.针对现有方法使用卷积神经网络只具备局部感受野的问题,将Vision Transformer(ViT)作为特征提取器,ViT可以通过位置编码与图像块间的互相运算充分利用图像中各部分间的关联特征.此外,针对现实场景下的缺陷区域是不规则、不连续的,现有的模型也未充分利用图像中通道与空间信息问题,提出了一种基于可变形卷积融合空间通道双注意力机制的方法(deformable convolutional and dual attention flow,简称DCA-Flow).对于不规则的缺陷区域,使用形变建模能力更强的可变形卷积进行特征提取,并利用通道与空间维度的注意力机制对可变形卷积提取的特征进行权重再调节.实验结果表明,所提出的方法能够有效检测各种类别物体中的表面缺陷,在多种物体中的平均AUROC值可达96.4%,相较基线方法最大值提高了1.4%,且具备更好的泛化性.  相似文献   

9.
为解决传统3D卷积中难以提取时空信息的缺点,提出一种适用于3D卷积网络的多重注意力机制模块.该模块是由通道结合时间子模块和空间子模块组成的多维度特征调整模块.在通道结合时间模块中,通过调整池化层和卷积层的顺序,保留更多的有效通道信息和时间信息;在空间模块中,压缩冗余时间信息以减少计算量.该模块的整体计算量较少,可嵌入到各3D卷积网络中.为验证多重注意力机制模块的性能,基于3D ResNet网络设计部署了该多重注意力机制模块,并在UCF-101和HMDB-51两个行为识别数据集上分别进行训练.结果表明,改进后的3D ResNet在UCF-101上可提升1.50%的精度,在HMDB-51可提升1.24%的精度,而参数量只增加0.24%.  相似文献   

10.
针对以往剩余使用寿命(RUL)预测方法均等对待深层特征中具有不同重要性的空间域和通道域特征,导致大量的计算资源浪费在不重要的特征上,进而造成RUL预测值偏差过大、不能对失效设备进行及时的维护以避免潜在的安全隐患的问题,提出一种采用残差网络与卷积注意力机制的端到端的RUL预测方法。该方法以卷积层和池化层对原始监测信号进行浅层特征提取与压缩;利用堆叠残差模块在学习深层特征的同时,缓解梯度弥散以及网络退化现象的发生;由卷积注意力模块对设备的深层退化特征进行加权赋值,分别在其空间维度上和通道维度上强化更重要的特征并抑制相对不重要的特征,使网络的注意力集中在对RUL预测任务更关键的信息上;将加权后的特征输入到全连接网络中映射得到RUL预测值。通过PHM2012轴承数据集进行了实验验证,实验结果表明,卷积注意力和残差结构皆对改善模型的预测性能有着积极的作用,所提方法在测试轴承上的均方根误差和平均绝对误差分别为0.107 9和0.083 1,远低于其他对比方法。  相似文献   

11.
为了解决在仅有单目视图的环境下实现立体匹配的问题,在现有视图重构网络模型Deep3D的基础上,提出了基于加权局部对比归一化约束的全卷积重构模型.该模型采用改进的全卷积神经网络架构作为模型的特征提取模块,以期减少训练参数,降低训练时间,增加模型的非线性.为了进一步提高重构精度,设计了新的基于加权局部对比归一化的约束条件,并采用结构相似性成本(SSIM)与L1成本相结合的损失优化函数对模型进行优化.在KITTI 2015数据集上展开实验,并与Deep3D模型及其后续的改进方法进行比较.实验结果表明,在只使用左视图作为训练数据的情况下,生成的右视图在SSIM和峰值信噪比两个指标上有很大提升,能够满足立体匹配方法中右视图的精度要求.  相似文献   

12.
近年来卷积神经网络(convolutional neural network,CNN)在行为识别任务中取得了较大的进展.然而,现有的神经网络方法往往只注重高层语义信息的利用,对浅层特征信息挖掘利用不够.针对这一问题,提出一种基于3D卷积(convolution 3D,C3D)的多尺度3D卷积神经网络的行为识别方法.该方法受到特征金字塔结构的启发,在原C3D的基础上融合C3D的浅层特征信息,实现端到端的行为识别.同时该方法以现有的深度学习理论为基础,利用迁移学习的思想,将C3D和该方法中相同模块部分的参数迁移到本方法中,以降低模型的训练时间.通过在UCF101数据集上进行实验,实验结果表明,提出行为识别方法的分类精度达到84.56%,分类效果优于原C3D分类网络.  相似文献   

13.
针对传统神经网络在人脸图像的训练过程中没有将高低卷积层信息进行融合,为充分利用图像各层特征信息,提出一种基于三层特征融合的全连接卷积神经网络模型,算法将原有网络最后三层特征结合,并将提取的特征信息与最后一层全连接层结合,从而增加了浅层特征的表达,加强了深层特征的提取效果,促使改进后的卷积神经网络提取的信息更加完备;同时将损失函数和中心函数加权联合,以提高人脸图像的识别率和区分性.在CASIA-webface人脸数据库进行的实验结果表明,改进后的网络模型识别率达到98. 7%,优于DCNN等算法,并将训练好的网络模型应用到YALE、PERET、LFW-A等人脸库上,相比其他方法识别率都有所提升.  相似文献   

14.
为了解决传统雄穗检测方法因玉米品种不同以及田间环境不同导致的检测误差较大、鲁棒性较差的问题,利用深度卷积神经网络提取特征,并对多尺寸特征图卷积的方法检测玉米雄穗。采用深度卷积神经网络inception作为基础网络来训练提取玉米雄穗特征,同时增加额外的卷积层对图像进行卷积提取特征,最后分别对基础网络中的两层卷积层以及额外的卷积层卷积得到的不同尺度特征图进行分类和位置回归。整体网络结构是多尺度端到端框架,效率高,方便检测不同尺度的雄穗。实验结果表明,此方法提高了雄穗检测的速度和准确率。  相似文献   

15.
当前的图像特征识别大多采用的是传统的机器学习方法与卷积神经网络方法。传统的机器学习对图像识别的研究,特征提取多是通过人工完成,泛化能力不够强。最早的卷积神经网络也存在诸多缺陷,如硬件要求高,需要的训练样本量大,训练时间长。针对以上问题,提出了一种改进的神经网络模型,在LeNet-5模型的基础上并在保证识别率的情况下,简化网络结构,提高训练速度。将改进的网络结构在MINIST字符库上进行识别实验,分析网络结构在不同参量中的识别能力,并与传统算法进行对比分析。结果表明提出的改进结构在当前识别正确率上,明显高于传统的识别算法,为当前的图像识别提供新的参考。  相似文献   

16.
提出一种以U-Net为基础,依据零件缺陷的特点对网络进行一系列改进的模型,以提升网络对零件缺陷的分割精度.首先在U-Net结构中的编码阶段,使用改进的残差网络Res2Net提高该阶段的特征提取能力;然后在网络编码器与解码器的中间部位增加空洞卷积,在不改变特征图尺寸的情况下增加感受野,降低误检率与漏检率;最后在U-Net的输出阶段与Mini U-Net进行结合,对原本的输出结果进行二次补丁,提高对微小缺陷的检测精度.实验结果表明,对MVTec数据集进行分割的F1-Score分数达到87.21%,时间为0.017 s,达到了良好的检测效果.  相似文献   

17.
传统人体行为识别基于人工设计特征方法涉及的环节多,具有时间开销大,算法难以整体调优的缺点。以深度视频为研究对象,构建了3维卷积深度神经网络自动学习人体行为的时空特征,使用Softmax分类器进行人体行为的分类识别。实验结果表明,提出的方法能够有效提取人体行为的潜在特征,不但在MSR-Action3D数据集上能够获得与当前最好方法一致的识别效果,在UTKinect-Action3D数据集也能够获得与基准项目相当的识别效果。本方法的优势是不需要人工提取特征,特征提取和分类识别构成一个端到端的完整闭环系统,方法更加简单。同时,研究方法也验证了深度卷积神经网络模型具有良好的泛化性能,使用MSR-Action3D数据集训练的模型直接应用于UTKinect-Action3D数据集上行为的分类识别,同样获得了良好的识别效果。  相似文献   

18.
传统核探测器故障信号诊断研究都需要提前提取信号特征,然后用机器学习、支持向量机、统计方法等对特征进行分类。为了实现对探测器输出信号进行实时识别和故障诊断,本文基于Matlab平台构建了一个用于对图像进行分类的卷积神经网络模型,对核探测器故障信号进行分类诊断。从分类准确率和算法运行时间两个方面对Adam、Sgdm、Rmsprop三种优化算法进行了比较。结果表明Rmsprop算法运行时间最少,但准确度和损失的训练迭代曲线不平稳;Sgdm模型对十组非正常信号图像分类的准确率最高为93.10%,准确度和损失的训练迭代曲线平稳。虽然,本文方法诊断准确率略低于文献报道值,但是不需要对信号进行预处理和特征预提取,使用更为简便。  相似文献   

19.
李梦吉  韩燮 《科学技术与工程》2020,20(13):5235-5239
计算机辅助设计(CAD)模型是一种带有顶点信息和网格信息的三维数据,三维模型数据存储方式常见的有点云、体素、网格模型等是典型的非欧氏空间数据。为了改进现有方法利用深度学习训练CAD模型的分类时,常有丢失局部信息或局部信息提取不足的情况。针对这种非欧氏空间的CAD数据,提出了一个结合CAD数据本身特点的基于图卷积的分类模型。首先通过图卷积网络(GCN)计算顶点的邻接矩阵和顶点的度矩阵。针对CAD模型的特点提出了不同于K近邻(KNN)的方法,直接根据CAD模型面片信息构建计算所需的邻接矩阵。其次,图卷积网络可以聚合邻近顶点的信息,设计通过拼接两层图卷积网络来提取不同尺度的局部特征。结果表明:在ModelNet40 CAD模型数据集上,若采用CAD模型面片信息建图的方法,本文方法为91.2%。而采用KNN建图的方法虽然比PointNet++模型低1%的精确度,比KD-NET模型低0.9%的精确度,但参数量要比PointNet++减少0.54 MB,比KD-NET减少6.54 MB。可见本文模型结合了CAD模型的特点和图卷积聚合邻接顶点提取局部信息的优势,使得分类的精确度相比PointNet++提高0.6%,用更少的模型参数量得到了更高的分类精确度。  相似文献   

20.
为了有效改善现有人脸表情识别模型中存在的信息丢失严重、组件间相对空间联系不密切的问题,提出了一种改进的多尺度卷积神经网络模型,通过构建深层多尺度卷积神经网络,使模型能够挖掘出更多潜在的特征信息;通过特征融合促进信息的流通和重利用,减少池化操作所引起的重要信息丢失,使得模型具有更好的学习能力;通过控制每层多尺度卷积神经网...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号