共查询到17条相似文献,搜索用时 78 毫秒
1.
《西安交通大学学报》2021,(1)
为了减少跟踪网络中存在的参数量和计算量大的问题,提出了基于深度可分离卷积的剪枝方法。深度可分离卷积将跟踪网络中的传统卷积层分解为逐点卷积和逐层卷积两部分。在逐点卷积中,通过逐点卷积层中权重的大小来评估输入特征图通道在线性组合中的重要程度,将较小的权重及其关联的特征通道裁减掉。在逐层卷积中,通过K-L散度来衡量逐层卷积中滤波器的相似性,将相似的滤波器裁剪掉,减少冗余。通过上述方法进行多轮迭代剪枝,从而减少跟踪网络的参数量和计算量。在VOT数据集上的实验结果表明,在精度没有下降的前提下,剪枝后网络的参数量下降了22.54%,计算量下降了17.8%。在NVIDIA TX2设备上的实验结果表明,剪枝后网络的跟踪速度在CPU上提升了14.95%,在GPU上提升了13.07%。 相似文献
2.
为解决精细车型识别中特征不具有代表性,且识别准确率低的问题,提出了基于多尺度跃层卷积神经网络(CNN)的车型识别方法。通过多个不同尺度的跃层卷积神经网络,提取适用于精细车型识别的低层局部特征和高层全局特征,并分别训练Softmax分类器。利用自适应方式融合方法,将多个单一尺度跃层卷积神经网络的识别结果进行融合,调整不同网络对识别结果的贡献。实验中车型识别准确率达到97.59%。实验结果表明多尺度跃层卷积神经网络适用于精细的车型识别,并能提高识别的准确率。 相似文献
3.
面部微表情具有持续时间短、强度低等特点,因此微表情识别的准确率较低,且当前提出的基于深度学习的微表情识别方法难以理解网络模型的决策原因,以至于难以应用于实际.针对该问题提出一种基于残差单元的可解释时空卷积网络用于微表情识别的方法,该方法通过使用时空卷积网络,将微表情视频帧序列作为输入,并解释网络模型参数与特征,在实现模型可解释性的同时,提高了微表情识别的准确率.在CASME2、SMIC和SAMM数据集上对提出方法进行验证,实验结果表明,本文方法优于目前大部分基于深度学习的微表情识别方法. 相似文献
4.
在复杂交通场景中,公安和交管部门对车型识别的实时性和精度提出了更高要求。针对当前假牌、套牌、无牌车辆处理占用大量警力、检索效率低下、非智能化等一系列问题,提出了一种基于GoogleNet深度卷积神经网络的车型精细识别方法,设计了合理的卷积神经网络滤波器大小和数目,优选了激活函数和车型识别分类器,构建了一个新的卷积神经网络轿车车型精细识别模型框架。实验结果表明,在车型精细识别测试中,所提出模型的识别率达到了97%,较原始GoogleNet模型有较大提升,而且,新模型有效地减少了训练参数的数量,降低了模型的存储空间。车型精细识别技术可应用于智能交通管理领域,具有重要的理论研究价值与实践意义。 相似文献
5.
为解决立体匹配网络模型轻量化与高精度不能共存的问题,本文提出新的立体匹配算法CSA-Net。算法具体是在特征提取阶段,利用类ResNet进行特征提取,训练空洞金字塔池化(ASPP)模块扩大感受野,提取多尺度上下文信息,加入联合注意力机制(CSM),在空间和通道维度提高表征能力,关注重要特征并抑制不必要的特征。在特征融合阶段,将2D深度可分离卷积提升到3D来代替原网络中标准3D卷积在空间维度和通道维度分别进行卷积运算,以降低特征融合网络的参数量与模型运行时间。最终实验表明,本文所提出的立体匹配网络模型在KITTI 2012和2015数据集进行验证,在三像素匹配误差率为1.44%和2.24%,模型运行时间减少近1/3。因此,相比于其他实现了更高的匹配精度和更快的运行速度。 相似文献
6.
在汉越神经机器翻译中,由于汉越平行语料稀少,使得数据稀疏问题十分严重,极大地影响了模型的翻译效果.为了提升数据稀疏情况下的汉越神经机器翻译性能,提出一种基于深度可分离卷积的汉越神经机器翻译方法.该方法根据越南语的语言特点,将越南语切分为词、音节、字符、子词4种不同的粒度并利用深度可分离卷积改进神经机器翻译模型,通过增加深度可分离卷积神经网络,对模型输入的不同粒度序列进行卷积运算,提取更多的特征数据,相比传统卷积降低了模型的理论计算量.实验结果表明,该方法在越南语4种不同翻译粒度上均取得最佳效果,一定程度上提升了汉越神经机器翻译性能. 相似文献
7.
针对传统深度卷积神经网络分类精度不佳,参数量巨大,难以在内存受限的设备上进行部署的问题,本文提出了一种多尺度并行融合的轻量级卷积神经网络架构PL-Net。首先,将上层输出特征图分别送入两种不同尺度的深度可分离卷积层;然后对并行输出特征信息进行交叉融合,并加入残差学习,设计了一种并行轻量型模块PL-Module;同时,为了更好地提取特征信息,利用尺度降维卷积模块SR-Module来替换传统池化层;最后将上述两个模块相互堆叠构建轻量级网络。在CIFAR10、Caltech256和101_food数据集上进行训练与测试,结果表明:与同等规模的传统CNN、MobileNet-V2网络及SqueezeNet网络相比,PL-Net在减少网络参数的同时,提升了网络的分类精度,适合在内存受限的设备上进行部署。 相似文献
8.
传统人体行为识别基于人工设计特征方法涉及的环节多,具有时间开销大,算法难以整体调优的缺点。以深度视频为研究对象,构建了3维卷积深度神经网络自动学习人体行为的时空特征,使用Softmax分类器进行人体行为的分类识别。实验结果表明,提出的方法能够有效提取人体行为的潜在特征,不但在MSR-Action3D数据集上能够获得与当前最好方法一致的识别效果,在UTKinect-Action3D数据集也能够获得与基准项目相当的识别效果。本方法的优势是不需要人工提取特征,特征提取和分类识别构成一个端到端的完整闭环系统,方法更加简单。同时,研究方法也验证了深度卷积神经网络模型具有良好的泛化性能,使用MSR-Action3D数据集训练的模型直接应用于UTKinect-Action3D数据集上行为的分类识别,同样获得了良好的识别效果。 相似文献
9.
为解决EEG自动检测的错误率非常高的问题,提出了一种基于深层卷积神经网络(CNN)对脑电图进行异常检测的方法:首先,对多个异构数据源按标准进行重构和预处理,生成了有118 716个样本的训练集和有12 022个样本的测试集;然后,构建有快捷连接的深层CNN模型,以自动化学习ECG特征并进行分类识别;接着,将模型在训练集上进行试验与调参,保存了性能最好的模型参数;最后,在测试集上进行预测.预测结果显示该模型达到了94.33%的分类准确率.通过所提方法对脑电信号进行处理与分析,能够自动提取EEG特征并进行异常识别,从而达到快速检测与辅助诊疗的目的. 相似文献
10.
针对嵌入式设备内存小及多分类准确率低等导致驾驶员检测问题,提出经过深度可分离卷积网络改进而成的,快速下采样网络(fast downsampling network,MF-Net)驾驶状态识别系统.即将快速下采样策略应用于深度可分离卷积网络,在12层内执行32倍下采样,以有效降低计算成本、增加信息容量并实现性能改进.实验结果表明:与VGG(visual geometry group)和ResNet 50等其他卷积神经网络(CNN)模型相比,所提出的MF-Net模型深度可分离卷积大大减少参数量,快速下采样方案的运用增加了网络的信息容量,不仅模型较小且在驾驶员状态分类方面能够表现出更好的性能.同时,信息容量的增加可以对更多信息进行编码,加深对图像内容的理解,有利于之后的嵌入式系统移植. 相似文献
11.
针对卷积神经网络(CNN)在交通标志识别过程中出现的梯度弥散而引起的识别率低的问题,给出了基于改进CNN结构的交通标志识别方法.实验结果表明:该方法能够有效提高识别精度,防止梯度弥散. 相似文献
12.
传统人脸识别方法手工设计特征过程复杂、识别率较低,对于开集人脸识别通用深度学习分类模型特征判别能力较弱。针对这两方面的不足,提出了一种以分类损失与中心损失相结合作为模型训练监督信号的深度卷积神经网络。首先,利用构建的应用场景数据集优调从公共数据集获得初始化参数的深度人脸识别模型,解决训练数据过小和数据分布差异问题,同时提高模型训练速度;然后,以传统损失函数和新的中心损失作为迁移学习过程中的监督信号,使得类内聚合、类间分散,提高模型输出人脸特征的判别能力;最后,对人脸特征进行主成分分析,进一步去除冗余特征,降低特征复杂度,提高人脸识别准确率。实验结果表明,与传统人脸识别算法相比该算法可以自动进行特征提取,并且相对于通用深度学习分类模型该算法通过度量学习使特征表示更具判别力。在自建测试集和LFW、YouTube Faces标准测试集上都取得了较高的识别率。 相似文献
13.
局部放电(partial discharge, PD)信号的检测能够为电力系统提供绝缘缺陷诊断和运行状态评估。现有的局部放电类型识别算法难以有效识别相似度较高的绝缘缺陷,限制了其应用范围。为此,提出一种基于PRPD(phase resolved partial discharge)图谱多特征融合的局部放电类型识别算法。该算法利用卷积神经网络(convolutional neural network, CNN)提取局部放电PRPD图谱图像特征,将图像特征与PD信号统计特征进行有效融合,利用融合特征识别局部放电类型。在实验室环境下建立了4种局部放电模型,并进行了模拟对比实验。实验结果表明,相比传统的支持向量机(support vector machine, SVM)和反向传播神经网络(back propagation neural network, BPNN)算法,所提出方法的正确识别率分别提高了12.82%和19.70%,对相似度较高的缺陷类型也能进行有效识别,算法具有较好的鲁棒性。 相似文献
14.
针对卷积神经网络特征提取不够充分且识别率低等问题,提出了一种多特征融合卷积神经网络的人脸表情识别方法。首先,为了增加网络的宽度和深度,在网络中引入Inception结构来提取特征的多样性;然后,将提取到的高层次特征与低层次特征进行融合,利用池化层的特征,将融合后的特征送入全连接层,对其特征进行融合处理来增加网络的非线性表达,使网络学习到的特征更加丰富;最后,输出层经过Softmax分类器对表情进行分类,在公开数据集FER2013和CK+上进行实验,并且对实验结果进行分析。实验结果表明:改进后的网络结构在FER2013和CK+数据集的面部表情上,识别率分别提高了0.06%和2.25%。所提方法在人脸表情识别中对卷积神经网络设置和参数配置方面具有参考价值。 相似文献
15.
为了解决语音识别中由网络加深导致的低层特征消失、参数量大及网络训练困难的问题,基于Inception V3网络的非对称卷积思想,提出了一种改进的密集连接卷积神经网络(densely connected convolutional neural networks, DenseNet)模型。根据语音识别的长时相关性,通过密集连接块建立起不同层之间的连接关系,从而保存低层特征、加强特征传播;为了得到尺度更丰富的声学特征,将卷积核的范围进行扩大;利用非对称卷积思想分解卷积核,以减少参数量。实验结果表明,相较经典深度残差卷积神经网络模型和原始DenseNet模型,提出的模型在THCHS30数据集上的语音识别性能更好,在保证识别率的情况下,还减少了网络参数量,提高了模型训练效率。 相似文献
16.
Faster-RCNN的车型识别分析 总被引:3,自引:0,他引:3
车型识别是目标检测领域在智能交通的重要应用,也是近年来国内外学者的研究热点之一。针对已有车辆检测方法缺乏识别车型能力的问题,提出了基于Faster-RCNN目标检测模型与ZF、VGG-16以及ResNet-101 3种卷积神经网络分别结合的策略,实验对比了该策略中的3种结合模型方案在BIT-Vehicle和CompCars2种大型车型数据库的车型识别能力。在BIT-Vehicle数据集上,基于Faster-RCNN与ResNet-101结合模型方案的车型识别率高与其余2种结合模型方案,其车型识别率高达91.3%;在迁移测试CompCars数据集上,3种结合模型方案均展现了很好的泛化能力。 相似文献
17.
为了进一步提高三维模型的识别精度,提出了一种基于深度卷积神经网络的三维模型识别方法。将点云数据通过占用网格规范化计算转化为二值3D体素矩阵,通过附加正则化项的随机梯度下降算法提取体素矩阵的特征,再通过共享权重的旋转增强对训练集进行数据增广并以此对模型标签进行预测。实验结果表明,该算法在公开数据集ModelNet40及悉尼城市模型数据集上的识别精度均达到85%左右。与基于同类机器学习的三维模型识别算法相比,在相同训练数据集上该方法网络训练时间短,在相同测试数据集上模型识别准确率高,检索速度快。提出的体素占用网格模型的深度卷积神经网络,可以实现三维点云模型数据集及规范化体素模型数据集的识别和分类工作。 相似文献