首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
深度学习通过建立深层神经网络来模拟人脑进行分析、学习和解释数据,被广泛用于图像识别领域.首先,简述了深度学习在图像识别中的研究现状;其次,介绍了卷积神经网络、深度置信网络、循环神经网络和生成对抗网络等几种常用于图像识别领域的深度学习网络模型;然后,从人脸识别、动作识别、跌倒检测等方面,论述了深度学习在图像识别领域的典型应用;最后,探讨了该领域的研究难点及发展前景.深度学习可以从不同的图像中自动提取相似的特征并进行分类,识别率高,鲁棒性强,推动了人工智能背景下图像识别的发展.无监督学习、对抗网络等将成为深度学习领域的热点.  相似文献   

2.
将深度学习的图像识别应用到工业生产中是一个重要的应用方向.相比传统图像处理,深度学习在图像识别中具有高识别率、抗干扰性强等特点.首先采用小波变换对图像去噪、归一化,然后利用多层卷积对图像进行特征提取并采用全连接层和softmax分类器进行分类实现图像识别.在铝厂工业自动浇注过程中,对已经浇注完成和未完成的图像进行识别、解决传统图像处理在工业生产中多干扰、亮度不足的情况下难以识别的问题.实验结果表明,采用小波变换与深度学习融合对图像进行识别的识别率可达到91. 88%,基本能满足铝厂工业生产的需要.  相似文献   

3.
本文提出了一种基于深度学习模型压缩的竹种分类方法,旨在将压缩后的模型移植到手机端进行竹种自动分类.首先动态设置阈值删除已经训练的竹种分类模型中不重要权重,迭代剪枝与再训练同时进行.再通过K-Means++聚类算法对神经网络各层的权值聚类,从而实现权值共享,最后再经过量化模型的参数值压缩神经网络模型.实验结果表明:剪枝后的模型相较剪枝前的模型内存占用降低了46.4%.剪枝后模型进行量化后模型压缩了75%.压缩后的模型整体运行速度提升,其中基于AlexNet网络结构相较于VGGNet-16的竹种分类模型压缩后可更好应用到移动端,为离线状态下基于移动端进行分类提供支撑.  相似文献   

4.
识别砂岩中的石英、长石和岩屑对判断沉积环境具有重要意义,但传统的人工识别方法存在主观性强、对经验依赖程度高等问题。本文利用深度学习、卷积神经网络等技术构建了一种基于Faster R-CNN目标检测算法的砂岩显微组分图像识别方法,实现了正交偏光下对薄片图像中石英、长石、岩屑三种组分的智能识别,三种组分平均识别准确率为89.28%。为了验证模型的可靠性,实验对比了不同算法和特征提取网络,结果表明:Faster R-CNN目标检测算法的识别效果优于YOLO V3、YOLO V4、YOLO V5s,ResNet50特征提取网络的表现效果优于VGG16。采用ResNet50特征提取网络的Faster R-CNN目标检测模型优势显著,它可以更好满足岩石薄片的识别要求,为传统的人工方法提供智能化技术方案。  相似文献   

5.
将卷积神经网络模型中某一层的所有滤波器抽象到一个欧几里德空间,对其中能被其他滤波器共同表示的滤波器剪枝,降低滤波器冗余,避免精度损失.使用强化学习进行边训练边剪枝,经过微调恢复神经网络模型性能.结果表明:剪枝并微调后的神经网络模型精度损失较小,参数量与浮点计算量显著减少.  相似文献   

6.
卷积神经网络在图像识别的应用中,有大量的冗余参数,增大了计算量,降低了网络运行速度.针对这个问题,提出了一种混合多阈值的稀疏化训练剪枝算法,通过稀疏化训练和混合全局与局部阈值的剪枝算法,压缩了神经网络的模型.通过对缩放因子L1正则化,使重要性低的通道值接近0,进行稀疏化训练,再引入全局阈值和局部阈值剪枝掉接近于零的通道...  相似文献   

7.
肺结节作为肺癌早期诊断的重要特征,对其识别和类型判断具有重要意义.目前使用迁移学习的识别算法存在着源数据集与目标数据集差距过大问题,对于肺结节特征提取不足,导致效果不佳.故此提出了基于卷积神经网络的改进神经网络模型.将预训练的GooLeNet Inception V3网络与设计的特征融合层结合,提高网络对特征的提取能力;为确定最佳组合方式,对各组以准确率为标准进行测试.实验在LUNA16肺结节数据集上进行.进行分组测试结果表明,改进的网络准确率达88.80%,敏感度达87.15%.在识别准确率和敏感性指标上,与GooLeNet Inception V3算法相比,分别提高了2.72,2.19个百分点.在不同数据集比例下进行实验,同样达到了更优的效果,具有更好的泛化能力.可以给临床诊断提供相对客观的指标依据.  相似文献   

8.
本文介绍了基于深度学习的图像识别算法,包括R-CNN、SPP-Net、Fast R-CNN、Faster R-CNN、YOLO以及SDD算法,讨论了深度学习在人脸识别、车牌识别和医学图像识别方面的应用,最后对深度学习图像识别技术的研究提出了问题与展望。  相似文献   

9.
旅行商问题(Traveling Salesman Problem,TSP)是组合最优化问题(Combinatorial Optimization Problem,COP)中的经典问题,多年以来一直被反复研究.近年来深度强化学习(Deep Reinforcement Learning,DRL)在无人驾驶、工业自动化、游戏等领域的广泛应用,显示了强大的决策力和学习能力.结合DRL和图注意力模型,通过最小化路径长度求解TSP问题.改进REINFORCE算法,训练行为网络参数,可以有效地减小方差,防止局部最优;在编码结构中采用位置编码(Positional Encoding,PE),使多重的初始节点在嵌入的过程中满足平移不变性,可以增强模型的稳定性;进一步结合图神经网络(Graph Neural Network,GNN)和Transformer架构,首次将GNN聚合操作处理应用到Transformer的解码阶段,有效捕捉图上的拓扑结构及点与点之间的潜在关系.实验结果显示,模型在100-TSP问题上的优化效果超越了目前基于DRL的方法和部分传统算法.  相似文献   

10.
提出了多层级特征融合模型,该模型利用深度学习网络提取行人图像的全局特征和局部特征,并将全局和局部特征联合起来,以生成更具辨识度的描述符.在模型中,基于部分的多层级网络用于提取不同网络深度的局部特征,从而将网络底层到高层中提取的局部特征组合起来.全局—局部网络分支则提取网络深层的局部特征和全局特征,用于识别行人.该模型在三个数据集上进行了实验并得到了更好的结果.  相似文献   

11.
近年来,深度神经网络模型在各种应用领域都取得了巨大的成功,训练先进的深度神经网络模型仍需要大规模的数据集、高昂的算力成本和优异的算法思想,生成的深度神经网络模型成为一种宝贵的资源,也是完成人工智能应用领域某项特定任务的核心算法。因此,深度神经网络模型的安全则变得极其重要,利用数字水印版权保护技术保障模型的安全已经成为人工智能安全领域一个重要的研究方向。为了综述深度神经网络模型数字水印版权保护技术的最新研究进展,首先介绍了深度神经网络模型数字水印技术分类;其次介绍了深度神经网络模型数字水印版权保护技术基础概况;再次归纳总结了深度神经网络模型数字水印版权保护技术的研究方法;最后总结并展望了深度神经网络模型数字水印版权保护领域的研究重点和发展方向。  相似文献   

12.
在影像学报告的生成中,由于正常区域和异常区域的数据不平衡,描述疾病的关键词经常被描述图像正常区域的句子掩盖,导致异常图像特征的误判和漏判,严重影响医疗报告的质量。本研究提出混合特征提取无卷积深度学习模型,首次将Swin Transformer引入放射学报告中,设计了一个混合特征提取器,以提取更加细粒度的图像特征,准确地捕捉生成影像学报告所需要的异常特征;设计一个名为视觉-语义协同注意力的注意力机制,在生成报告时突出图像重点特征信息,对非关键信息进行过滤,有效提升生成异常报告的质量;使用具有记忆机制的解码器模块生成影像学报告。最后,在流行的影像学报告IU X-Ray数据集上与当前的主流模型进行对比表明,本模型在语言生成指标和临床评估方面都达到较理想的效果。  相似文献   

13.
SAR-BagNet模型是一种应用于合成孔径雷达(SAR)图像识别的可解释深度学习模型。为了使SAR-BagNet模型在具有可解释性的同时具有较高的识别精度,以SAR-BagNet模型为基础,在模型框架中加入了空间注意力和坐标注意力机制,并在MSTAR实测数据集上进行了实验。实验结果表明,空间注意力和坐标注意力机制增强了SAR-BagNet模型的全局信息获取能力,能够在不降低其可解释性的基础上,有效提高模型的识别精度和决策合理性。  相似文献   

14.
传统的纹理图像识别方法主要对底层的视觉特征进行检测,从而导致对高层语义特征的识别能力不足.为了解决上述问题,提出一种基于深度学习的纹理图像语义特征识别方法.该方法首先把在ImageNet数据集上预先训练的模型作为骨干网络构建模型,然后对输入的纹理图像进行数据增强和预处理,并输入模型进行训练和验证,最后利用训练获得的最佳...  相似文献   

15.
使用计算机进行面部表情识别是当前人脸面部表情识别的热点,在深度学习技术的基础上,应用级联分类器对面部进行整体检测和分区定位后,提出并使用了一种基于自注意力机制的深度卷积神经网络,模型采用Mini-Xception为基本网络融合了注意力机制,再通过训练卷积神经网络构建表情分类模型,最后实现较为快速准确的表情识别。文中采用几种方法进行实验对比,并对最终的实验结果加以分析。结果表明,在相同的参数设置下提出的方法能明显提高分类性能、识别的精准度以及面部表情变化检测的实时速度。  相似文献   

16.
针对碳酸盐岩微相分析受人工鉴定经验性和主观性影响,使得传统方法难以准确、客观判识颗粒类型等问题。由此,本文作者提出一种基于深度学习的碳酸盐岩颗粒显微图像识别方法,并以ResNet50为基础网络框架,通过制作数据集、训练模型、预测分类等步骤,设计了一个碳酸盐岩主要颗粒类型自动分类识别模型。利用该模型对生物碎屑、内碎屑、包粒、球粒和团块5种颗粒进行分类识别,再采用混淆矩阵进行评价,结果显示识别准确率达到95%。不仅为碳酸盐岩微相分析提供了新方法,也为深度学习应用于实际碳酸盐岩颗粒分类识别提供了可行性论证,具有一定的实用价值。  相似文献   

17.
提出一种基于翻译日志的统计机器翻译模型的剪枝方法。该方法利用翻译规则在翻译日志中的命中频数对机器翻译规则进行过滤, 保留当前机器翻译模型所需的最小规则表。实验表明, 该方法能够在仅保留原有模型1%~3%翻译规则的前提下达到原有模型的翻译效果。  相似文献   

18.
基于深度学习模型的图像质量评价方法   总被引:1,自引:0,他引:1  
为了有效提取与视觉感知质量高度相关的图像特征,改进图像质量评价方法,在深度学习的框架下,提出一个全新的卷积神经网络IQF-CNN结构,能自动学习判别性更强的图像质量特征,并利用学习的特征进行图像质量评价.同时,该算法采用局部亮度系数归一化、dropout等技术进一步提高网络学习能力.实验结果表明:该算法能较准确地评估五种常用的图像失真,尤其在JPEG压缩、JPEG2000压缩和高斯模糊图像失真上与人眼主观感知质量具有很高的一致性,整体性能比较优于其他经典评价方法.  相似文献   

19.
在深度学习中,随着神经网络层数的加深,训练网络变得越来越困难,现有的浅层的网络无法明显提升网络的识别效果。针对在原有网络的情况下提升网络识别效果,减少参数的问题,本文提出一种改进的DenseNet网络模型,借鉴Inception V3的思想,利用非对称卷积将DenseNet网络中Dense Block层所包含的3×3卷积分解成3×1和1×3的两个卷积,简化网络结构模型。之后再对改进前与改进后的网络模型在数据集上进行训练,实验结果表明,与经典的DenseNet网络模型相比,改进后的网络模型可以提高图像识别的准确性,降低参数,有效地缩短运行时间。  相似文献   

20.
为了减少跟踪网络中存在的参数量和计算量大的问题,提出了基于深度可分离卷积的剪枝方法。深度可分离卷积将跟踪网络中的传统卷积层分解为逐点卷积和逐层卷积两部分。在逐点卷积中,通过逐点卷积层中权重的大小来评估输入特征图通道在线性组合中的重要程度,将较小的权重及其关联的特征通道裁减掉。在逐层卷积中,通过K-L散度来衡量逐层卷积中滤波器的相似性,将相似的滤波器裁剪掉,减少冗余。通过上述方法进行多轮迭代剪枝,从而减少跟踪网络的参数量和计算量。在VOT数据集上的实验结果表明,在精度没有下降的前提下,剪枝后网络的参数量下降了22.54%,计算量下降了17.8%。在NVIDIA TX2设备上的实验结果表明,剪枝后网络的跟踪速度在CPU上提升了14.95%,在GPU上提升了13.07%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号