首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对神经网络训练时收敛慢和模型泛化能力差的问题,文章首先分析传统的和基于深度学习的目标检测算法各自的优势和不足,接着概括梯度下降法各种变体优化算法和现阶段主流数据增强方法对应的优缺点,最后对训练时的优化问题提出组合使用AdaMod和AdamW的训练优化方案,提高了训练网络收敛效率。针对深度神经网络性能表现比较依赖于数据集从而导致泛化能力差的问题,该文使用基于线性插值的数据增强方案,对类别不同的样本之间的领域关系进行建模,增强了神经网络的健壮性。在VOC07+12数据集上实验结果表明EfficientDet-d0检测算法模型参数量、浮点计算量、精度和泛化性能比较均衡,泛化能力得到增强,训练过程收敛更快,验证了该文提出的训练优化方案和使用的数据增强方法是有效的。  相似文献   

2.
使用深度神经网络处理计算机视觉问题时,在新任务数据量较少情况下,往往会采用已在大数据集上训练好的模型权值作为新任务的初始权值进行训练,这种训练方式最终得到的模型泛化能力更好.对此现象,传统解释大多只是基于直觉分析而缺少合理的数学推导.本文将深度神经网络这种网络结构不变下层间的学习转为深度神经网络内部的迁移能力,并将学习过程变化形式化到数学表达式.考虑数据集对训练过程带来的影响,利用信息几何分析方法,确定不同数据集流形之上的度量和联络,实现不同数据集之间的嵌入映射,同时将参数空间的变化也放入流形空间,探究其对学习过程的共同影响,最终实现对这种内部迁移现象的数学解释.经过分析和实验验证可得内部迁移过程其实是一种能使网络可以在更广空间进行最优搜索的变化,有利于模型可以在学习过程中获得相对的更优解.  相似文献   

3.
燃煤电厂煤粉在燃烧过程中产生的有害气体会对大气环境造成污染,NOx为其中之一。针对燃煤电厂生产过程中NOx排放量测量成本高、过程复杂等问题,考虑到机组运行数据具有的时间序列特征,提出一种基于长短期记忆神经网络的软测量方法对NOx排放量进行预测。在分析NOx产生机理的基础上,利用来自陕西省榆林市某电厂2019年1月至6月的实际生产数据,初步选取与NOx排放量紧密相关的20个辅助变量;将数据进行预处理以消除粗大误差和随机误差,并利用灰色关联度分析进一步精选出15个辅助变量;将实际生产数据划分训练集和测试及对LSTM模型进行训练和测试,并将LSTM模型与BP神经网络模型和支持向量机模型的软测量结果比较。结果表明:基于LSTM的测量方法均方误差较基于BP神经网络与SVM的方法均有减小,说明该方法测量准确度较高,泛化能力更强。  相似文献   

4.
日益严峻的网络安全形势和网络协议本身的缺陷,使传统的防火墙防御的方式无法胜任。为提高对网络入侵防御能力,提出了模糊神经网络集成的入侵检测模型:首先抓取网络中的数据流,使用模糊数学的方法对数据记录入侵特征预处理。然后用集成的模糊神经网络模块接收预处理模块导入的训练数据和测试数据,通过反复训练学习,把各子树中节点的权值收敛到确定值。训练完成后,模型用于检测网络中的数据。响应模块接收模糊神经网络模块处理结果做出相应的响应。实验使用KDDCUP99网络入侵检测数据集对模型进行评测,并与单一神经网络模型相比较。结果表明模糊神经网络集成的方法检测结果比较稳定,在整体上比单一神经网络的误报率、漏报率和错报率有所降低,准确率和数据集泛化能力明显提高。  相似文献   

5.
基于RBF人工神经网络的生活污水处理软测量方法   总被引:4,自引:0,他引:4  
为实现城市生活污水处理的在线控制,提出了基于RBF人工神经网络的软测量方法.运用大量实测数据对RBF神经网络进行了训练和仿真.结果表明,基于RBF神经网络的软测量模型对污水处理指标BOD的实时控制具有实用价值.  相似文献   

6.
通过神经网络技术可找出催化工艺与催化性能之间的关联性,从而对催化性能进行预测,达到提高研究效率的目的.本文针对训练样本中奇异样本对神经网络模型预测能力和泛化能力的影响,将遗传算法思想引入神经网络,构建神经网络模型动态训练集,建立了遗传算法-神经网络模型(GARBF);利用GARBF模型对乙炔羰基化合成丙烯酸甲酯催化性能进行预测模拟.结果表明:与RBF相比,GARBF的预测精度明显提高,对于六组测试集,平均相对误差从2.94%降低到1.18%,体现了更强的泛化能力.  相似文献   

7.
针对传统卷积神经网络对远距离视频目标识别效果差的原因,本文提出一种改进的基于SSD卷积网络的视频目标检测模型.首先,对数据集进行剪裁,旋转等预处理,提高网络检测泛化能力,其次,采用coco数据集Mobilenet_SSD预训练模型,由于其具有轻量级网络模型特点,减少计算开销,减少内存占用量.然后,再结合voc2012数据集进行二次训练微调处理,加快训练收敛速度,使用自定义数据集能有效检测特定场景目标,能够有效识别远距离场景下视频目标物体.实验结果表明,改进的网络检测模型适用于远距离目标检测,减少计算量,降低硬件内存资源消耗,提高网络模型性能和检测精确度,具有较好的鲁棒性.  相似文献   

8.
为了提高光伏组件模型的准确度和可靠性,提出一种利用多层感知机和不同工况下实测的Ⅰ-Ⅴ特性曲线数据集的建模新方法.首先,使用双线性插值法对实测Ⅰ-Ⅴ曲线进行重采样,以提高Ⅰ-Ⅴ曲线上数据点分布的均匀性;然后使用基于温度-辐照度的网格采样法对数据集进行下采样,降低数据冗余度.其次,提出一种基于多层感知机神经网络的光伏组件模型,并基于预处理的Ⅰ-Ⅴ曲线数据集,使用Adam算法训练该模型.最后,采用实测Ⅰ-Ⅴ特性曲线数据集,验证和测试了所提出的建模方法,并与支持向量机、梯度提升决策树等机器学习算法进行对比.实验结果证明,所提出的建模方法具有更高的精度和泛化性能.  相似文献   

9.
中国乐器有着丰富的种类,但过去由于缺少数字化的保存形式,在音乐信息检索领域有关它们的研究很少.基于中国音乐学院收集完成的中国乐器数据库,本文旨在找到每种中国乐器各自独有的声音特征,并希望找到泛化能力较强的模型以更好地利用有限的数据集.使用卷积神经网络并以对数Mel声谱图作为输入特征,在所构建的两个子数据集中实现了超过97%的分类准确率,说明所构建的模型能较好地学习到每种乐器的特征.此外,当以较短片段数据集训练的模型来对较长片段的数据集进行分类时,准确率依然高达92.70%,说明模型具有较好的泛化能力.  相似文献   

10.
针对目前水厂应对藻类爆发时混凝剂投加量难以确定的问题,提出一种基于深度学习的藻类混凝去除率预测方法,利用DenseNet卷积神经网络和絮体图像对藻类混凝去除率进行预测,从而对投药量进行调整 . 具体做法是,在实验室条件下对高藻水进行混凝处理,记录混凝处理后的絮体图像和对应的去除率 . 以去除率区间为标签构建絮体图像数据集,利用此数据集对 DenseNet-121模型进行训练 . 结果显示,训练后的模型对测试集的预测准确度达到了 89.5%,与 VGG 和 ResNet模型相比,利用 DenseNet模型对本文建立的数据集进行识别的精确度更高,且在识别去除率在 60%~90% 区间的絮体图像相较于其他两种模型具有明显优势. 同时通过对数据集外的铜绿微囊藻絮体图像进行识别,验证了模型具有良好的泛化性.  相似文献   

11.
近年来,人工智能中的深度学习技术在地震数据处理、反演和解释领域显示出许多优势。以往的研究表明,深度学习与地震反演相结合的方法比传统方法更有效。利用深度学习技术有可能得到更高分辨率的结果,这对油藏开发至关重要。通过设计地质模型进行采样以获取不同大小数据集,基于卷积神经网络(CNN)研究了不同训练数据集的地震反演应用效果,实验表明,该神经网络的预测精度在一定范围内随训练集的增加而增加,得到了对神经网络模型构建的关键数据集大小占全数据集的比例。此外,通过对地震数据加入不同比例的噪声并对CNN进行训练,结果表明本文所设计的CNN具有良好的抗噪和泛化能力。  相似文献   

12.
基于深度神经网络的入侵检测方法   总被引:1,自引:0,他引:1  
为改善传统机器学习技术解决海量网络数据和复杂入侵模式对信息网络的入侵检测的不足,提出一种基于深度神经网络的入侵检测方法.采用神经元映射卷积神经网络(NPCNN)为网络结构,使用较少的连接和参数,具有易于训练和泛化能力强等优点.在训练过程中,使用Re LU激活器作为非线性激活函数,采用Adam算法进行模型学习,从而避免了传统深度网络须进行预训练的过程.在NSL-KDD数据集上的实验结果表明:提出的方法较基于传统机器学习的入侵检测方法具有良好的特征表征学习和分类能力,且随着数据量的增大,模型的分类精度有较大的提升.  相似文献   

13.
针对深度学习在嵌入式或移动端设备中用于故障诊断时,受限于有限的硬件资源而又需要有足够的效率和精度的应用需求,提出基于轻量级卷积神经网络的电机滚动轴承故障诊断方法.首先对滚动轴承的振动信号数据集进行连续小波变换生成固定尺寸的时频图,并以此方式生成数据集输入网络进行训练.使用测试集进行测试,结果表明,所生成的故障诊断预测网络模型具有较高的识别精度和识别速度,准确率达到99%.通过验证噪声对网络的影响,表明所使用的网络具有较好的鲁棒性和泛化能力.  相似文献   

14.
污水处理系统是一个复杂的非线性、大时延的动态系统,由于工艺的复杂性、检测设备的不完备性以及经济成本的限制,一些重要的出水指标无法实现精准的检测。为解决此问题,文中提出了基于集合卡尔曼-Elman网络的软测量方法。传统动态神经网络具有能够处理时延信息数据的动态记忆能力,可用于基于数据驱动的软测量建模过程。但是,常规训练方法容易使神经网络陷入局部最小值,导致模型预测性能欠佳。鉴于此,文中引入集合卡尔曼滤波技术和对偶有限样本集合卡尔曼技术对典型的动态神经网络——Elman神经网络进行无梯度训练,构建新型软传感器模型,不仅有效提高了传统Elman神经网络的预测能力,而且提供了一种简单、无梯度的神经网络训练方法。将该方法在加州大学欧文分校的污水处理数据(UCI数据)上进行验证,结果表明,文中方法具有较好的预测性能,集合卡尔曼滤波技术可作为一种无梯度的替代方法来训练神经网络。  相似文献   

15.
针对传统的神经网络训练算法收敛速度慢和泛化性能低的缺陷,提出一种新的自适应粒子群优化算法用于神经网络的训练.该算法通过改进自适应搜索策略以提高网络泛化性能,并结合Ionosphere雷达信号分类数据集进行仿真测试.研究结果表明:基于自适应粒子群优化算法训练的神经网络在分类准确率和分类误差上明显优于传统的BP算法,且很好地提高了网络泛化能力和优化效果.  相似文献   

16.
为了提高光伏组件模型的准确度和可靠性,本文提出了一种利用多层感知机和不同工况下实测的I-V特性曲线数据集的建模新方法。首先,使用双线性插值法对实测I-V曲线进行重采样,以提高I-V曲线上数据点分布的均匀性;进而使用基于温度-辐照度的网格采样法对数据集进行下采样,降低数据冗余度。其次,提出一种基于多层感知机神经网络的光伏组件模型,并基于预处理的I-V曲线数据集,使用Adam算法训练该模型。最后,采用美国国家可再生能源实验室提供的实测I-V特性曲线数据集,验证和测试了所提出的建模方法,并与支持向量机、梯度提升决策树等机器学习算法进行对比。实验结果证明,所提出的建模方法具有最高的精度和泛化性能。  相似文献   

17.
为了对灾难场景图像进行快速分析和识别,提出了一种基于多分辨率卷积神经网络和残差注意力机制(attention module)相结合的图像分类模型.首先,对灾难场景数据集进行预处理,在相同类型的条件下将其随机划分为训练集和测试集.基于改进的卷积神经网络(convolutional neural network,CNN),提取训练集的图像特征.使用训练集图片的特征进行训练,并且在测试集图片上实现分类测试.选取DenseNet、Xception和MobileNetV2三种模型,以灾难场景数据集(Disaster_Data_Scenes)为数据集进行实验验证.结果表明:改进的Xception和MobileNetV2网络在灾难场景数据集上进行的图像分类实验测试,比原网络精度分别提升了4.56%和3.04%.其中改进的DenseNet网络比原网络模型精度分别提升9.13%、17.88%和10.27%.可见改进的卷积神经网络模型的分类精度得到有效提高.  相似文献   

18.
在智能驾驶环境的车辆轨迹预测环节,为更好地获取环境车辆的轨迹时序特征,在长短期记忆神经网络(LSTM)基础上,嵌入Dropout层以增强网络泛化性,引入注意力机制予以预测效果影响较大的时序数据更大权重从而提高预测结果的可靠性,且将改进的LSTM模型与门控循环单元GRU模型结合,构建LSTM-GRU预测模型以进一步提升环境车辆轨迹预测的准确性.在此基础上,使用NGSIM公开数据集对模型进行训练、验证和测试.研究结果表明,融合了Dropout和注意力机制的LSTM-GRU神经网络轨迹预测模型相较标准的LSTM长短期记忆网络以及GRU门控循环单元,在预测较长时序的车辆轨迹上具有优势,提高了轨迹预测的准确性,降低了实际轨迹和预测轨迹之间的均方根误差和平均绝对误差.  相似文献   

19.
Matlab神经网络工具箱及其在软测量建模中的应用   总被引:4,自引:0,他引:4  
介绍了Matlab神经网络工具箱的一些重要内容,包括数据预处理、训练算法比较、网络泛化能力等.结合一个工业实例阐述了其在软测量建模中的应用,最后通过仿真分析了建模效果.结果表明,利用Matlab神经网络工具箱进行软测量建模研究是行之有效的.  相似文献   

20.
农产品的价格预测对指导农业生产、调节市场消费供给有重要意义。首先提出规范产品名称、简化类别与统一单位等数据规范化原则,再采用滚动交叉验证的方法将规范化处理后的数据划分为训练集与验证集。针对基于回归分析的传统预测模型存在准确度和效率均偏低的问题,研究使用泛化能力较强的门控循环单元(gated recurrent unit, GRU)神经网络来构建价格预测模型,根据对比与消融实验调整模型的超参数与优化器,通过Dropout方法对模型进行优化。实验结果表明,最佳模型误差度为0.043 5,耗时为10.8 min,在准确度和效率方面达到既定研究目标。该模型普适性较强,对于具有时序性的其他农产品数据也具有良好预测效果,可将模型增加查询接口并集成到相关WEB系统中。研究的实验方法与模型参数也可作为其他神经网络在价格预测方面研究的参考。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号