首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 265 毫秒
1.
结合P2P网贷平台的特点,融合Logistic回归和Tabnet模型,提出一种P2P网贷违约预测方法。采集人人贷平台借贷数据,并对数据进行清洗与加工预处理;通过信息价值法和相关性分析,对众多解释变量进行筛选,以借款状态作为因变量,采用Tabnet神经网络进行训练,根据训练得到的特征重要性选择关键的解释变量;将Tabnet神经网络预测结果作为新的训练数据集,构建Logistic回归模型;将人人贷数据集输入Logistic回归学习与训练,以训练好的Logistic回归用于网贷违约预测。实验结果表明,Tabnet模型的网贷违约平均预测准确率和精确率分别为9958%、9547%,Logistic回归的平均准确率和精确率分别为9872%、9221%,而融合模型的平均准确率和精确率分别为9960%、9672%;在3个测试集上的准确率标准差分别为0001 4、0000 6、0000 5,精确率标准差分别为0034 4、0013 3、0013 2。表明融合Logistic回归与Tabnet的网贷违约预测方法具有Logistic回归模型的可解释性与稳定性,可提高单一模型的预测精确度。  相似文献   

2.
为在保证测量的准确性和高效性的同时,降低软测量方法对数据集的依赖性,提出一种基于可解释神经网络的压缩机功率软测量方法.实验中,在使用泛化性良好的数据集进行训练时,可解释神经网络模型在测试集上的均方根误差为0.009 4,相比反向传播(BP)神经网络模型降低了1.1%.在使用泛化性较差的数据集进行训练时,可解释神经网络模型在测试集上的均方根误差为0.012 8,相比BP神经网络模型降低了79.8%.实验结果表明,基于可解释神经网络的压缩机功率软测量方法不但具有较高的准确率,且在使用泛化性较差的数据集进行训练时,依然能够保持较高的测量性能.  相似文献   

3.
利用最大最小爬山算法构建肺癌患者的预后模型,指导肺癌预后评价。以SEER(surveillance, epidemiology, and end results)数据库中2008年至2014年期间被确诊为肺癌的患者组成数据集,首先利用卡方检验、Logistic回归分析方法对数据集中的变量进行特征选择;然后,在训练集上利用最大最小爬山算法建立肺癌患者的预后模型,并在测试集上对患者进行5年后生存情况预测;最后,选择Logistic回归、人工神经网络、决策树、支持向量机方法和本研究模型在测试集上进行分类实验对比。最终结果显示本研究模型对肺癌患者5年后生存情况的预测准确率高于其他方法。  相似文献   

4.
提出基于极限学习机(ELM)的脉动风速预测新模型.运用自回归滑动平均模型生成脉动风速数据库,并将其分为训练集和测试集.采用ELM对训练集进行学习训练,建立回归模型,从而实现对测试集风速的泛化预测.经与基于粒子群优化(PSO)的混合核函数最小二乘支持向量(PSO-MK-LSSVM)和误差反传神经网络(PSO-BP)对比,验证了ELM模型的有效性.数值结果表明,与PSO-MK-LSSVM和PSO-BP相比,无论在预测精度还是计算速度上,ELM模型都具有显著的优势.  相似文献   

5.
传统地形识别算法,主要建立在人工提取特征和训练分类器的前提上,其通用能力有限且准确度不高,或者需要大量的数据集训练基础,这种方法训练的网络模型参数较大且预测耗时较长,不利于移植到移动端。因此,运用迁移学习思想,提出了一种基于深度迁移网络的地形识别算法。采用轻量级卷积神经网络MobileNetV3,在爬虫获取和自建适量数据集基础上,对神经网络进行迁移学习。首先,采用图像分类数据集ImageNet上的预训练成果,根据预训练模型权重对MobileNetV3网络进行初始化,实现对模型大规模共享参数的迁移;然后,通过在自建数据集GXU-Terrain6上进行新的训练,微调模型参数,进而得到新的分类模型;最后,利用训练好的模型对地形类别进行预测,从而完成识别任务。提出算法在GXU-Terrain6测试集上取得了93.00%的平均预测准确率。实验结果表明,基于深度迁移的地形识别算法运用较少数据,可获得较高的识别准确率,网络实时性好,适合向移动端移植。  相似文献   

6.
针对滚动轴承传统故障诊断方法训练收敛速度慢、识别准确率不高、抗噪性能差等问题,提出 CWT-CNN 的轴承故障诊断模型。通过对滚动轴承振动数据经连续小波变换生成的时频图进行三次垂直方向随机裁剪的方法扩充数据集,之后将其导入到搭建的加入了批量归一化和随机失活的卷积神经网络中进行模型训练,再由训练好的模型实现轴承故障分类。为了测试模型性能,使用凯斯西储大学轴承数据集进行检测,经过实验结果表明:基于提出的方法构建的数据集相比于常规方法,在搭建的卷积神经网络训练中收敛速度更快,训练出的模型性能也更加稳定,最终最高测试准确率为 99.75%,常规方法构建的数据集准确率为99.67%,证明了构建数据集方法的可行性;在原始数据中加入信噪比为6dB高斯白噪声后,通过常规方法构建的数据集测试的最高准确率仍达到了98.67%,展现了基于CWT-CNN的轴承故障诊断模型较强的抗噪能力,证明了所提方法的有效性和可行性。  相似文献   

7.
基于充填钻孔是充填料浆从地表输送到井下采场的咽喉工程,是矿山正常运转的保障,对矿山充填钻孔使用寿命进行预测十分重要,建立支持向量机(SVM)回归预测模型,用训练集对模型进行训练,以验证集预测值的均方误差作为适应度函数,通过遗传算法(GA)对SVM模型参数进行优化选择,应用优化得到的SVM模型对预测集进行预测。以某矿为例,通过GA得到SVM模型最优参数:适应值(均方误差)为0.011 1,惩罚系数C为47.076 8,核函数参数σ为2.263 8。采用优化的SVM模型对预测集充填钻孔寿命进行预测,预测结果的最大预测相对误差为8.6%,平均相对误差为5.2%。对比BP神经网络(最大相对误差为13.6%),优化的SVM模型预测结果更加理想,精度更高。  相似文献   

8.
为给车辆调度优化以及集卡预约系统设计提供重要参考,利用所采集的深圳市某港口的码头闸口数据,建立一种基于数据挖掘的集卡周转时间短时预测方法.首先,通过对码头闸口数据进行分析,获取车辆到达时间分布、任务类型、作业方式等集卡作业特征以及集卡在码头内的周转时间;在此基础上,利用循环神经网络并结合训练集数据,建立集卡作业特征与其周转时间之间的映射关系.其次,为减少随机波动对周转时间预测效果的影响,利用小波分解算法对循环神经网络拟合结果的残差进行高频噪声分离,并通过自回归模型拟合过滤后的低频序列.最后,将拟合后的循环神经网络与自回归模型进行结合,建立一种支持集卡周转时间短时预测的组合模型,并利用测试集数据进行有效性验证.结果 表明,相比单一的循环神经网络,该组合模型可以大幅提升预测精度.  相似文献   

9.
为解决在刑侦领域需要通过脚印信息预测身高的问题,文中提出一种基于深度学习的回归预测算法。该算法首先对原始数据进行预处理来得到适用于深度学习回归模型的数据集,然后根据足迹数据的特性提出了一种由边缘提取和回归预测两个部分组成的新型网络架构FtH-Net(Foot to Height-Net),最后基于预处理得到的数据集和FtH-Net训练得到一个性能良好的预测模型。实验结果表明,相比于传统方法,该方法在保证模型泛化能力的同时大幅度提升了预测的准确率,预测身高2 cm以内的准确率达到了67%。  相似文献   

10.
为了进一步提高三维模型的识别精度,提出了一种基于深度卷积神经网络的三维模型识别方法。将点云数据通过占用网格规范化计算转化为二值3D体素矩阵,通过附加正则化项的随机梯度下降算法提取体素矩阵的特征,再通过共享权重的旋转增强对训练集进行数据增广并以此对模型标签进行预测。实验结果表明,该算法在公开数据集ModelNet40及悉尼城市模型数据集上的识别精度均达到85%左右。与基于同类机器学习的三维模型识别算法相比,在相同训练数据集上该方法网络训练时间短,在相同测试数据集上模型识别准确率高,检索速度快。提出的体素占用网格模型的深度卷积神经网络,可以实现三维点云模型数据集及规范化体素模型数据集的识别和分类工作。  相似文献   

11.
花卉图像类内差异性大和类间相似性高使得花卉图像分类较难.传统花卉分类方法和普通卷积神经网络很难完整地表达花卉图像的特征,故而分类效果不理想.为提高花卉分类准确率,提出改进的InceptionV3网络用于花卉图片的分类.采用迁移学习的方法,将在大规模数据集上训练的InceptionV3网络用于花卉图像数据集的分类,对其中的激活函数进行改进.在通用Oxford flower-102数据集上的实验表明:该模型在花类图像分类任务中比传统方法和普通卷积神经网络分类准确率高,且比未改进的卷积神经网络准确率高,迁移过程准确率达到81.32%,微调过程准确率达到92.85%.  相似文献   

12.
针对江苏省空气质量指数(air quality index, AQI)的预测问题,提出一个将反向(back-propagation, BP)神经网络与ε-支持向量回归机(ε-support vector regression,ε-SVR)算法相结合的SVR-BP回归算法。对训练集采用ε-SVR进行样本筛选组成新的样本集,再采用BP神经网络进行预测。样本集选取的时间跨度为2 a,样本数据为江苏省共98个监测点空气中各成分的含量。分别采用SVR-BP算法、BP神经网络和ε-SVR算法在数据更新频度不同的3个模型下对未来72 h的AQI进行预测。实验结果表明:本研究提出的SVR-BP算法的平均绝对百分误差较ε-SVR算法提升了4%~19%;训练时间比BP神经网络少0.1~2.5 s。SVR-BP算法预测AQI更为高效,在实时训练及样本筛选方面有更广阔的研究前景。  相似文献   

13.
为提高路段短时交通流的预测精度,选取路段平均旅行时间作为预测指标,建立了一种基于极端样度上升(extrem gradient boosting,XGBoost)的短时交通流预测模型。首先通过对交通流数据的分析,在考虑交通流时空特性的基础上,分别构建目标路段时间序列训练集、测试集以及时空序列训练集、测试集,然后基于XGBoost模型以及构建的训练样本集建立时间序列预测模型以及时空序列预测模型,并利用训练好的模型进行预测,最后将模型预测结果与线性回归模型、神经网络模型预测结果进行比较。实验结果表明:基于XGBoost的短时交通流预测模型能够对路段未来时段平均旅行时间进行比较准确的预测,其中时间序列预测模型均方根误差为5. 32,时空序列预测模型均方根误差为4. 82,均低于线性回归模型和神经网络模型,且相比于仅考虑时间因素的短时交通流预测模型,同时考虑时空因素的预测模型得到的误差更低,预测效果更好。  相似文献   

14.
结合交通流的特征, 提出了一种自适应的交通流预测机制。首先根据训练数据特点, 按三相交通流理论对交通状态进行分类, 从每个分类对应的训练数据集内提取相应的最佳邻域。在基于局部线性回归模型的预测中, 根据邻域中数据点所处状态分别选择相应局部模型进行预测, 最终预测结果为各局部模型预测值的加权平均。根 据各模型误差确定当前数据所处状态, 增量加入训练数据集。基于真实交通数据的实验证实该方法能够有效提高预测的准确率。  相似文献   

15.
Caffe是目前广泛应用于计算机视觉处理的深度学习框架之一,支持卷积神经网络的模型训练与预测。本文利用caffe支持的AlexNet卷积神经网络分别基于加载与不加载基础模型两种模式对五类动物图片进行分类学习与训练,发现加载基础模型的网络模型收敛耗时仅2.77 s,测试集准确率接近100%,实用测试准确率达到99%,且训练与测试损失曲线高度重合,但另一模式的网络模型收敛耗时多达68.89 s,测试集准确率仅为95%,实用测试准确率仅94%,且训练与测试损失曲线存在严重分化。图像分类不仅可以对不同物类的图像进行准确分类,同样可以对不同属性、状态或特性的图像进行准确分类。  相似文献   

16.
为提高车辆在换道过程中的行车安全性。提出一种基于BP神经网络与贝叶斯滤波器的换道意图预测方法,通过车道线传感器、方向盘转角传感器和车身CAN总线采集相关表征参数,将其作为BP神经网络输入数据,对驾驶人换道意图进行初步预测,BP神经网络输出结果作为贝叶斯滤波器输入数据,对BP神经网络预测结果作进一步修正。对模型利用真实换道数据进行训练和检测,结果表明此模型的预测准确率达到91.38%,相较于单一的BP神经网络模型,预测准确率提高了6%,并且具有更强的通用性。  相似文献   

17.
机器学习算法在医学肿瘤领域应用广泛,文章针对肺腺癌磨玻璃结节患者,运用Logistic回归、人工神经网络、支持向量机和Ada Boost等4种经典算法,从准确率、灵敏度、特异度、F1值和G值等5个指标进行模型性能的分析和比较,发现4种模型的准确率均高于85%,而临床医师对患者诊断准确率只有78%,并总结出不同模型的特点:BP神经网络的精度最高,具有较强的自我学习能力;支持向量机需要调节参数来优化模型,对小样本训练效果较好;Logistic回归不需要调节参数,但在大样本下训练比较耗时;Ada Boost具有组合多个模型后再做诊断的优良品质,为临床医师提供术前诊断方案.  相似文献   

18.
为了获得水中等质量两爆源同步爆炸时冲击波耦合中心的峰值压力计算模型,利用Autodyn计算得到不同药量和爆距下的峰值压力数据.一方面根据量纲分析确定的函数形式拟合数据从而获得峰值压力的计算公式;另一方面对药量、爆距及峰值压力三类数据进行对数变换和归一化,并将其分为训练集和测试集,然后将训练集代入BP神经网络进行训练,得到结构相对简单、均方误差最小的BP神经网络预测模型.结果表明:公式计算结果和BP神经网络模型计算得到的峰值压力与实际值吻合较好,公式计算值与实际值的平均相对误差为1.08%,BP神经网络预测值与实际值的平均相对误差为0.52%,与公式计算相比,BP神经网络能够以更少的数据样本容量实现更高的精度预测.  相似文献   

19.
电力系统短期负荷预测的多神经网络Boosting集成模型   总被引:4,自引:0,他引:4  
提出了一种改进的多神经网络集成自适应Boosting回归算法.算法中采用相对误差模型代替绝对误差模型,可以更接近于回归预测问题的要求,并在Boosting迭代过程中,在对训练集采样得到新的训练子集的同时,也对校验集采样得到新的校验子集,保证了两者的一致性.进而采用美国加州电力市场的实际数据,建立了由多个神经网络集成的电力系统短期负荷预测模型.预测结果表明,与传统的单网络预测模型相比,Boosting集成预测模型能显著提高模型输出的稳定性,增强网络结构及模型选择的可靠性,获得更高的预测精度.  相似文献   

20.
林泳昌  朱晓姝 《广西科学》2020,27(3):276-283
针对在数据样本不均衡时,K近邻(K-nearest Neighbor,KNN)方法的预测结果会偏向样本数占优类的问题,本文提出了一种基于合成少数类过采样方法(SMOTE)的KNN不均衡样本分类优化方法(KSID)。该方法过程为:首先使用SMOTE方法将不均衡的训练集均衡化,并训练逻辑回归模型;然后使用逻辑回归模型对训练集进行预测,获取预测为正样本的数据,通过使用SMOTE方法均衡化该正样本,并训练KNN模型;最后把测试集放入该结合逻辑回归方法的KNN模型进行预测,得到最终的预测结果。围绕6个不均衡数据集,将KSID与逻辑回归、KNN和支持向量机(SVM)决策树等方法进行对比实验,结果表明,KSID方法在准确率、查全率、查准率、F1值这4个性能指标上均优于其他3种方法。通过引入SMOTE,KSID方法克服了KNN模型遇到样本不均衡数据集时,产生分类偏向的问题,为进一步研究KNN方法的优化和应用提供参考。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号