首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 142 毫秒
1.
为了提高冲击地压危害预测的准确性,基于主成分分析法和随机森林算法,构建了由主成分分析方法优化的随机森林模型,分析静态冲击地压数据并处理异常值,通过数据标准化处理、计算相关系数矩阵及累计方差贡献率,提取出5个主要特征.利用优化的随机森林模型训练冲击地压数据集,使模型参数不断得到优化.以混淆矩阵中的准确率作为评估指标,将优化的随机森林模型与单一随机森林模型进行比较分析.实验结果表明,优化的随机森林模型比单一随机森林模型具备更好的效果,其准确率达到了88.9%,高于单一的随机森林模型,进而得出结论,即优化的随机森林模型能有效地对冲击地压危害进行预测,通过随机森林优化模型,一定程度上有效缩减冲击地压危害预测的时间.  相似文献   

2.
海上风电场的海况数据极其复杂导致用于海浪高度预测的输入参数极其不稳定,筛选出关键信息,提高输入参数的质量可以极大地提高海浪高度预测的准确性。以乐亭菩提岛风电场近一年的海上数据为基础,构建了一种基于随机森林(random forest, RF)、鲸鱼优化算法(whale optimization algorithm, WOA)、变分模态分解(variational mode decomposition, VMD)和双向门控循环单元(bidirectional gated recurrent unit, BiGRU)的海浪预测模型。该模型利用随机森林对环境特征等输入变量进行筛选,有效减少数据冗余,然后基于WOA-VMD模型自适应确定最优参数和自适应分解原始序列,提高数据质量并消除数据噪声的干扰。此外,针对海浪预测提出了一种基于注意力机制优化的BiGRU算法,随机森林的注意力机制将为BiGRU的隐藏层状态分配不同的权重,加强关键信息的影响。实验结果表明该模型和其他模型对比,输入质量更高,预测精度更高,拟合程度更准确,对风电场海浪预测有着重大意义。  相似文献   

3.
为了及时对城市道路拥堵情况进行预测,缓解通行压力、降低能源损耗,通过一种结合Spark与阴阳对优化随机森林的模型预测城市道路交通拥堵情况,利用阴阳对优化算法对随机森林进行参数调优,选取决策树个数和分裂属性个数最优解,以此建立阴阳对优化随机森林(Yin-Yang-pair optimization random forest, YYPORF)城市道路拥堵情况预测模型,并通过Spark实现了YYPORF模型的并行化设计方案。结果表明,基于Spark的YYPORF准确率达到95.58%,较传统随机森林提高了3.17%;加速比达到2.83。可见,所提出的模型预测性能更优,可为大数据背景下城市智能交通管理提供可靠依据。  相似文献   

4.
针对城市公交实时客流数据多样化和特征复杂的状况,提出一种基于S-Catboost模型的客流特征提取及短时客流预测方法和影响因子分析流程。首先,通过爬虫技术获取公交客流数据的环境和时变特征,扩充客流数据的特征维度。其次,通过对客流数据进行时间和精度加权并采用LSTM和随机森林2种基模型对客流数据进行堆叠(Stacking),提取强特征并加入第二层子模型的特征矩阵。最后,利用Catboost算法对类别特征进行数值化处理,得到预测结果。实验结果表明该模型比传统LSTM、随机森林、GBDT以及SVM在预测准确度和计算时间上都有明显的优势,并给出了不同影响因子对客流量的相对贡献度和各自的偏效应,该模型对于公交系统进行实时线网优化调度和线路拥挤度信息发布具有比较高的实用价值。  相似文献   

5.
针对现今传统统计方法难以准确及时的揭示经济参量时空信息且估算GDP精度不足的问题,本文利用国家极轨卫星携带的可见光和近红外成像辐射计(NPP/VIIRS)获取的2012-2018年夜间灯光影像为数据源,对数据产生的误差进行处理得到了可以用来定量分析的长时间序列数据;首先采用随机森林算法对数据集进行预测研究,在此基础上提出一种基于袋外数据估计的回归误差,采用改进的网格搜索算法(Grid Search)对随机森林模型进行参数调优。同时也使用贝叶斯优化(Bayesian Optimization)对随机森林(RF)模型进行参数调优。运用嵌套5F-CV,并通过外部5F-CV循环估算模型的泛化能力,内部5F-CV循环用于确定最佳参数找出最优参数模型,建立自动预测系统,根据输入的研究区数据,使算法模型自动进行精准预测。结果表明基于贝叶斯优化改进的随机森林算法在预测GDP时最好,预测精度达到97%,具有较高的准确率和鲁棒性。研究结果展示了机器学习算法和夜间光照指数用于在县级尺度上预测GDP表现出显著的能力。  相似文献   

6.
近年来,深度学习算法被广泛应用于生成各种类型的数据。本文通过分析测井数据与核磁共振T2谱之间的映射关系,利用随机森林与LSTM网络模型实现了对核磁共振T2谱的重构。核磁共振测井每个深度获得的T2谱是在不同的时间序列中通过不同的布点数来显示形态上的变化的,随机森林算法能够处理高维度的核磁共振T2谱数据且不需要做特征选择,而LSTM可以很好地控制不同深度神经元对T2谱各分布点的影响,将这两种网络模型进行参数优化后对同一口井的预测结果进行对比分析。这里选取了中国海上A油田的测井数据作为例子进行方法测试。首先,利用灰色关联度算法分析T2几何均值与测井曲线的相关性。选取相关性高于设定值的测井曲线,将测井曲线标准化缩放在0~1后作为随机森林与LSTM模型的输入,预测同一地层T2谱形态分布规律并比较算法的优劣。在比较软件处理得到的核磁共振T2谱和预测结果后分析它们之间产生差异的原因。结果显示通过LSTM神经网络模型预测的数据与地层真实数据的符合度比随机森林算法更高,符合度可达90%以上。  相似文献   

7.
将随机森林(Random Forest)回归算法应用于混凝土早期抗裂性研究.以松通项目混凝土为例,基于大量文献和工程经验选取了7个主要影响因素的混凝土早期抗裂性指标体系.以原始数据建立训练样本集和测试集,通过计算基于Bootstrap自助重抽样得到的袋外数据(OOB)的模型误判率,确定随机森林预测模型的最优参数,并对影响因素进行重要性排序,利用Pearson相关性图分析各影响因素相关度,然后建立RF训练模型,输出模型训练集和预测集的预测拟合结果.通过RMSE和R~2值分析模型的预测精度,并将预测结果与BP神经网络和小波神经网络模型对比.结果显示,随机森林预测模型误差最小,精度最高,验证了模型的准确性和可靠性.提出的随机森林预测模型为实现混凝土早期抗裂性预测提供了一种有效的方法.  相似文献   

8.
为了克服传统机器学习算法产量预测模型的缺点,以深度森林算法理论为基础,综合油井相关各项数据,建立了油井产量预测新模型。首先应用KNN最邻近方法和Z-Score标准化方法对油井相关数据进行预处理,利用MDI特征选择方法选择对油井产量影响最大的特征向量,然后将选出的特征向量作为深度森林模型的输入变量,建立深度森林产量预测模型,利用网格化搜索优化模型参数,最后在测试集上运行模型,对模型性能进行评估。研究结果表明,相对于BP神经网络等传统机器学习算法模型,深度森林模型的产量预测精度更高,可以准确预测油井产量,同时相对于深度神经网络等复杂学习算法,该算法参数少、调参及应用简单,为油井产量预测提供了一种新的方法和思路。  相似文献   

9.
教育规模不断扩大,高校在校生人数持续上升,导致学生的能力参差不齐.为了提升教育水平,教师需掌握学生在校期间的学习状态,预测学生期末成绩是教师掌握学生学习状态的重要途径之一.目前的研究工作主要采用传统的机器学习算法进行成绩预测,如随机森林、贝叶斯、深度森林等,但精度不高;也有利用深度学习算法进行预测,但模型缺少可解释性. Lightgbm(Light Gradient Boosting Machine)算法内存消耗低,时间复杂度低,而XGBoost(eXtreme Gradient Boosting)算法精度高.因此,基于提高精度与降低模型内存消耗的策略,将深度森林中的随机森林与极限随机森林模块分别替换为Lightgbm和XGbBoost,提出一种基于Lightgbm和XGBoost算法的优化深度森林算法LIGHT-XDF.在八个数据集上与其他模型进行对比实验,结果表明,LIGHT-XDF算法的综合性能最好.  相似文献   

10.
选择凝灰岩岩屑作为预测对象,对测井数据进行标准化处理,对砂砾岩储层薄片鉴定结果和测井数据进行相关性分析,优选对岩屑敏感的CNL、GR、RT、RI、SP测井参数作为训练学习的对象;分别利用SVM、BP神经网络、CART、BP神经网络-Bagging、CART-Bagging、随机森林等机器学习方法建立岩屑预测模型,对西北缘X723井百口泉组岩屑成分进行预测、对比和分析。结果表明:单个机器学习方法预测效果不佳,而经集成学习方法优化的BP神经网络-Bagging、随机森林取得较好的实验结果,尤其是随机森林的预测效果最好,平均相对误差绝对值为17.17%,证实机器学习方法在本工区预测岩屑成分是有效的,可以进行推广。  相似文献   

11.
以湖北洪湖湿地自然保护区为研究区,采用随机森林算法对研究区内湿地信息提取.以Sentinel-2A遥感影像为数据源提取光谱特征、植被指数、水体指数、红边指数、纹理特征等特征变量,在随机森林算法框架下,对不同特征变量进行特征重要性评估,比较分类后精度并对特征组合进行优选.将基于随机森林算法的分类精度与传统的基于像元的支持向量机分类方法和最大似然分类方法的分类精度相比较,并通过双比例Z检验比较各算法中正确分类像元的比例统计各分类算法之间的分布差异.结果表明: 1) 特征个数为13时,分类精度达到最大,随着特征个数的增多,分类精度呈现波动减小的趋势; 2) 特征变量中蓝光波段重要性得分最高,达到2.85,可见光(B2、B3)与红边指数(IRECI、MCARI)重要性排名靠前,对于提取湖泊湿地信息具有重要意义; 3) 基于特征优选的随机森林方法分类精度优于支持向量机和最大似然法分类后的精度,其总体精度分别高出6.02%和7.57%;经检验, χ2分别达到25.891和38.895,具有显著差异,表明基于特征优选的随机森林算法分类对湿地信息提取发挥重要作用。  相似文献   

12.
【目的】 森林冠层密度与林分年龄、植被生长状况有关,在区域森林净初级生产力遥感估测中,结合森林冠层密度以期提高估测精度。【方法】 以广东省韶关市为研究对象,选用2017年Landsat-8 OLI影像、2017年357块森林资源连续清查固定样地数据为主要信息源,分别采用随机森林、多元线性回归、人工神经网络和K最近邻分类法等4种模型,结合森林冠层密度制图器(FCD)进行区域森林净初级生产力特征变量的选取、参数建模、模型精度评价和森林净初级生产力空间制图。【结果】 特征变量中,红光波段(B4)、归一化植被指数(NDVI)、比值植被指数(RVI)、叶面积指数(LAI)、缨帽变换土壤植被因子、纹理特征和地形特征在森林净初级生产力反演中有重要作用。将森林冠层密度因子加入反演模型后,4种遥感估测模型精度均有大幅度提高。对4种遥感估测模型进行性能比较,随机森林模型精度最高,其次是多元线性回归模型、人工神经网络模型,K-最近邻分类模型精度最低。研究区内森林净初级生产力平均值为10.689 t/(hm2·a),高森林净初级生产力 [≥18 t/(hm2·a)]林分面积仅占研究区的19.61%,主要分布在海拔较高的西北部。【结论】 结合冠层密度进行森林净初级生产力的建模,可有效提高模型估测精度。  相似文献   

13.
对于专利价值的不确定性和影响因素的复杂性,以及评估工作中缺乏可操作性强并且科学高效的评估方法等问题,对价值评估指标体系进行分析,并使用随机森林算法选择最有效的指标集,同时基于DBSCAN(density-based spatial clustering of applications with noise)聚类选择高精度且一致性低的决策树子森林改进传统随机森林算法,使用改进前后的两种随机森林模型在专利数据样本上进行实验并比较。结果表明,改进的随机森林模型提升了传统模型的精度,在专利价值评估中具有一定的作用,总体上比较有效地反映了专利的价值度。  相似文献   

14.
为了快速精确地利用基本物性指标预测湿陷性黄土的湿陷性系数,基于多种数据挖掘方法提出了离散型二项式系数组合预测模型。首先,采用相关系数法和随机森林重要性指数法综合选取模型基本物性指标为饱和度、干密度、液性指数和天然含水量;然后,分别利用多元线性回归、BP神经网络、支持向量机回归(SVR)和随机森林(RF)回归对黄土湿陷性系数进行预测,并将预测结果进行组合,得到4种单一模型、2种传统组合模型和离散型二项式系数组合模型预测结果;最后,利用6种不同精度指标对上述7种预测模型展开精度分析。结果表明:组合预测模型精度整体高于单一预测模型,且提出的离散型二项式系数组合模型各精度指标均为最优,平均相对误差为3.43%。可见提出的离散型二项式系数组合模型可为湿陷性黄土地区的工程设计提供参考。  相似文献   

15.
为了提升传统随机森林算法的分类精度,本文首先对传统随机森林模型中的决策树根据分类性能评价指标AUC值进行降序排列,从中选取出AUC值高的决策树,计算这些决策树之间的相似度并生成相似度矩阵,然后根据相似度矩阵对这些决策树进行聚类,从每一类中选出一棵AUC最大的决策树组成新的随机森林模型,从而达到提升传统随机森林算法分类精度的目的。通过UCI数据集的实验表明,改进后的随机森林算法分类精度上最大提高了2.91%。  相似文献   

16.
基于GF-2的乔木生物量估测模型研究   总被引:1,自引:0,他引:1  
以福建省将乐林场为研究区,使用野外实测样地数据,结合福建省二类调查数据,获取了共192个样地的生物量数据,其中杉木纯林112个,马尾松纯林80个.对覆盖研究区的2景GF-2影像进行预处理,提取光谱信息、植被指数、纹理特征及地形因子,筛选与样地生物量相关性较高的因子作为建模的自变量,采用支持向量机、随机森林及多元逐步回归3种方法分别建立了杉木和马尾松生物量模型.结果表明:支持向量机、随机森林模型拟合效果均比多元逐步回归模型好,其中随机森林模型决定系数R2最高,2种样地的R2分别为0.65和0.72,估计精度也最高,分别为65.28%和76.82%;杉木样地3种模型的均方根误差分别为64.27、48.16和77.03,马尾松样地3种模型的均方根误差分别为54.79、48.18和65.63,其中随机森林模型的最低.在3种模型中,随机森林模型为乔木生物量的最优模型.   相似文献   

17.
 边坡工程是露天煤矿中的重点工程,边坡的稳定性关系着煤矿的安全生产。边坡稳定性预测是边坡防治工作的前提,针对煤矿边坡工程稳定性预测的复杂性,为了快速、有效地判别煤矿边坡稳定性,利用随机森林算法建立煤矿边坡稳定性预测模型。通过选取与煤矿边坡工程密切相关的岩石重度、黏聚力、内摩擦角、边坡角、边坡高度、孔隙水压力6 个指标作为边坡稳定性的影响因素,即为随机森林预测模型的输入,边坡稳定性状态作为随机森林预测模型的输出,通过随机森林算法建立边坡稳定性影响因素与边坡稳定状态之间的非线性关系。利用煤矿实测30 组边坡稳定性数据作为随机森林预测模型的训练数据集,进行模型的学习训练;另用12 组边坡稳定性数据作为预测模型的测试数据,通过训练好的边坡稳定性预测模型进行测试;为了验证随机森林预测模型的准确率,同时与SVM 和BP 神经网络的测试数据进行比较。结果说明,选取煤矿边坡稳定性的6 个指标建立的随机森林预测模型,人工控制参数较少、结构简单、容易实现,且具有较高的准确度,边坡稳定状态预测结果与煤矿边坡工程实际状态相吻合,能有效预测边坡稳定性状态,指导煤矿边坡防治工作的开展。  相似文献   

18.
提出了一种新的大迎角非线性非定常气动力和气动力矩建模方法.传统的依据物理机理分析、实验观测等来建立飞机气动系数与飞行状态之间的建模方法在大迎角非线性非定常气动力和气动力矩建模中存在着局限性,导致模型精度不高,针对这个问题,提出了随机森林建模方法.根据风洞中飞机大迎角俯仰机动的特点,结合随机森林模型的原理,确定了与大迎角随机森林模型相关的输入特征,通过误差分析实验确定了随机森林模型中决策树个数和内部节点随机选择属性个数等关键参数的取值,利用F-18缩比模型在低速风洞中实验数据进行实验,结果表明,与经典的多项式模型相比所建立的随机森林模型得到的预测结果与真实数据之间的误差更小.   相似文献   

19.
针对钛合金弹性模量快速预测的需要,采用合金设计公式对原始合金数据进行转换,利用转换所得的Mo当量、d-电子结合次数和d-电子结合能作为数据集;采用多层感知器、随机森林网络和卷积神经网络三种机器学习方法,基于数据驱动方式搭建钛合金成分与弹性模量的关系模型。结果表明,相比随机森林网络模型和卷积神经网络模型,多层感知器模型具有更优的预测性能和预测精度。此外,多层感知器模型的预测能力符合预期,其相关指数评分达到0.66,均方根误差为7.54 GPa;说明多层感知器适用于医用钛合金的数据挖掘和研发。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号