首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
利用随机森林算法,基于历史地面实况观测数据,构建随机森林1~6 h风场预报模型,并用2018年的地面实况观测数据对预报模型进行检验分析.结果 表明,随机森林算法在风场预报中有较好的泛化能力,对地面10m风场有较好的预报水平,在1~6 h的预报中,预报风场与实况风场比较接近,各预报时效风速的年平均绝对误差为1.0 m/s...  相似文献   

2.
研究了一类随机时变森林发展系统,考虑了外部环境对系统的影响.对随机森林发展系统的解以及数值解的均方指数稳定性进行了讨论,并给出了解决此类问题的方法与步骤.根据Euler方法,构造了系统的数值解,利用等距法得到了数值解均方指数稳定的充分必要条件.所得结论是对已有结论的推广和完善.  相似文献   

3.
数值预报产品的误差订正方法   总被引:1,自引:0,他引:1  
提出了一种基于统计学的数值预报产品误差订正的新方法,该方法根据模式前几个预报时次的误差计算出后面预报时次的误差,通过订正进一步提高了数值预报产品的精度,从而使其能够在日常天气预报中起到更好的作用.为了验证该方法的订正效果,设计了基于T213数值预报产品的订正方案并进行了试验.结果表明,订正方案稳定可靠,订正效果显著,明显减小了各时次的预报误差.另外,该订正方法计算量小,对计算机设备要求不高,便于在各级气象台站推广使用.  相似文献   

4.
引入了一种能较好容忍噪声,且稳定性较高的组合分类器算法———随机森林(RF),建立企业信用评估模型;着重分析了适合RF的不平衡分类问题的处理方法,并介绍了模型参数的优化.通过与神经网络和支持向量机的对比实验,证实了该方法的有效性和优越性.  相似文献   

5.
基于随机森林的文本分类模型研究   总被引:1,自引:1,他引:1  
随着WWW的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术.随机森林模型是决策树的集成,并且由一随机向量决定决策树的构造. 当森林中决策树的数目增大,随机森林的泛化误差将趋向一个上界.将随机森林模型应用于文本分类,在Reuter21578数据集上的实验表明,分类效果比较好,性能比较稳定,将其同C4.5, KNN, SM0, SVM 4种典型的文本分类器进行了比较,结果显示它的分类性能胜于C4.5,同KNN, SMO和SVM方法相当.  相似文献   

6.
基于随机森林的文本分类模型研究   总被引:3,自引:0,他引:3  
随着WWW的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术.随机森林模型是决策树的集成,并且由一随机向量决定决策树的构造.当森林中的决策树的数目增大,随机森林的泛化误差将趋向一个上界.将随机森林模型应用于文本分类,在Reuter21578数据集上的实验表明,分类效果比较好,性能比较稳定,将共同C4.5,KNN,SM0,SVM4种典型的文本分类器进行了比较,结果显示它的分类性能胜于CA.5,同KNN,SMO和SVM方法相当.  相似文献   

7.
8.
数值预报产品的历史相似订正方法研究   总被引:1,自引:0,他引:1  
针对数值预报存在误差的基本事实,提出了一套利用历史相似资料订正数值预报的方案,利用2003-2008年T213 L31数值预报产品和1948-2007年的NCEP资料,建立了100~1000 hPa等压面的高度场、温度场、风场、垂直速度场和水汽场的24~240 h预报的24 h变量订正方程.采用24 h变量相关系数和均方根误差两个指标,对2009-2010年的T213,L31高度场和温度场、数值预报产品的试应用订正效果进行了检验.结果表明:以24 h变量相关系数衡量,高度场和温度场预报订正效果都是正面的,预报时效为96~192 h,订正效果最明显;以均方根误差衡量,高度场和温度场预报订正效果同样是显著改进的;订正效果存在区域差异,高度场订正效果高纬度显著,低纬度差一些;温度场订正效果低纬度要显著一些.  相似文献   

9.
基于2003年1月—2016年5月我国A股连续2年财务亏损的上市公司样本,实证研究了随机森林模型对上市公司财务失败预警的应用。通过与逻辑斯蒂回归模型所得结果比较,证明了随机森林模型的预测精度高于逻辑斯蒂回归模型。  相似文献   

10.
将传统RFM(Recency,Frequency,Monetary)客户行为予以重构,用于商业银行的信贷管理,同时结合随机森林算法为降低银行信用风险提供决策。实验结果表明,基于随机森林的新型RFM模型在预测银行信用风险时的准确率要高于人工神经网络、KNN和C4.5算法。  相似文献   

11.
针对传统预测模型易陷入过拟合、缺失数据敏感、计算量大等不足,利用随机森林算法的双重随机性、处理数据集优异等特点,对A股股票涨跌预测进行研究。首先运用相关性分析对初始指标体系进行一次Spearman和二次Pearson筛选,去除指标体系中的冗余指标。然后对随机森林的各项重要参数进行优化,并对优化后的模型采用重要性估计方法以提升训练模型精确度。通过不同指标体系的对比,验证实验过程的正确性。最后,对比不同建模方法的实证预测结果,表明随机森林模型比传统机器学习方法二元logistic回归在性能上更优越,具备较高的预测准确度。  相似文献   

12.
基于随机森林与时空聚类的共享单车站点需求量预测   总被引:1,自引:1,他引:0  
为方便准确地预测出城市共享单车站点的需求量,根据站点需求量的随机性和时变性,提出了一种基于随机森林和时空聚类的共享单车站点需求量预测模型;该模型研究了时间因子、气象因子以及关联站点对需求量的影响;应用分层聚类对站点进行了时空分析;结合对数优化后的随机森林作为预测器。面向湾区共享单车出行数据进行需求量预测。结果表明:该模型相比极限学习机、支持向量机与随机森林等经典机器学习算法在需求量预测方面有较好的预测结果,可为实际车辆调度提供参考依据。  相似文献   

13.
针对网络上机器用户大量散布谣言, 发布虚假信息, 误导网民舆论, 严重影响网络环境的问题, 以微博中的机器用户为研究对象, 结合其自动化程度高、伪装能力强、信息发布有针对性的特点, 从行为模式、微博内容、用户关系和发布平台4个维度分析机器用户的特征指标, 利用信息熵、内容重复率等8个指标构建微博用户的特征向量, 通过随机森林算法设计微博中机器用户的识别模型。最后, 在真实的新浪微博数据集上进行验证, 结果表明本模型识别机器用户的准确度达到96.7%, 可以有效地区分微博中的机器用户和普通用户。  相似文献   

14.
为有效防治大气污染,依据大气污染的各项指标值来预测城市空气质量级别并给出起主导作用的因素,提出基于随机森林的空气质量等级分类预测方法;随机森林模型直接给出影响空气质量指标的重要性评分以便于找出最重要的影响因素,比较不同的数据挖掘方法,结果显示:随机森林分类预测的准确率最高,因此该模型可广泛应用于空气质量预测中;测试集结果显示随机森林方法不易受噪声影响且泛化误差较低,重要性评分给出细颗粒物和可吸入颗粒影响为最重要的两个因素,并以保定市为例有针对性地给出提高空气质量的建议。  相似文献   

15.
为了能够精准可靠地估计太阳能辐照度,本文提出一种基于贝叶斯模型组合的随机森林算法用于太阳能辐照度预测.首先,引入K-means聚类和K折交叉验证将气象数据训练集生成多个训练子集,以增加训练子集的多样性并保证均匀采样.其次,将随机森林作为基学习器建立集成学习预测模型,导入训练子集并训练各个随机森林.之后,依据各个随机森林在验证集上的预测性能,采用贝叶斯模型组合算法制定组合策略.个体随机森林在测试集上的预测值经过模型组合策略得到最终输出.最后,基于气象实测数据建立仿真实验,并引入其他四种预测方法进行对比仿真研究,通过实验结果验证了文中所提出预测方法在太阳能辐照度预测问题中的准确性和可靠性.  相似文献   

16.
 边坡工程是露天煤矿中的重点工程,边坡的稳定性关系着煤矿的安全生产。边坡稳定性预测是边坡防治工作的前提,针对煤矿边坡工程稳定性预测的复杂性,为了快速、有效地判别煤矿边坡稳定性,利用随机森林算法建立煤矿边坡稳定性预测模型。通过选取与煤矿边坡工程密切相关的岩石重度、黏聚力、内摩擦角、边坡角、边坡高度、孔隙水压力6 个指标作为边坡稳定性的影响因素,即为随机森林预测模型的输入,边坡稳定性状态作为随机森林预测模型的输出,通过随机森林算法建立边坡稳定性影响因素与边坡稳定状态之间的非线性关系。利用煤矿实测30 组边坡稳定性数据作为随机森林预测模型的训练数据集,进行模型的学习训练;另用12 组边坡稳定性数据作为预测模型的测试数据,通过训练好的边坡稳定性预测模型进行测试;为了验证随机森林预测模型的准确率,同时与SVM 和BP 神经网络的测试数据进行比较。结果说明,选取煤矿边坡稳定性的6 个指标建立的随机森林预测模型,人工控制参数较少、结构简单、容易实现,且具有较高的准确度,边坡稳定状态预测结果与煤矿边坡工程实际状态相吻合,能有效预测边坡稳定性状态,指导煤矿边坡防治工作的开展。  相似文献   

17.
快速准确判别矿井涌(突)水水源对保障矿井安全生产有重要意义。近年来人类的活动对不同含水层的影响与日俱增,为提高矿井涌(突)水水源判别的准确性,提出选取地下水中7种常见离子浓度,和能够充分反映人类活动痕迹的硝酸根离子浓度及化学需氧量作为水化学判别指标,采用随机森林模型进行矿井涌(突)水水源判别。为验证选取指标和判别方法的有效性,以大孤山铁矿为例,将数据输入随机森林模型进行100次交叉验证,并将验证结果与支持向量机模型和极限学习机模型进行比较。结果表明,随机森林模型预测结果稳定性较强,预测正确率不容易波动;随机森林在建模过程中参数拥有宽广的适应范围。树的棵数为50时,训练误差趋于稳定,改变树的棵数对预测结果没有实际影响,而其余二者对参数选取较为敏感;随机森林的参数可以通过袋外数据(OOB)错误率简单地得到,而其余二者参数调整时需要通过交叉验证的方式才可以取得;随机森林对训练样本进行验证,正确率可达100%,对测试样本进行验证,正确率可达97.38%,两项精度均优于支持向量机与极限学习机;随机森林模型拥有更高的预测精度和鲁棒性,在矿井涌(突)水水源判定方面有较好的应用前景。  相似文献   

18.
基于LAC理论,以海南热带雨林国家公园境内的七仙岭国家森林公园作为研究对象,采用LAC的九步技术路线,选取合适的指标,运用Delphi法建立权重,从而建立旅游综合容量评价体系,通过实地调研与访问,对七仙岭国家森林公园的旅游综合容量进行了整体评价,分析了容量评价并提出了相应的解决措施,同时为园区的优化设计、后续的规划与开发提供了较为科学的理论依据和实际参考价值.  相似文献   

19.
【目的】对三峡库区典型县域巫山县进行滑坡易发性区划,为该县滑坡灾害风险管理和城市建设规划提供科学参考。【方法】选取地形地貌、地质条件、环境条件、人类工程活动及诱发因素共5个方面下的22个因子作为滑坡易发性影响因子,结合研究区963个历史滑坡数据,以30m精度栅格建立滑坡影响因子地理空间数据库;进一步在地理空间数据库中,基于全体样本(包括滑坡点与非滑坡点),采用十折交叉验证选择训练和测试数据集;随后,利用随机森林进行模型训练,用训练好的模型对整个研究区进行全域滑坡易发性仿真分析,将结果划分为低、较低、中、较高、高5种易发性等级。【结果】混淆矩阵的准确率高达100%;受试者工作特征曲线训练数据、测试数据和全体数据的曲线下面积值均为1.000;高易发区面积占整个县面积的5.83%,而区内历史滑坡数占该县历史滑坡总数的35.72%;高程、多年平均降雨量、兴趣点核密度这3个因子对滑坡的发生有更大贡献。【结论】基于巫山历史滑坡数据和随机森林构建的滑坡易发性模型具有较高的准确性、稳定性以及良好的预测功能。  相似文献   

20.
汽车尾气的主要成分是CO气体,是公路隧道通风设计的一项重要参数。准确、快速地预测隧道内CO气体浓度,能够为隧道通风控制提供有力参考,有助于CO气体浓度的及时控制,对保障隧道内人员的健康、安全和隧道绿色节能十分必要。采用公路隧道实地监测CO气体浓度数据,建立了以监测点位置、交通量、车速、风速为输入特征的公路隧道CO气体浓度预测随机森林模型。通过整理3 300 m长隧道CO气体浓度数据,对比了CO气体浓度实测数据与模型预测值,验证了模型的预测精度。结果表明,基于随机森林建立的CO气体浓度预测模型具有良好的预测精度,能够准确地预测隧道内CO气体浓度,测试集的均方根误差(root mean square error, RMSE)和决定系数R2分别为0.497 4和0.943 7;该预测模型性能显著优于线性回归模型和支持向量机模型;预测模型能够推广应用于其他隧道的CO气体浓度预测,对应的RMSE和R2分别为0.909 5和0.729 5,可以在已知测点位置、交通量、车速、风速的情况下预判隧道内CO气体浓度,为隧道通风控制或安全预警提供数据参考;特征重要...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号