首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
针对山洪灾害临界雨量影响因素众多、计算流程复杂的问题,以山东省临朐县山丘区237个沿河村落为研究对象,选取有实测资料、计算条件较好的沿河村落,采用水文水力学法,计算山洪灾害临界雨量作为原始数据集;选取降雨特征、流域特征、沿河村落特征、河道特征等参数,基于随机森林回归算法,构建山洪灾害临界雨量预估模型,利用网格搜索法及K折交叉验证法调整预估模型参数;确定无实测资料的沿河村落山洪灾害临界雨量指标,并验证预估模型精度,分析特征参数重要度。结果表明:所构建的预估模型具有较高的准确性与泛化性,训练集与测试集的决定系数均大于0.9,预估效果较好;流域面积、流域最长汇流路径比降、降雨均值、流域平均坡度等特征参数的重要度相对较高。  相似文献   

2.
为有效进行城市空气质量预测、推进城市空气污染防治,弥补传统统计学模型在大数据时代背景下对城市空气质量预测准确率低、容错能力差等问题,提出利用随机森林回归构建城市空气质量预测模型;综合考量污染物浓度、气象参数、时间参数等多方面影响因素,通过网格搜索法调整参数的最优组合,构建基于随机森林回归算法的城市空气质量预测模型;基于重庆市2017-01-01—2020-07-31的指标数据,对重庆市空气质量进行预测分析,结果表明:在模型下训练集与测试集的确定性系数R~2均在99%以上,均方误差D_(MSE)和平均绝对误差D_(MAE)在训练集和测试集上的取值均在可接受范围内,证实模型具有运行速度快、预测误差小、具有较高的预测精度等优点,具备较好的学习能力与泛化能力。  相似文献   

3.
针对基于降维的神经网络分类器预测模型在分析过程中存在特征丢失,并导致精度下降的问题,提出一种基于随机森林算法优化的多层感知器(MLP)回归预测模型.该优化模型通过在MLP回归模型网络的全连接层和逻辑回归层之间增加一个优化机制,利用随机森林算法对隐藏层状态的优化实现改进,从而解决了降维过程中神经网络丢失数据特征的问题.在...  相似文献   

4.
【目的】为合理布局农村居民点,推进全域乡村规划发展,科学评价农村居民点用地适宜性提供参考。【方法】选取区位条件、生产属性、自然条件、社会经济等4类20个因子,构建农村居民点用地适宜性评价指标体系,选取重庆市合川区1 000个农村居民点作为正样本,并按1∶1的比例随机选取1 000个非农村居民点作为负样本,基于随机森林算法,构建农村居民点用地适宜性评价模型,利用自然断点法将研究区内农村居民点用地适宜性等级划分为适宜、一般适宜、不适宜共3类,根据评价结果提出合川区农村居民点用地适宜性分区的优化方案。【结果】1) 验证模型的有效性,得到训练数据、测试数据、全体数据的曲线下面积值分别为0.999、0.996和0.944,模型测试集最高精度为0.991,表明模型预测准确性高且稳定;2) 评价因子中坡度、距农村道路距离和地形起伏度对农村居民点用地适宜性评价结果的影响较大;3) 适宜区位于合川区中部、北部地势平缓的丘陵盆地,建议保留发展;一般适宜区多位于西南、东南部,以及距嘉陵江、涪江1 000 m范围外,建议内部改造;不适宜区位于南部、东南部岭谷,分布于三江两侧和华蓥山支脉云雾山一带,建议搬迁撤并。【结论】利用随机森林模型进行农村居民点用地适宜性评价的精度较高,可为农村居民点管控提供参考。  相似文献   

5.
阐明真菌的生长机理对于减少储粮损失具有重要意义。在影响真菌孢子生长的因素中,最重要的因素是环境温度、稻谷含水量和储藏时间。因此,本研究基于实验数据建立了孢子数和温度、含水率和储藏天数等几个重要因素之间的多元线性回归模型。为了建立更准确的模型,我们将随机森林算法引入稻谷储藏过程中的真菌孢子数目预测模型,用于预测储藏过程中不同温度、含水率和储藏天数下的孢子数。对于随机森林模型,99%的预测值和其对应的原始数据可以达到同一数量级,对于预测孢子数具有很高的准确性。此外,我们绘制了预测曲面图,将环境条件控制在低风险区域可以有效降低稻谷在储藏过程中的霉变风险。  相似文献   

6.
随着我国资本市场的不断壮大,财务造假和市场波动等问题不断出现。为了准确衡量企业价值,设计了基于长期价值的统计指标企业评估模型。对比分析发现,采用改进随机森林算法的模型效果更好,平衡数据集训练能显著提升预测性能;预测分析发现,现金流是最重要的特征。长期价值平衡模型的各项指数显著提升,增益率达到0.87。综上所述,该模型具备较高的应用能力。  相似文献   

7.
采用机器学习中的随机森林算法对葡萄酒的化学特性与葡萄酒的品质之间的关系进行学习,并建立了有效的模型对葡萄酒品质进行预测。该方法具有预测准确率高、预测精度稳定以及葡萄酒分级详细等特点,在葡萄酒行业品质预测的应用中,能够有效地减少因品酒师个人因素带来的评级波动。还将实验结果与已经存在的一些工作进行量化比较,特别是在成本(风险)比较中,所提供的方法明显优于已有的方法。  相似文献   

8.
针对随机森林(RF)算法在风速预测中存在参数选择困难及预测精度低的问题,提出了基于改进果蝇优化算法(IFOA)的随机森林回归(RFR)模型.在果蝇优化算法(FOA)中引入指数函数和三角函数实现搜索步长的自适应更新,增强全局寻优和局部探索的能力.结合RFR算法对噪声和异常值具有良好容忍度的优点,利用IFOA优化RFR主要...  相似文献   

9.
针对单一变量选择算法中模型分类精度和泛化能力较低的问题,提出一种混合变量选择算法.该算法分为两个阶段:过滤阶段,利用互信息快速排除一部分无关变量,降低样本空间的维数;封装阶段,在置换理论框架下,利用随机森林精选剩余变量.实验结果表明,该算法与对比算法相比具有更高的分类精度和泛化能力.  相似文献   

10.
空气质量状况直接影响着人们的身心健康,空气污染治理一直是一个广受争论的热点问题.本文基于2015~2020年江西省各地级市主要污染物浓度和气象数据,采用时间序列与随机森林模型,深入分析江西省各地级市的空气质量状况及其影响因素,得到以下结果:(1)从整体角度来看,2015~2020年间江西省城市的空气质量一直处于优良状态...  相似文献   

11.
为了研究瓶装水消费的驱动因素,以广东省的瓶装水消费为例,利用边限协整检验方法、自回归分布滞后模型以及误差纠正模型分析GDP指数、在校生人数和过夜游客数对瓶装水消费量的影响。结果表明:收入因素在长期和短期都对瓶装水消费量有显著的促进作用;旅游和教育这两个典型行业的发展壮大都对瓶装水消费量的增长有显著的促进作用,其中旅游业的发展对瓶装水消费量的长期促进效果更明显,在校学生对瓶装水的消费则具有一定的替代性。因此,随着国民收入水平的进一步提高以及旅游等行业的进一步发展,瓶装水的消费量将进一步增加,带来的能源消耗和环境问题不容忽视,需要深入研究。  相似文献   

12.
随机森林在分类不平衡数据时,容易偏向多数类而忽略少数类,可以将代价敏感用于分类器的训练,但在传统代价敏感随机森林算法中,代价函数没有考虑样本集实际分布与特征权重,且在随机森林投票阶段,没有考虑基分类器的性能差异。本文提出一种改进的代价敏感随机森林算法ICSRF,该算法首先根据不平衡数据集的实际分布构造代价函数,并将权重距离引入代价函数,然后根据基分类器的性能采取权重投票,提高分类准确率。实验结果表明,ICSRF算法能有效提高少数类的分类性能,可以较好的处理不平衡数据。  相似文献   

13.
现有的大多数情感识别算法在进行连续情感识别时稳健性较差,影响了识别的精度。为此,文中提出一种基于随机森林的连续情感识别和跟踪算法,可持续识别出人脸在正常交流过程中的各种情感。在训练阶段,首先重建输入图像的三维脸部模型。并通过图像融合来构建连续情感表示(CEP)和用户无关情感表示(UIEP)。然后,由三维脸部形态、CEP图像及其情感值构成增强型训练集,并利用该训练集来构建随机森林。在情感估计阶段,随机森林同时进行两种回归操作:一种是针对三维脸部表情的跟踪;一种是针对当前情感的识别。当前时间步骤的CEP图像和之前时间步骤的三维脸部形态作为输入,计算当前时间步骤的情感值和三维脸部形态作为输出。当随机森林没有合适的输出时,利用UIEP图像进行复原优化,获得经过复原的三维脸部形态和情感。仿真实验结果表明,所提算法的性能达到要优于当前大多数情感识别算法,实时连续情感识别时的皮尔逊相关系数也较高。  相似文献   

14.
高光谱数据具有光谱范围广,光谱分辨率高等优势,可以用于不同地物的分类识别,为近年来遥感领域的研究热点。采用随机森林算法对机载高光谱数据进行了地物分类识别研究,首先选取不同种类的地物样本,并对每类样本打上类别标签,每个像素包含的波段数即为样本的特征数,送入随机森林分类器进行训练;然后将训练好的分类器对待分类的高光谱影像数据进行分类,待分类的数据初始化为统一的类别标签;并根据袋外数据自变量的扰动对分类精度的影响,计算不同波段特征对分类效果的重要性系数。实验采用C++语言结合Intel Open CV计算机视觉库,编写了高光谱影像分类识别程序,对机载AISA高光谱传感器获取的甘肃省张掖市农村与城市影像数据进行分类,结果表明本文算法具有较高分类精度和可靠性。  相似文献   

15.
以GIS为平台,选取16个预测因子(包括8个遥感因子、3个DEM因子、4个土壤因子和1个地层岩性),提取泥石流发生当日和前一日累计降水数据为响应因子,建立了random forest回归树模型,在区域尺度上对凤城市泥石流灾害进行预警预测.预测的结果表明:岩性、海拔和坡向是影响泥石流发生的主要因素,而持续的降水提高了土壤因子在地质灾害发生中的重要性,各遥感指数中,黏土因子对泥石流的影响最大.在东南部,只有当累计降水量较高时,泥石流才会发生;相反,在西北部,少量的累计降水就会造成泥石流的发生.另外,从1日降水预警图和2日降水预警图比较来看,持续降水容易增加泥石流发生机率.  相似文献   

16.
电商物流是电子商务发展相配套的物流,网购的发展促进了电商物流的产生和发展,电商物流的发展在电商发展乃至整个供应链中具有重要意义。构建广东省区域电商物流能力评价的指标体系,利用主成分分析的方法进行实证分析,结果表明:广东省区域电商物流能力较好,但地区差异性很大,区域发展极不平衡。广东省区域电商物流能力影响因素包括投入产出水平、需求情况、发展潜能3方面,主要由投入产出水平决定。进而提出广东省区域电商物流能力发展的建议,以促进更好地发展。  相似文献   

17.
为了解决气溶胶分类精度低和特征参数冗杂的问题,基于OMI(Ozone Monitoring Instrument)遥感产品的气溶胶特征参数,利用随机森林算法,将广东省2014年的气溶胶类型划分为沙尘型气溶胶(Desert Dust,DST)、生物质燃烧型含碳气溶胶(Carbonaceous Aerosols Assoc...  相似文献   

18.
The ability to perform short-term traffic flow forecasting is a crucial component of intelligent transportation systems. However, accurate and reliable traffic flow forecasting is still a significant issue due to the complexity and variability of real traffic systems. To improve the accuracy of short-term traffic flow forecasting, this paper presents a novel hybrid prediction framework based on Support Vector Regression(SVR) that uses a Random Forest(RF) to select the most informative feature subset and an enhanced Genetic Algorithm(GA) with chaotic characteristics to identify the optimal forecasting model parameters. The framework is evaluated with real-world traffic data collected from eight sensors located near the I-605 interstate highway in California. Results show that the proposed RFCGASVR model achieves better performance than other methods.  相似文献   

19.
水温度与水密度之间的函数关系通常由实测经验数据列表给出,也可以绘出函数曲线。通过对数变换、移轴等数学方法,利用最小二乘法回归分析,求出因变量水密度与自变量水温度为拟抛物线型的回归函数表达式,其相关系数几乎达到1.0,为利用重力循环理论供热的管道系统水力计算研究提供了便利条件。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号