首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
利用机器学习和多元线性回归模型对西安市近一年的空气质量指数进行了研究,首先利用随机森林思想对数据进行了补齐,然后运用交叉验证对神经网络模型选取最优的隐层节点数和训练周期数,最后,通过比较两种模型的拟合效果发现,神经网络模型在对空气质量指数的预测效果明显好于多元线性回归模型。  相似文献   

2.
为弥补路面施工过程中传统沥青混合料油石比检测方法耗时长、预测精度低、对环境及人身健康有危害等缺陷,利用CT扫描及图像处理技术得到的沥青混合料内部截面空隙与集料特征,提出了一种基于随机森林算法的沥青混合料油石比检测模型,并与多元线性回归算法、决策树算法、梯度提升树算法的预测结果进行对比。研究结果表明:CT扫描和图像处理技术对沥青混合料空隙和集料的识别效果良好;通过比较分析不同算法的平均绝对误差、均方根误差、平均绝对百分比误差和负相关系数,证明采用随机森林算法的沥青混合料油石比检测模型的准确性能够满足工程应用要求,且优于其他3类算法模型,相比于传统检测方法更加简便、快捷。  相似文献   

3.
空调系统能耗预测是实现智能调控、能源需求管理、系统节能的重要手段和前提之一,当前的空调系统能耗预测主要是基于机器学习算法。诸多机器学习算法的重要理论前提是数据的分布应尽量满足正态分布,然而空调系统的实际运行数据很少能满足正态分布特性,目前的研究鲜有涉及数据分布特性对空调系统能耗预测的影响。首先基于实际项目的空调系统能耗数据,从偏度和峰度两个指标分析了实际能耗数据分布与正态分布呈现出的偏离;然后通过对数变换对能耗数据进行数据变换,使能耗数据更接近于正态分布;接着以常见的4种能耗预测机器学习算法(广义线性回归算法、支持向量回归算法、人工神经网络算法、随机森林算法)对原始数据和经过数据变换后的数据分别进行空调系统能耗预测工作,分析负荷预测结果的RMSE和R~2统计量。结果对比发现,数据的分布特性对能耗预测有着重要的影响,合适的数据变换可以有效地提高空调系统能耗预测机器学习算法模型的预测效果。  相似文献   

4.
为进一步分析不同机器学习方法用于建筑能耗模型的适用性,重点比较了6种常用机器学习方法用于预测办公建筑能耗时的准确性,包括线性回归、高斯过程、多元自适应回归样条法、自助多元自适应回归样条法、随机森林和支持向量机.结果表明:多元自适应回归样条法、自助多元自适应回归样条法和随机森林法适用于取暖能耗的模型建立;对于制冷能耗预测,自助多元自适应回归样条法的计算精度最高.同时发现制冷能耗与取暖能耗相比,由于存在更加复杂的非线性关系,其预测难度更大.研究结果不仅可用于在建筑节能分析中确定最佳机器学习方法,而且所得机器学习方法可用于城市建筑能耗模型的建立.  相似文献   

5.
针对目前高炉炼铁模型精度不高问题,提出建立高炉生产过程中精确的多目标优化模型.首先对高炉的海量数据进行了数据预处理,其次采用支持向量机、随机森林、梯度提升树、XGBoost、LightGBM、人工神经网络6种机器学习算法对高炉焦比、K值进行了预测,并采用特征工程和超参调优对机器学习预测进行了优化,最后采用新的集成学习方法进行预测.预测结果不仅精准度高而且具有很好的鲁棒性.在机器学习的基础之上,采用NSGA-Ⅱ遗传算法对高炉参数进行了多目标优化分析,得到了Pareto最优解,高炉操作者可以根据该多目标优化结果针对不同的需求选择相应的控制参数.  相似文献   

6.
由于丙型病毒性肝炎病毒感染后约有3~10%丙肝病例发展为肝细胞癌,因此准确预测丙肝感染情况,提高丙型肝炎病毒检测技术非常重要,为此,采用机器学习中的集成算法进行丙肝预测。为挑选出最优检测丙肝模型,将不同机器学习模型在UCI(University of California Irvine)丙肝数据进行比较分析。实验结果表明,梯度提升树,随机森林以及轻量级梯度提升机表现较好,其中梯度提升树在预测丙肝准确率高达0.935 1。使用梯度提升树对丙肝感染情况进行预测最为准确。  相似文献   

7.
在线上购物商品销售预测问题上,由于受商品自身的款式、材料、买家的好评与差评以及商家好评返利等多种因素影响,一般的回归预测算法往往不能支持多种特征变量,导致预测准确率较低、鲁棒性差.本文采用一种主题-随机森林算法对口罩销售量进行多变量综合投票预测,并与多重线性回归(Multiple Linear Regression,MLR)算法和随机森林(Random Forest,RF)算法相比较得出最终结论 .实验结果表明,LDA-RF算法各项指标均优于MLR和RF算法,LDA-RF算法建模速度快,鲁棒性较强,受到离群点影响比较小,散点主要集中在线性回归附近,可以有效地提高口罩销量预测精度.  相似文献   

8.
网络舆情中的谣言对社会危害极大,因此有效地检测网络舆情中的谣言已是当务之急.目前,一些单一机器学习算法被相继应用到谣言检测中.针对这些单一机器学习算法在分类上的局限性,将一种融合逻辑回归与决策树的逻辑模型树方法用于谣言检测上.根据舆情分析报告上采集的数据集,实验结果表明:组合模型逻辑模型树的分类预测准确率比已应用到谣言检测的单一机器学习算法明显要高,逻辑模型树是一种有效的谣言检测方法.  相似文献   

9.
根据生产制造企业网络的特点,在智能故障诊断中,提出了一种基于分类采样的随机森林算法(CSRF).该算法结合随机森林算法基本原理,使用分类采样技术生成所需的训练样本,很大程度上解决了数据不均衡带来的问题.该算法为随机森林的每一棵分类回归树(CART)生成相应的训练数据,缓解了采样偏置,提高了算法的性能.实验表明:该算法与随机森林算法相比在准确率上提升了约4%,有效降低了故障诊断的风险.  相似文献   

10.
针对传统预测模型易陷入过拟合、缺失数据敏感、计算量大等不足,利用随机森林算法的双重随机性、处理数据集优异等特点,对A股股票涨跌预测进行研究。首先运用相关性分析对初始指标体系进行一次Spearman和二次Pearson筛选,去除指标体系中的冗余指标。然后对随机森林的各项重要参数进行优化,并对优化后的模型采用重要性估计方法以提升训练模型精确度。通过不同指标体系的对比,验证实验过程的正确性。最后,对比不同建模方法的实证预测结果,表明随机森林模型比传统机器学习方法二元logistic回归在性能上更优越,具备较高的预测准确度。  相似文献   

11.
针对大气污染物质量浓度预测及其大规模数据计算问题,设计了一种基于随机森林算法的污染物质量浓度预测算法,采用MapReduce并行计算框架并行化计算空气质量指数,实现了基于Hadoop平台的空气污染物质量浓度预测系统.通过试验比较了基于随机森林算法和基于线性拟合算法的计算结果,显示本算法能够有效降低大气污染物质量浓度的预测误差.  相似文献   

12.
针对有限元、地层损失率等方法难以考虑多参数耦合作用情况下的地表沉降预测的问题,基于BP神经网络(BPNN)和随机森林算法(RF)两种机器学习算法的多参数、非线性拟合能力,提出了预测盾构掘进过程中地表最大沉降以及纵向沉降曲线的预测方法.通过粒子群算法(PSO)确定机器学习算法的最优超参数,通过k折交叉验证方法提高预测方法的鲁棒性.结果表明BP神经网络的预测结果误差较大,难以预测到较大的地表沉降,随机森林算法能够准确预测地表最大沉降和纵向沉降曲线.  相似文献   

13.
火源热释放速率的准确测量对深入理解火灾演变过程至关重要,然而目前被广泛使用的氧耗法所需设备造价昂贵,成本较高。该文提出了一种基于机器学习的综合性框架,用于输入温度数据预测火源热释放速率。基于火灾动力学模拟(FDS)软件模拟ISO 9705房间内不同参数的火灾场景,获取不同位置的温度数据,并建立火灾数据库。分别基于最小绝对收缩和选择(Lasso)、随机森林(RF)两种模型的递归特征消除(RFE)算法进行特征筛选,得到两个不同的低维特征子集,并设置对照组。基于不同的特征子集,分析比较了线性回归(LR)、K最近邻(KNN)和轻量级梯度提升机(LightGBM)3种典型模型对热释放速率的预测性能。结果表明:基于随机森林模型的递归特征消除算法筛选所得的特征子集训练的LightGBM模型预测效果最佳,预测结果的根均方误差(RMSE)和均绝对误差(MAE)分别为23.89 kW和15.49 kW,决定系数为0.991 6。该基于机器学习的综合性框架预测效果优异且实施成本较低,为预测火源热释放速率提供了有效途径。  相似文献   

14.
采用贡献度与相关性分析(correlation analysis)相结合的办法从目前最常用的244种股票技术指标中提取最优技术指标,进而利用梯度提升树(GBDT)算法对股票的趋势进行预测.对由贡献度、相关性分析与GBDT算法构成的组合模型(简称GBDT组合模型)进行实证分析,首次将GBDT算法应用于沪深300股票的预测.对由不同算法构成的组合模型的预测精度也进行比较分析.实验结果表明,GBDT组合模型在预测精度上优于线性回归组合模型及随机森林组合模型.  相似文献   

15.
单桩荷载—沉降曲线拟合线性回归法研究   总被引:1,自引:0,他引:1  
对现有的单桩荷载沉降曲线拟合方法——指数函数线性回归法,按照一定的方法进行优化和改进,提出了指数加权拟线性回归法.通过对单桩静载荷试验数据进行拟合,结果表明加权拟线性回归法拟合效果好于传统指数函数线性回归法.指数加权拟线性法对单桩荷载-沉降曲线模型能进行比较好的描述,在沉降预测中得出更加精确的结论.因此,可以利用指数函数加权拟线性法的拟合结果对单桩承载力进行预测.  相似文献   

16.
魏子杨 《华东科技》2023,(5):107-109
<正>在人工智能领域,机器学习算法无疑是核心组成部分,其本质上是统计学的应用。它是一种在分类、预测、随机分布等常见问题上,融合和借鉴统计学理论来进行数据归纳和分析,深度分析数据的内涵、数据背后蕴含的逻辑和规律,从而更加精妙地解决问题的方法。本文从人工智能与机器学习算法的内涵入手,重点对机器学习中的诸多算法进行简单的分析介绍,再举例说明回归算法、决策树、支持向量机、朴素贝叶斯、逻辑回归等常见算法。  相似文献   

17.
【目的】 通过非线性和多种机器学习算法构建并对比不同的立木材积模型,为樟子松(Pinus sylvestris var. mongolica)立木材积的精准预测提供理论依据。【方法】 以大兴安岭图强林业局184株樟子松伐倒木数据为基础,建立非线性二元材积模型(NLR),并通过十折交叉检验和袋外数据(OOB)误差检验的方法得到3种最优机器学习算法,包括:反向神经网络(BP)、ε-支持向量回归(ε-SVR)和随机森林(RF)。对比分析不同模型间的差异,得到最优立木材积模型。【结果】 机器学习算法在立木材积的拟合和预测中均优于传统二元材积模型,具体拟合结果排序为RF>BP>ε-SVR> NLR。其中RF的决定系数(R2)比传统模型的提高了2.00%,均方根误差(RMSE)、相对均方根误差(RMSE%)、平均绝对误差(MAE)分别降低了22.90%、22.93%、36.34%,且与真实值相比平均相对误差(MRB)的绝对值更低,证明了RF在立木材积预测中的优越性。【结论】 机器学习算法作为一种新兴的建模方法可以有效地提高立木材积的预测精度,为森林资源的精准调查和经营管理提供新的解决方案。  相似文献   

18.
机器学习在多变量拟合、复杂数据相关性分析、隐含信息挖掘利用等方面具有强大功能,在机械结构故障预测和材料寿命预测方向的应用研究成为热点.本文介绍机器学习在材料疲劳和腐蚀寿命预测中的应用,深入探讨BP神经网络、支持向量回归、聚类分析算法和集成算法综合应用的研究现状,总结模型参数的选取方法和模型性能的评估指标,并对机器学习在材料疲劳和腐蚀寿命预测研究领域存在的主要问题和发展趋势进行剖析.  相似文献   

19.
为了更好地解决路段行驶时间的短时预测问题,提出并改善了一种基于树的集成算法。针对小时间尺度下交通时变性强这一特性,构建更加鲁棒的梯度提升树(GBDT)以减少突变点的干扰。为了克服偏差 方差窘境,将随机树(RF)与GBDT进行融合,提出RF-GBDT的集成算法,并考虑各种历史旅行时间数据的相关变量以提高模型的可解释性。预测结果表明,与单独的RF或GBDT相比,RF-GBDT具有更好的预测准确度与算法稳定性。  相似文献   

20.
机器学习算法广泛应用于电商用户行为数据分析及商业预测.其中,XGBoost算法作为一种常用的有监督机器学习算法,能够实现电商用户行为特征最优选择与行为模型构建、评估消费价值、预测重复购买行为概率、提高商业决策的精准性与可行性.本研究采用阿里云天池大数据竞赛“天猫复购预测”所提供的“双十一”电商购物节关联数据集中约42万电商平台用户产生的5 500万条行为数据,基于促销活动情境完成特征构造,实现有监督分类学习.本研究实现了XGBoost算法的参数优化与数据特征值处理过程优化,完成了促销活动后6个月内电商用户重复购买行为的预测模型演算.结果表明:优化后的XGBoost算法能够比较精准地预测电商用户重复购买行为、评估在线用户潜在购买价值、实现精准营销以及真正促进促销活动的长期投资回报率提高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号