首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 171 毫秒
1.
针对现有基于机器学习算法的船舶航速预测模型无法兼顾计算精度高、泛化能力强及计算速度快的问题,提出基于LightGBM的船舶航速预测模型,并以一艘安装有能效监测系统的内河船舶为研究对象,运用LightGBM算法建立以实时风速、风向、水深、水流速度、尾轴转速、轴功率和主机油耗为输入的船舶航速预测模型,并同时与RR、SVR、DT、BPNN、RF、GBDT和XGBoost七种机器学习算法的航速预测结果进行比较。结果表明:基于LightGBM建立的船舶航速预测模型的精度、泛化能力、运算速度均排名第二,综合性能最好,可在保证较高预测精度和较强泛化能力前提下,实现对船舶航速的快速预测。  相似文献   

2.
聚丙烯复合材料老化实验周期长,且单次实验采集的数据样本少,使用传统机器学习方法进行预测的准确度较低.为了解决聚丙烯复合材料老化数据样本少与预测准确性低的问题,提出了一种虚拟样本生成(virtual sample generation,VSG)的集成学习预测方法.首先,对聚丙烯复合材料老化数据使用高斯混合模型(Gaussian mixed model,GMM)虚拟样本生成方法平滑生成验证有效的虚拟样本;然后,使用生成后的数据集建立集成学习预测模型,该模型包含随机森林(random forest,RF)、极端梯度提升(extreme gradient boosting,XGBoost)算法、轻量级梯度提升机(light gradient boosting machine,LightGBM)算法以及分类梯度提升(categorical boosting,CatBoost)算法.实验表明:集成学习模型的LightGBM算法与CatBoost算法性能最优,在测试数据上均方误差为0.001 3与0.0001,比RF算法与XGBoost算法分别高出0.4与0.2.聚丙烯复合材料老化虚拟样本生成与集成...  相似文献   

3.
聚丙烯复合材料老化实验周期长, 且单次实验采集的数据样本少, 使用传统机器学习方法进行预测的准确度较低. 为了解决聚丙烯复合材料老化数据样本少与预测准确性低的问题, 提出了一种虚拟样本生成(virtual sample generation, VSG)的集成学习预测方法. 首先, 对聚丙烯复合材料老化数据使用高斯混合模型(Gaussian mixed model, GMM)虚拟样本生成方法平滑生成验证有效的虚拟样本; 然后, 使用生成后的数据集建立集成学习预测模型, 该模型包含随机森林(random forest, RF)、极端梯度提升(extreme gradient boosting, XGBoost)算法、轻量级梯度提升机(light gradient boosting machine, LightGBM)算法以及分类梯度提升(categorical boosting, CatBoost)算法. 实验表明: 集成学习模型的 LightGBM 算法与 CatBoost 算法性能最优, 在测试数据上均方误差为 0.001 3 与 0.000 1, 比 RF 算法与 XGBoost 算法分别高出 0.4 与 0.2. 聚丙烯复合材料老化虚拟样本生成与集成学习方法可以有效解决实验周期长、单次实验采集的数据样本少的问题, 并可取得比单一机器学习算法更优的性能.  相似文献   

4.
人脸关键点检测是计算机视觉领域的一个重要分支,其检测精度将在很大程度上影响人脸识别和表情分析的结果.提出一种新的解决人脸关键点检测问题的方法,即H-GBDT.H-GBDT是一种基于GBDT决策树和HOG特征的人脸关键点检测算法,该算法是将人脸图像的HOG特征作为GBDT的输入,关键点的真实坐标作为GBDT的输出来训练预测模型,在该过程中每个关键点将分纵坐标和横坐标两次在GBDT中做回归运算,并经过不断的调整GBDT和HOG特征的参数来训练出最佳预测模型.在BioID、LFW、LFPW三种数据集上验证H-GBDT算法的性能.BioID是正脸数据集,实验结果表明H-GDBT在该数据集上的检测效果最佳,其检测误差基本上可控制在2%以内;而LFW和LFPW是自然场景下的数据集,H-GBDT在这两种数据集上的检测误差一般在2%~4%之间.  相似文献   

5.
针对梯度提升决策树(gradient boosting decision tree, GBDT)参数难以选择的问题, 提出一种基于改进鲸鱼优化算法(improved whale optimization algorithm, IWOA)的GBDT回归预测算法. 首先, 提出一种改进的鲸鱼优化算法, 利用混沌映射初始化种群提高种群多样性, 引入惯性权重与差分进化算法中的变异交叉策略解决迭代后期易陷入局部最优的问题; 其次, 利用IWOA对GBDT的关键参数寻优, 避免参数选择的盲目性, 提高回归预测模型的泛化能力; 最后, 建立IWOA-GBDT回归预测模型, 并利用UCI数据集对模型进行验证. 实验结果表明, 相比于决策树、 支持向量机、 Adaboost和GBDT算法, 该模型算法具有更好的拟合效果, 并有一定的实用价值.  相似文献   

6.
为了减少电动汽车大规模集成到电网造成的不利影响,提出了一种能够实现充电站充电负荷精准预测的方法。该方法利用LightGBM(light gradient boosting machine)与XGBoost(eXtreme gradient boosting)模型构建线下?线上组合模型。考虑充电负荷、时间、温度、天气等历史数据,利用LightGBM模型初步建立充电负荷线下预测模型;基于XGBoost模型,以线下预测模型输出负荷和实际负荷的误差为优化目标,实时变化的交通流量为协变量,建立线上预测模型,并对初步预测结果进行误差修正。某市实际充电站预测结果表明,相比于随机森林(RF)、LightGBM模型、XGBoost模型、多层感知机(MLP)以及LightGBM?RF组合模型,该组合模型具有更高的预测精度,同时可以准确预测不同充电站的实时充电负荷。  相似文献   

7.
为提高电站光伏功率预测准确率,该文提出了改进特征选择的融合预测模型。首先耦合包裹式和过滤式方法筛选特征参数;然后根据气象特征分类构建XGBoost、LightGBM和MLP的单一模型;最后使用双隐藏层多层感知器(MLP)构建融合模型进行预测。实验结果表明,通过改进特征选择以及使用对非线性描述能力更佳的MLP融合算法,融合预测模型相比单一模型具有更高的预测准确率以及更强的泛化能力,可较好地满足短期光伏功率预测的需求。  相似文献   

8.
针对天然气管道周围滑坡灾害预测中的数据缺失和特征数量少的问题,采用基于LightGBM框架实现的梯度提升决策树算法,通过插值法补齐缺失数据,利用历史特征数据生成近期特征和远期特征,得到影响斜坡演变过程各因素的重要性排序及算法最优参数集合,实现对天然气管道周围滑坡灾害的有效预测.结果表明,在对天然气管道周围滑坡灾害进行预测中,该方法相比XGBoost模型具有更高的准确率,同时处理速度也更快,证明了LightGBM算法在滑坡灾害预测方面应用的可行性和有效性.  相似文献   

9.
室内定位技术受到广泛的关注,基于接受信号强度指示(RSSI)的测距技术目前在节点定位中得到广泛应用.在基于RSSI测距的基础上,提出将天牛须搜索优化(BAS)算法应用到室内定位中.首先通过RSSI测距获得未知节点与锚节点之间的距离,在计算距离时对数据进行了预处理,从而提高测距的精度.然后引入BAS算法计算出未知节点的位置坐标.通过与粒子群定位算法(PSO)和遗传定位算法(GA)对比试验结果,验证了BAS定位算法对室内定位效率的提高更加明显.  相似文献   

10.
为提高XGBoost算法预测精度,采用布谷鸟搜索算法全局优化XGBoost的超参数包括学习率、输出结点分裂的最小损失、树模型的最大深度和弱学习器的数量,构建CS-XGBoost模型训练数据集。实验结果表明,基于CS-XGBoost的收入分类模型的准确率、精确率、F1分数和AUC等指标分别为95.67%、97.17%、95.56%和97.96%,均优于Logistic回归、支持向量机、随机森林、XGBoost算法和基于网格搜索的XGBoost算法;基于CS-XGBoost的房价预测模型的决定系数、均方根误差及平均绝对误差分别为0.905 5、2.943 5及2.165 4,预测精度较XGBoost算法得到显著提升。  相似文献   

11.
【目的】比较分析XGBoost模型、LightGBM模型、随机森林模型(RF)、K最近邻模型(KNN)、长短期记忆神经网络(LSTM)、决策树模型(DT)共6个PM2.5浓度预测模型,以准确、及时预测环境PM2.5浓度。【方法】基于重庆市合川区2020年全年空气质量监测数据和气象数据,通过最大相关最小冗余算法(MRMR)进行数据降维选择最优特征子集,作为模型的输入,逐一进行PM2.5浓度预测;考虑到不同季节PM2.5浓度差异较大,故分季节预测了PM2.5浓度;为了探究各模型预测性能,计算了各模型运行时间和内存占用,并基于PM2.5与特征变量的相关性和特征变量的重要性探讨了模型预测性能季节性差异原因。【结果】模型总体预测精度从高到低排序为 XGBoost、RF、LightGBM、LSTM、KNN、DT模型;预测性能方面,6个模型均表现为秋冬季节预测精度高于春夏季节;LightGBM模型可在保证模型精度的情况下,大幅减少模型训练时间和内存占用;特征重要性显示PM10浓度、气温和气压的重要性高,O3浓度、风向和NO2浓度重要性相对较弱。【结论】采取MRMR方法进行数据降维选取的最优特征子集能较好地预测PM2.5浓度;相比较而言,XGBoost、RF、LightGBM、LSTM模型在PM2.5浓度预测上具有较优性能,其中综合性能较好的为LightGBM模型。  相似文献   

12.
风力发电机叶片开裂直接影响风力发电机运行,采用梯度提升决策树算法与基于lightGBM框架改进的梯度提升决策树算法对风力发电机叶片开裂进行预测。对比分析了预测准确度与可行性。基于lightGBM改进的梯度提升决策树算法分析的风力发电机运行数据得出的预测结果优于梯度提升决策树算法,且对于风力发电机叶片开裂预测准确度较高,并具有实用价值。同时该算法能够大幅降低样本中的无效数据,减少计算量。其独立特征合并能够使得划分点特征数量降低,提高风力发电机叶片开裂预测的准确性。最后,风力发电机叶片开裂预测实验结果表明,基于lightGBM改进的梯度提升决策树算法取得了更好的预测结果,计算量更小且能够准确预测风力发电机叶片开裂故障。  相似文献   

13.
针对目前高炉炼铁模型精度不高问题,提出建立高炉生产过程中精确的多目标优化模型.首先对高炉的海量数据进行了数据预处理,其次采用支持向量机、随机森林、梯度提升树、XGBoost、LightGBM、人工神经网络6种机器学习算法对高炉焦比、K值进行了预测,并采用特征工程和超参调优对机器学习预测进行了优化,最后采用新的集成学习方法进行预测.预测结果不仅精准度高而且具有很好的鲁棒性.在机器学习的基础之上,采用NSGA-Ⅱ遗传算法对高炉参数进行了多目标优化分析,得到了Pareto最优解,高炉操作者可以根据该多目标优化结果针对不同的需求选择相应的控制参数.  相似文献   

14.
针对不同型号的智能手机之间存在硬件差异,导致在使用不同的智能手机进行室内定位时,采集同一蓝牙信号强度观测值存在偏差而影响定位精度的问题,提出了一种基于蚁群算法的支持向量机室内定位蓝牙标定方法.由于支持向量机参数的选取对其预测精度影响较大,因此利用蚁群算法避免人为盲目地选择支持向量机的参数,优化模型并提高预测精度.实验结果表明:基于蚁群算法的支持向量机室内定位蓝牙标定方法相比标定前的精度提高了37.3%,可以有效地进行室内定位.  相似文献   

15.
超宽带技术由于较高的测距精度和穿透性能,对于位置服务有着重要的应用价值。在实际的高密度定位环境中,传统的定位算法受非视距误差和多径效应的影响,很难实时准确解算出实际位置坐标。虽然增加基站数量可以有效提高定位的精度,但是其成本也在不断提高。针对超宽带在高密度室内定位中实时性差、定位精度低的问题,提出了一种基于支持向量机的超宽带定位方法,提高了定位的精确性和鲁棒性;给出了基于到达时间差(TDOA, time difference of arrival)的支持向量机模型,重点在于将定位问题转化为分类问题的求解;通过TDOA值和坐标值来建立支持向量机分类模型,利用一对一分类模型实现了坐标值的解算,提高了坐标解算速度。仿真结果表明,在高密度实时定位中,相比于传统的Chan算法和Taylor算法,文中方法在定位精度近似的情况下,实时性要高于传统算法,满足实际定位中低功耗、快速高精度定位的要求。  相似文献   

16.
针对热镀锌钢卷力学性能预报建模条件属性选取难、预报精度不足的问题,研究了热镀锌钢卷力学性能梯度提升树(gradient boosting decision tree,GBDT)预报模型。利用互信息差算法综合评估工艺参数、化学成分和钢卷尺寸参数等条件属性的相对重要性以及属性之间冗余性,进行模型条件属性筛选;采用同分布原理进行样本划分,结合网格搜索法和交叉验证法优化模型参数,建立力学性能GBDT预报模型。将GBDT模型预报结果与随机森林(random forest,RF)、AdaBoost算法和BP神经网络的预报结果进行比较,比较表明GBDT模型优于其他模型,90%的数据样本预测的绝对误差小于14.24 MPa,94.6%的数据样本相对误差在6%范围内,具有更高的预测精度。  相似文献   

17.
为破除XGBoost模型的黑盒特性,增强模型的说服性,提出一种基于SHAP的可解释性航班到港延误时长预测模型。首先,对航班历史数据、天气数据进行融合,在融合数据的基础上进行异常值处理,并利用递归特征消除方法进行特征选择;其次,构建航班延误时长预测模型,利用遗传算法进行参数调优,并与目前常用的模型进行对比;最后,在航班延误时长预测的基础上结合SHAP模型,从总体特征和特征间的相互关系2个角度分析特征的重要程度。实验结果表明,经过遗传算法调优的XGBoost模型预测精度更高,其中MAE降低了8.94%,RMSE降低了19.85%,MAPE降低了6.15%,且其模型精度更高。因此,SHAP模型破除了XGBoost模型的黑盒特性,增强了模型的可解释性,可为降低航班延误时长提供技术支持。  相似文献   

18.
基于生理信号客观评估心理压力状态成为目前的研究热点,但最佳评估算法有待进一步探索.本文选择心算任务诱发受试者的心理压力,采集了21位在校大学生的脑电、心电、皮肤电导、脉搏波4种生理信号.提取各生理信号时域和频域的多种特征,使用方差分析(ANOVA)、最大相关最小冗余(mRMR)、单个特征支持向量机(SVM)分类准确率、随机森林(RF)特征重要性、梯度上升决策树(GBDT)特征重要性、极端梯度提升(XGBoost)特征重要性6种特征选择方法筛选出有效特征,利用SVM、K近邻(KNN)、高斯朴素贝叶斯(GNB)、自适应提升算法(Adaboost)、GBDT、XGBoost 6种分类器对提取的特征进行分类.结果得出,GBDT特征筛选与XGBoost分类器的组合模型对心理压力的等级评估效果最佳.  相似文献   

19.
为更充分挖掘多元负荷序列间的有效信息,从而提高预测精度,提出了一种集成贝叶斯超参数优化算法、注意力机制的长期和短期时间序列网络(long and short-term time-series network with attention,LSTNet-attention)以及误差修正的短期负荷预测模型。首先,构建基于贝叶斯优化的LSTNet-attention模型进行初步预测,利用贝叶斯算法优化模型多个结构参数,降低人工设置参数的随机性,并通过注意力机制合理分配特征权重;然后,通过基于贝叶斯参数优化的极端梯度提升算法(extreme gradient boosting,XGBoost)误差修正模型来挖掘初步预测误差序列中潜在、未被利用的有效信息,进行误差预测和修正,进而得到最终的预测结果。通过使用澳大利亚某地真实负荷数据进行实证分析,实验结果表明,所提预测模型相较于其它模型具有更好的预测效果,可为负荷预测等工作提供一定参考。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号