首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 500 毫秒
1.
采用贡献度与相关性分析(correlation analysis)相结合的办法从目前最常用的244种股票技术指标中提取最优技术指标,进而利用梯度提升树(GBDT)算法对股票的趋势进行预测.对由贡献度、相关性分析与GBDT算法构成的组合模型(简称GBDT组合模型)进行实证分析,首次将GBDT算法应用于沪深300股票的预测.对由不同算法构成的组合模型的预测精度也进行比较分析.实验结果表明,GBDT组合模型在预测精度上优于线性回归组合模型及随机森林组合模型.  相似文献   

2.
基于粗糙集优化支持向量机的泥石流危险度预测模型   总被引:2,自引:0,他引:2  
为准确预测泥石流危险度,提出了基于粗糙集理论(RS)的粒子群算法(PSO)优化支持向量机(SVM)模型。首先离散化泥石流样本数据形成初始决策表,利用粗糙集理论对10个泥石流危险度影响指标进行属性约简,将约简后的泥石流指标数据归一化处理作为支持向量机的学习样本,通过粒子群算法寻优获得最佳支持向量机模型参数,最终建立基于粗糙集的泥石流危险度预测的优化支持向量机模型。并将构建的RS-PSO-SVM模型用于对测试样本的预测,结果表明:在相同训练样本的条件下,RS-PSO-SVM模型、PSO-SVM模型及RS-PSO-BP模型三者的预测准确率分别为:87.5%,87.5%,75%,说明RS-PSO-SVM模型和PSO-SVM模型具有比RS-PSO-BP模型更高的精度。此外,尽管RS-PSO-SVM模型和PSO-SVM模型具有相同的预测精度,但是由于进行了属性约简,RS-PSO-SVM模型可以有效提高运行效率,降低模型复杂度。  相似文献   

3.
标记分布学习相对于传统标记学习能够反映出样本中相关标记的重要程度,由于标记分布数据集样本特征数目较少,使得现有部分算法精度不高。基于此,提出一种结合GBDT(Gradient Boost Decision Tree)的标记分布学习算法(GBDT-LDL),通过对特征变换来提高标记分布学习的精度:首先利用GBDT对样本特征进行学习;然后将训练的模型对训练特征进行特征变换,将变换后的新特征进行归一化,再结合原特征一起输出;最后将混合特征建立GBDT-LDL模型,预测未知标记分布。与现有标记分布算法进行比较,实验结果表明,算法能取得较好的效果,统计假设检验进一步验证算法是有效的。  相似文献   

4.
为研究高速公路匝道车辆在交织区的汇入行为,基于梯度提升决策树(GBDT)建立了车辆汇入模型,引入超车时间T、拒绝间隙数N以及最大拒绝间隙G_(LR)来分析匝道车辆拒绝相邻间隙并超越主线前车的行为,并利用美国NGSIM项目中的车辆轨迹数据对模型进行训练和测试.结果表明:GBDT的预测精度较分类回归树和二元Logit模型分别提高5.3%和13.3%;引入变量T,N,G_(LR)使GBDT、分类回归树和二元Logit模型的预测精度分别提高6.0%,6.7%和5.3%;GBDT模型中超车时间T在所有变量中重要性值最高.GBDT模型能够准确地预测汇入行为,获得变量与汇入行为间隐藏的非线性关系;引入变量T,N,G_(LR)能够有效提高汇入模型的预测精度.  相似文献   

5.
研究时序数据预报和提高预报精度的方法,提出了一种新的利用误差项对时序数据样本进行BootStrap重抽样的方法。该方法采用神经网络技术建立时序数据预报模型,并通过重抽样技术提高预报精度。通过BootStrap算法与BP算法的预报偏差平方和比较说明BootStrap算法提高了预报精度,将提出的重抽样技术引入时序数据预测中,可提高神经网络的预测精度,并适用于股票价格及外汇交易预测等效应领域。  相似文献   

6.
为准确预测太阳辐射量,提高太阳能利用效率,提出一种相关性分析和梯度提升决策树(gradient boosting decision tree,简称GBDT)组合的太阳辐射量预测算法.利用相关性分析选取预测算法的最优输入指标,使用数据矫正方法剔除粗大误差数据.将该文算法与传统算法的预测结果进行比较,结果表明该文组合预测算法具有更高的预测精度.  相似文献   

7.
建立地质灾害易发性评价模型并开展易发性评价,对提高区域地质灾害预报预警效率和精度有重要意义.然而,如何建立既切合区域实际、又具有推广适用价值的地质灾害易发性评价模型是制约地质灾害预报预警的关键科学问题.以云南省南华县2015年地质灾害详查数据为基础,选择地形、地貌等11个因子,基于均值法,采取梯度提升树算法(XGBoost、LightGBM、CatBoost)、信息量模型与地理加权回归模型开展了地质灾害易发性评价研究.结果表明:(1)地理加权回归模型预测结果存在过拟合现象,信息量模型则存在欠拟合现象;(2)均值法效果最好,AUC(Area Under Curve)值为0.933 7,精度较地理加权回归模型、XGBoost、LightGBM、CatBoost、信息量模型分别提高了1.7%、1.8%、2.0%、3.8%、4.0%;(3)Catboost对正样本的预测效果最差,但是对负样本的预测效果最好,而XGBoost对正样本的预测效果最好,对负样本的预测效果很差,基于3种梯度算法的均值法则对正负样本的预测精度有了明显提高;(4)南华县地质灾害主要诱因有道路修建、断层活动、降雨冲刷、河流侵...  相似文献   

8.
短时的降雨和温度等预报一直是天气预报中的重要问题。为了准确和及时预测局部区域的降雨及温度,提出了一种基于Attention和LSTM组合模型(ALSTM)的关联多值预测算法。该算法利用天气时间序列中的前期数据,对下一小时的降雨量和温度进行关联预测,以此实现对天气要素的多值预测。该算法首先对输入数据进行归一化处理;然后利用数据对ALSTM模型进行训练;最后将训练好的模型用于多值预测。将ALSTM模型与LSTM、BP以及基于LSTM的深度循环神经网络(DRNN)的预测结果进行了比较。实验结果表明,ALSTM模型的温度和降雨预测精度优于比较的其他模型,其平均预测精度在97%以上。  相似文献   

9.
高Co-Ni二次硬化钢是一种多元系合金,其力学性能受材料成分及热处理工艺等条件影响。传统的数学模型很难对材料力学性能进行预测。采用增量型极限学习机(I-ELM)建立高Co-Ni二次硬化钢材料模型,根据模型预测的结果研究微量元素Co和时效温度对高Co-Ni二次硬化钢材料力学性能的影响,并且在多项性能指标方面对高Co-Ni二次硬化钢数据的I-ELM模型与BP神经网络模型进行比较。实验结果表明,在对较少样本数据的模型训练时,高Co-Ni二次硬化钢的I-ELM模型预测结果与实验数据基本吻合,I-ELM模型的拟合精度和训练速度均优于BP神经网络模型,为今后高Co-Ni二次硬化钢的材料研究提供参考。  相似文献   

10.
针对传统k-近邻(k-NN)算法基于单一k值预测难以兼顾不同样本的个性,从而导致总体预测精度不够理想的问题,提出了一种组合Bk-NN预测方法.首先通过Boosting理论建立了个性化预测模型集,然后分别采用每个模型对样本进行独立预测,最后各模型预测值的加权和将作为最终预测结果.Bk-NN预测充分考虑了不同类型的样本可能要求不同的预测模型与之相适应的情况,有效降低了预测误差.与其他方法不同的是,Bk-NN预测对数据集的属性类型没有特殊要求.在标准数据集上的实验结果表明,Bk-NN预测精度比传统k-NN方法平均提高了6.44%~15.25%.  相似文献   

11.
魏晋  安实  张炎棠 《科学技术与工程》2023,23(26):11424-11430
共享单车的发展有利于交通的节能减排绿色发展。建成环境是影响共享单车出行需求的重要因素,然而很少有学者探究考虑其交互作用。为了准确分析建成环境中各影响因素的交互作用以达到精确预测共享单车出行需求的目的,本文使用了深圳市共享单车出行数据、兴趣点数据(point of interest,POI)、路网数据和公交线路数据等多源数据,采用梯度提升决策树(Gradient Boosting Decision Tree,GBDT)模型预测共享单车出行需求,并与BP(Back Propagation)神经网络模型预测结果进行比较;最后借助SHAP(SHapley Additive explanation)方法解释GBDT模型中各种影响因子对共享单车出行需求产生的影响,并分析各影响因素及其交互作用。实验结果表明:GBDT模型预测结果平均绝对误差为0.683,均方根误差为0.728,较BP神经网络模型预测准确性更高;通过SHAP方法发现自行车道密度、公交站点数等交通属性因素对于共享单车出行需求作用明显,土地利用中土地利用混合度不是简单线性作用且不同POI间存在复杂交互关系。可见通过借助GBDT模型和SHAP方法可以用来共享单车出行需求预测以及影响因素分析,从而为共享单车发展提出改善建议。  相似文献   

12.
为解决热轧带钢力学性能预报精度的问题,本文提出了一种将一维数值型数据转换为二维图像型数据的建模方法,基于LeNet-5和GoogLeNet卷积神经网络,构建了一种新型的热轧带钢力学性能预报模型,并利用实际生产数据对模型的适用性进行了测试。结果表明,所建模型的抗拉强度预报误差为2.49%,均方根误差为19.15 MPa,预测精度高于BP神经网络和单独的LeNet-5和GoogleNet卷积神经网络模型,所建模型的有效性和准确性均得到了验证。  相似文献   

13.
针对室内定位算法在定位时所用时间较长和定位精度较低的问题,提出了一种基于改进LightGBM算法的室内定位算法。该算法首先针对指纹库中的数据进行预处理,通过KNN算法去除异常点和离群点,降低环境噪声干扰,提高数据可靠性。接下来,将样本集划分为训练集和测试集,使用LightGBM算法对进行建模。同时,使用遗传算法调整LightGBM算法中的参数,并根据适应度函数寻找最优参数,得到LightGBM+GA坐标预测模型。最后,根据优化后的参数建立预测模型实现坐标预测。实验结果表明,该算法在WiFi定位的精度上较与XGBoost算法提高0.1m,相较于GBDT算法提高0.19m,在定位时间上,LightGBM+GA算法比GBDT算法快5.10s,比XGBoost算法快5.97s,具有较好的实用性。  相似文献   

14.
采用决策树(DT)模型及其衍生的随机森林(RF)模型、极端随机树(ET)模型和梯度提升树(GBDT)模型,对用于甲烷吸附的金属有机框架材料(MOFs)进行了高通量的计算筛选。利用1 800种材料的特征向量数据,计算了特征向量之间的相关性并进行重要度分析,发现材料的结构特征与化学信息特征的相关性不大,但是结构特征的重要度较高。将数据库中的1 260种材料作为训练集并使用上述4种机器学习模型进行训练,再将剩余的540种材料作为测试集对模型的筛选结果进行比较和评估。接收者操作特征(ROC)曲线和查准率-查全率(PR)曲线结果表明,GBDT模型自身稳定性强且预测结果精度高,因而成为筛选吸附甲烷的高性能金属有机框架材料的最佳模型。针对RF模型和GBDT模型进行参数优化,发现协调单个决策树的个数和决策树节点的分裂特征数量能够有效改善RF模型的性能,而调节回归树的学习速率和迭代次数可有效改善GBDT模型性能。最后基于540种材料的测试集,利用GBDT模型筛选出前20种高性能吸附材料,分析了它们的主要特征向量与甲烷吸附量之间的关系。  相似文献   

15.
油水相对渗透率曲线是油藏数值模拟中提高历史拟合精度和准确预测开发指标的关键参数。数值模拟中不同储层物性采用不同的相对渗透率曲线是十分必要的。以目标油田具有代表性的52条非稳态油水相对渗透率曲线为样本,利用交替条件期望方法,建立了束缚水饱和度、残余油饱和度、束缚水下油相渗透率和残余油下水相渗透率等端点值模型,结合油藏归一化平均相对渗透率曲线,形成了油水相对渗透率曲线预测模型。基于所建立的预测模型,可以得到目标油田不同储层物性对应的相对渗透率曲线,并应用于历史拟合过程中。历史拟合结果表明,历史拟合精度尤其是含水率急剧变化段的拟合精度有明显提高。该预测模型可广泛应用于相渗资料丰富的老油田的历史拟合和指标预测过程中,同时也为相对渗透率曲线网格化奠定了基础。  相似文献   

16.
为了更好地解决路段行驶时间的短时预测问题,提出并改善了一种基于树的集成算法。针对小时间尺度下交通时变性强这一特性,构建更加鲁棒的梯度提升树(GBDT)以减少突变点的干扰。为了克服偏差 方差窘境,将随机树(RF)与GBDT进行融合,提出RF-GBDT的集成算法,并考虑各种历史旅行时间数据的相关变量以提高模型的可解释性。预测结果表明,与单独的RF或GBDT相比,RF-GBDT具有更好的预测准确度与算法稳定性。  相似文献   

17.
针对B钢厂2250 mm热轧生产线层流冷却系统卷取温度预报命中率低的问题,采用差分进化算法优化后的梯度提升决策树建立带钢卷取温度预测模型(DE-GBDT),并对DE-GBDT预测模型与3个基础预测模型(梯度提升决策树(GBDT)、支持向量机(SVM)、小波神经网络(WNN)预测模型)以及差分进化算法优化后的支持向量机(...  相似文献   

18.
为了研究含裂纹高强镀锌钢丝在应力腐蚀作用下的受拉力学性能,根据应力腐蚀试验、静力拉伸试验、电镜实验和有限元模拟的研究数据,建立了含裂纹高强钢丝的力学模型,给出了模型参数的计算方法,并对含裂纹钢丝的应力腐蚀机理和静力受拉性能进行了研究.结果表明,在静力拉伸破坏试验中,应力腐蚀下的含裂纹高强镀锌钢丝的决定性破坏因素是裂纹,刻痕的应力集中系数远大于正常腐蚀的蚀坑,钢丝力学性能的变化是由初始裂纹进一步腐蚀而引起的;当钢丝腐蚀较严重时,钢丝力学性能主要由裂纹及其底部蚀坑决定.  相似文献   

19.
风力发电机叶片开裂直接影响风力发电机运行,采用梯度提升决策树算法与基于lightGBM框架改进的梯度提升决策树算法对风力发电机叶片开裂进行预测。对比分析了预测准确度与可行性。基于lightGBM改进的梯度提升决策树算法分析的风力发电机运行数据得出的预测结果优于梯度提升决策树算法,且对于风力发电机叶片开裂预测准确度较高,并具有实用价值。同时该算法能够大幅降低样本中的无效数据,减少计算量。其独立特征合并能够使得划分点特征数量降低,提高风力发电机叶片开裂预测的准确性。最后,风力发电机叶片开裂预测实验结果表明,基于lightGBM改进的梯度提升决策树算法取得了更好的预测结果,计算量更小且能够准确预测风力发电机叶片开裂故障。  相似文献   

20.
商品预测是使用以往商品信息去估计和推断未来商品的销售趋势,并以此作为对商品进行合理调配与规划的依据.为实现对商品销售的精确预测,在GBDT基础上,提出了一种层次化集成预测模型(HGBDT).针对数据表征的高维问题,基于Bagging思想,在特征空间构建了该模型,实现对商品的有效描述,以此提高预测模型的性能与泛化能力.在开放数据库上的实验结果验证了本文模型的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号