首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
为准确预测太阳辐射量,提高太阳能利用效率,提出一种相关性分析和梯度提升决策树(gradient boosting decision tree,简称GBDT)组合的太阳辐射量预测算法.利用相关性分析选取预测算法的最优输入指标,使用数据矫正方法剔除粗大误差数据.将该文算法与传统算法的预测结果进行比较,结果表明该文组合预测算法具有更高的预测精度.  相似文献   

2.
为研究高速公路匝道车辆在交织区的汇入行为,基于梯度提升决策树(GBDT)建立了车辆汇入模型,引入超车时间T、拒绝间隙数N以及最大拒绝间隙G_(LR)来分析匝道车辆拒绝相邻间隙并超越主线前车的行为,并利用美国NGSIM项目中的车辆轨迹数据对模型进行训练和测试.结果表明:GBDT的预测精度较分类回归树和二元Logit模型分别提高5.3%和13.3%;引入变量T,N,G_(LR)使GBDT、分类回归树和二元Logit模型的预测精度分别提高6.0%,6.7%和5.3%;GBDT模型中超车时间T在所有变量中重要性值最高.GBDT模型能够准确地预测汇入行为,获得变量与汇入行为间隐藏的非线性关系;引入变量T,N,G_(LR)能够有效提高汇入模型的预测精度.  相似文献   

3.
为实现新零售优惠券的定向投放,提出了对用户优惠券使用行为预测的模型.该文采用XGBoost算法,突破了以TAM模型(技术接受模型)为基础解释个人优惠券使用意愿的传统方法,并基于口碑网的真实交易数据进行了特征提取和用户使用行为建模.在K折交叉验证之后通过变量重要性评分,确定了对消费者使用决策贡献度较高的特征,并与随机森林和GBDT(梯度提升决策树)算法进行了AUC(Area under curve)准确率的对比.该研究证明了基于XGBoost的集成学习算法在优惠券使用行为预测中的有效性,对新零售精准营销有重要的现实意义.  相似文献   

4.
针对热镀锌钢卷力学性能预报建模条件属性选取难、预报精度不足的问题,研究了热镀锌钢卷力学性能梯度提升树(gradient boosting decision tree,GBDT)预报模型。利用互信息差算法综合评估工艺参数、化学成分和钢卷尺寸参数等条件属性的相对重要性以及属性之间冗余性,进行模型条件属性筛选;采用同分布原理进行样本划分,结合网格搜索法和交叉验证法优化模型参数,建立力学性能GBDT预报模型。将GBDT模型预报结果与随机森林(random forest,RF)、AdaBoost算法和BP神经网络的预报结果进行比较,比较表明GBDT模型优于其他模型,90%的数据样本预测的绝对误差小于14.24 MPa,94.6%的数据样本相对误差在6%范围内,具有更高的预测精度。  相似文献   

5.
从GM(1,1)模型原理和GM(1,1)与线性回归组合模型原理的不同之处开始讨论,利用GM(1,1)与线性回归组合模型对广州市某小区1#楼一个沉降监测点(CJ1)进行了分析和预测,分析和预测的结果验证了GM(1,1)与线性回归组合模型在建筑物沉降变形分析中的实用性、正确性和有效性.最后对组合模型预测精度起决定性作用的灰指数v和参数m进行了分析,给出了求解灰指数v和参数m的最优值算法,应用结果表明,该方法使预测结果更可靠、准确,具有实际的参考价值.  相似文献   

6.
针对糖尿病数据特征维度较高,单一分类器过度拟合导致性能受限,不能较好对糖尿病进行分类识别这一问题,提出了一种深度置信网(Deep Belief Networks,DBN)融合梯度提升决策树(Gradient Boosting Decision Tree,GBDT)的糖尿病检测算法(DBN-GBDT).该算法利用DBN对海量数据的特征提取和拟合复杂模型的能力,GBDT算法具有很强的泛化能力,将DBN用于特征提取和特征降维,GBDT方法用于分类.将提出的算法用于糖尿病数据分类识别,并与DBN、GBDT、SVM和随机森林四种经典方法进行对比.实验结果表明,该算法分类精度较高,稳定性更强,为糖尿病检测提供了新的方法.  相似文献   

7.
标记分布学习相对于传统标记学习能够反映出样本中相关标记的重要程度,由于标记分布数据集样本特征数目较少,使得现有部分算法精度不高。基于此,提出一种结合GBDT(Gradient Boost Decision Tree)的标记分布学习算法(GBDT-LDL),通过对特征变换来提高标记分布学习的精度:首先利用GBDT对样本特征进行学习;然后将训练的模型对训练特征进行特征变换,将变换后的新特征进行归一化,再结合原特征一起输出;最后将混合特征建立GBDT-LDL模型,预测未知标记分布。与现有标记分布算法进行比较,实验结果表明,算法能取得较好的效果,统计假设检验进一步验证算法是有效的。  相似文献   

8.
针对提高股票未来价格的预测精度,提出区间模糊数的整体GM(1.1)预测模型.利用最优解求解定义方程,得到区间模糊数的预测公式.基于区间模糊数满意度对投资组合选择模型进行优化,得到单目标规划投资选择模型.通过实例分析,给定不同的满意度得到不同的投资组合,证明模型具有一定的柔性.  相似文献   

9.
短期光伏功率预测对于电网稳定运行具有重要意义.为了解决单一模型预测精度不佳的情况,提出了一种在Stac-king集成学习框架下融合Bagging和Boosting算法的短期光伏功率预测模型.首先,引入Copula函数的相关性分析和轻量级梯度提升机的特征贡献度计算来进行特征筛选;然后,选取泛化性能较优的模型作为基学习器,...  相似文献   

10.
为更精确地预测月度航空货运量,提出组合模型预测方法.该模型由季节GM(1,1)和季节ARIMA乘积模型构成,它结合了该2种模型中时间序列预测的优点.灰色模型GM(1,1)能准确反映时间序列的增长趋势;ARIMA乘积模型对季节特征有较好的拟合效果.依据霍尔特温特预测模型计算季节性GM(1,1)模型的季节指数,并用灰色关联分析求出组合预测中的权值.组合预测模型的平均相对误差为0.62%,而季节性GM(1,1)模型和ARIMA乘积模型的平均相对误差分别为4.49%和-3.16%.预测分析结果说明,该模型的非线性曲线拟合精度和预测精度明显高于单个模型,可较好地反映系统的动态性和运量的季节时序关联性,为季节性时间序列预测提供了新的途径.  相似文献   

11.
为了提高中长期电力负荷预测的精度,改进传统灰色GM(1,1)模型在中长期负荷预测中因部分原始背景数据的偶然性偏差而导致预测精度降低的问题,提出了将数据融合算法与GM(1,1)模型相结合以形成数据融合算法优化下的GM(1,1)模型.首先对特定年采用多个不同历史数据进行GM(1,1)模型预测,利用数据融合算法对多次预测值进行优化分析,获得优化后的预测结果,最后通过对某电力系统年用电负荷进行实例分析,证明数据融合优化下的GM(1,1)模型具有较高预测精度.实践证明所建立的模型对电力系统中长期负荷具有良好预测能力.  相似文献   

12.
股票数据具有非线性和含有大量噪声的特点,传统股票预测模型难以充分识别股票非线性特征以及降低噪声,导致预测精度不高.为了提高预测精度,去除冗余特征并加强特征的区分度,引入流形学习中的线性局部切空间排列算法,提出了一种新的支持向量回归机的股价预测优化模型.首先利用线性局部切空间排列算法对股票原始数据进行特征提取,然后采用支持向量回归机对提取到的特征和股票价格之间的非线性关系建模,并利用遗传算法优化支持向量回归机的参数,最终提高股票价格的预测精度.为证明模型的有效性,采用标准普尔500指数在2012—2013年、2014—2015年2个时间段内的股票数据进行检验.实验证明,提出的模型相较其他对比模型具有更高的预测精度,更强的泛化能力.  相似文献   

13.
为了提高高速公路交通事件检测的效果,首先从交通流基本参数、交通流组合参数、不同区间交通流参数对交通事件参数的变化进行全面的分析,构建交通事件初始特征变量集,并利用AdaBoost算法、梯度提升树(GBDT)算法、随机森林(RF)算法对初始特征变量进行筛选,通过三种方法综合比较分析得出最终的重要变量.对随机森林中的决策树进行加权计算,构建加权随机森林,并利用粒子群(PSO)算法优化加权随机森林模型.通过采集的高速公路交通事件数据进行对比分析,实验结果表明,在交通事件初始特征变量中筛选出重要变量,对检测的精度有所提高,加权随机森林的检测性能也要优于传统的支持向量机(SVM)和随机森林.  相似文献   

14.
为提高热连轧粗轧带钢生产过程中换钢种、换规格及换辊后的首块带钢宽度设定模型精度,本文提出一种基于主成分分析协同随机森林(PCA-RF)算法的宽度预测模型.采用主成分分析法对数据样本合理分析,通过计算特征值、主成分贡献度及累计贡献度进行特征选择.在PCA筛选的变量数据集上训练最佳随机森林宽度预测模型.同时,使用支持向量机回归(SVR)、K-最近邻(KNN)模型进行对比验证.通过实际应用表明,PCA-RF各道次宽度模型R-squared值控制在99.9%~1,且96%以上样本点预测误差在-5~5mm,从而证明该模型实现了换钢种、换规格及换辊后的首块钢宽度的高精度预测.  相似文献   

15.
为进一步提高风电功率预测精度,提出一种基于麻雀搜索算法(SSA)优化VMD参数的组合预测方法。首先,使用麻雀搜索算法对VMD参数进行优化,并利用优化后的VMD对数据进行分解;其次,结合灰色关联分析法和熵权法对环境变量进行相关性分析,选择相关性最高的影响因素与分解得到的各模态分量组合作为LSTM预测模型的输入,获得更为精确的预测结果;最后,建立基于非参数核密度估计(NKDE)的风电功率概率预测模型,实现对风电功率预测结果不确定性的有效量化。结果表明,所提组合模型的MAE,RMSE和MAPE比VMD-LSTM模型的分别下降了39.51%,33.22%和40.39%。SSA-VMD-LSTM-NKDE组合模型不仅能够有效提高确定性预测的精度,而且还能够实现对风电功率预测结果不确定性的有效量化,为风电功率预测提供了科学决策依据。  相似文献   

16.
为提高光伏电站辐照强度的预测精度,提出一种基于长短时记忆网络(long short term memory network,简称LSTM)和轻梯度提升机(light gradient boosting machine,简称LightGBM)的组合模型.以LightGBM模型的预测结果作为LSTM模型的一个特征输入,然后采用误差倒数法对以上两种模型的数据进行加权组合,得到组合模型的预测值.算例分析结果表明:与其他3种模型比较,该文组合模型的预测精度最高.  相似文献   

17.
以选矿中的浮选生产过程为研究对象,提出一种基于混沌蚁群神经网络算法预测浮选过程经济技术指标的测量模型.采用主元分析进行输入数据集降维,应用混沌蚁群算法与最小二乘法相结合的混合算法调整前提参数和目标值,以取代二次规划求解优化问题,并达到求解速度快、仿真精度高的效果;同时,采用混沌蚁群算法训练神经网络,在随机扰动或测量噪声存在的情况下仍可以达到较好的训练目的,并提高了网络参数辨识的收敛速度.同时,以某实际选矿浮选生产过程的生产数据作为建模和预测数据进行仿真分析,并与初始的主元分析-反向传播(BP)神经网络模型预测结果加以对比.结果表明,所提出的模型能够实现浮选过程经济技术指标的全局预测,与优化前的模型相比其预测误差明显较低,预测精度提高了1.8%,满足优化浮选药剂添加的计算要求.  相似文献   

18.
针对城市公交实时客流数据多样化和特征复杂的状况,提出一种基于S-Catboost模型的客流特征提取及短时客流预测方法和影响因子分析流程。首先,通过爬虫技术获取公交客流数据的环境和时变特征,扩充客流数据的特征维度。其次,通过对客流数据进行时间和精度加权并采用LSTM和随机森林2种基模型对客流数据进行堆叠(Stacking),提取强特征并加入第二层子模型的特征矩阵。最后,利用Catboost算法对类别特征进行数值化处理,得到预测结果。实验结果表明该模型比传统LSTM、随机森林、GBDT以及SVM在预测准确度和计算时间上都有明显的优势,并给出了不同影响因子对客流量的相对贡献度和各自的偏效应,该模型对于公交系统进行实时线网优化调度和线路拥挤度信息发布具有比较高的实用价值。  相似文献   

19.
基于生理信号客观评估心理压力状态成为目前的研究热点,但最佳评估算法有待进一步探索.本文选择心算任务诱发受试者的心理压力,采集了21位在校大学生的脑电、心电、皮肤电导、脉搏波4种生理信号.提取各生理信号时域和频域的多种特征,使用方差分析(ANOVA)、最大相关最小冗余(mRMR)、单个特征支持向量机(SVM)分类准确率、随机森林(RF)特征重要性、梯度上升决策树(GBDT)特征重要性、极端梯度提升(XGBoost)特征重要性6种特征选择方法筛选出有效特征,利用SVM、K近邻(KNN)、高斯朴素贝叶斯(GNB)、自适应提升算法(Adaboost)、GBDT、XGBoost 6种分类器对提取的特征进行分类.结果得出,GBDT特征筛选与XGBoost分类器的组合模型对心理压力的等级评估效果最佳.  相似文献   

20.
针对随机森林(RF)算法在风速预测中存在参数选择困难及预测精度低的问题,提出了基于改进果蝇优化算法(IFOA)的随机森林回归(RFR)模型.在果蝇优化算法(FOA)中引入指数函数和三角函数实现搜索步长的自适应更新,增强全局寻优和局部探索的能力.结合RFR算法对噪声和异常值具有良好容忍度的优点,利用IFOA优化RFR主要参数,将优化后的模型应用于风速预测.实验结果表明,IFOA-RFR组合模型相比于其他模型具有更高的预测精度,验证了该方法在风速预测中的可行性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号