首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 312 毫秒
1.
为了能够精准可靠地估计太阳能辐照度,本文提出一种基于贝叶斯模型组合的随机森林算法用于太阳能辐照度预测.首先,引入K-means聚类和K折交叉验证将气象数据训练集生成多个训练子集,以增加训练子集的多样性并保证均匀采样.其次,将随机森林作为基学习器建立集成学习预测模型,导入训练子集并训练各个随机森林.之后,依据各个随机森林在验证集上的预测性能,采用贝叶斯模型组合算法制定组合策略.个体随机森林在测试集上的预测值经过模型组合策略得到最终输出.最后,基于气象实测数据建立仿真实验,并引入其他四种预测方法进行对比仿真研究,通过实验结果验证了文中所提出预测方法在太阳能辐照度预测问题中的准确性和可靠性.  相似文献   

2.
主要针对广受关注的P2P网贷信用评估问题,利用机器学习方法提高申请人网贷违约预测准确率,研究出基于Stacking特征增强多粒度联级Logistic方法及其应用.所提分类器是一种混合模型,结合了Stacking集成学习和联级Logistic学习的思想.首先,通过网格搜索技术分别建立XGBoost, Catboost, LightGBM,AdaBoost以及Gradient Boosting模型,并筛选出适合的基评估器作为Stacking集成的初级学习器,logistic模型作为次级学习器,构建基于Stacking的多粒度扫描器,生成预测结果作为元特征,拼接成新特征数据.其次,通过新特征数据以及元特征在每级Logistic上的特征增强建立联级Logistic Regression模型,并且与现有的单一集成学习器和各基评估器在3个不同的P2P网贷信用评估数据集上进行对比.实验结果表明,通过AUC、准确率等指标对其进行评价,相比于各基评估器以及其他单一集成分类器,基于Stacking增强多粒度联级Logistic模型有较高的准确率,预测效果更优.  相似文献   

3.
电力设备的负荷曲线随着时间而变化,其本质上是时间序列数据.为此提出了一种新的通过负荷曲线识别电力设备的方法,该方法在多个粒度划分出的负载曲线上使用卷积神经网络作为基分类器构造出一个集成学习器来提高分类精度.首先我们对原始数据进行不同粒度的划分,得到若干不同的新数据集.其次使用这些新的数据集训练不同的基学习器,并根据验证集上的精度得到不同基学习器的权重.将测试样本按照相同的粒度划分方式得到不同的测试数据集,使用不同的基分类器对这些测试数据集进行测试,得到对应的预测标签.最后对不同基分类器预测的标签进行加权,并选出权重最大的那个标签作为预测标签.在实际的电力负荷数据上将该模型与单个CNN模型进行对比,实验结果表明,该模型具有更高的设备识别精度.  相似文献   

4.
用户信用卡违约预测任务有助于银行等金融机构平衡经济风险与经济利益,对于银行信用卡业务的风险管控具有重要作用。针对用户信用卡违约预测问题,提出了一种基于集成学习的预测模型,有异于传统集成学习中的弱学习器。该模型采用集成模型和神经网络模型作为基学习器,从而提升模型整体的预测效果。首先通过预处理提取用户信用卡数据集的相关特征,然后分别采用优化后的决策树、随机森林、GBDT、XGBoost、CatBoost和SPE六种机器学习模型与神经网络模型进行并行训练和预测,最后通过加权软投票法集成基学习器结果并输出最终预测结果。结果表明,相对于基学习器,该模型在各项评估指标上均有所提升,且拥有更好的模型泛化能力。  相似文献   

5.
交通流量预测对于智能交通管理决策具有重要意义,为克服传统单一模型预测精度低、稳定性不足,同时为解决Stacking集成模型对基学习器输出信息利用率不高的问题,提出了一种双机制Stacking集成模型.双机制包括内机制和外机制,内机制通过在元学习器中引入注意力机制来调整网络中的特征信息,外机制通过在基学习器中融入动态权重系数来调整基学习器的输出信息.通过内外结合的双机制实现对基学习器输出信息动态变动规律的挖掘和提取并增强对基学习器输出信息的利用率,从而提升模型的预测精度和稳定性.选取I5NB高速公路上的76898条数据为实证研究对象,进行了基于随机森林、GBDT(gradient boosting decision tree)和Xgboost(extreme gradient boosting)单一模型、传统Stacking集成模型及双机制Stacking集成模型的预测对比分析.实证结果证明双机制Stacking集成模型预测精度最高,验证了该模型在短时交通流量预测中的有效性.  相似文献   

6.
特征选择是机器学习和数据挖掘中的一个关键问题,它可以实现数据维度的约减,从而提高学习模型的泛化能力.近年来,为了提高特征选择算法的性能,集成思想被应用到特征选择算法中,即将多个基特征选择器进行集成.本文从提高特征选择算法对大规模数据处理能力的角度出发,提出了一种基于最小最大策略的集成特征选择方法.它主要包括三个步骤:第一,将原始数据根据类别信息划分成多个相对较小的平衡数据子集;第二,在每一个数据子集上进行特征选择,得到多个特征选择结果;第三,对多个特征选择结果依据最小—最大策略进行集成,得出最终的特征选择结果.通过实验对比了该集成策略与其它三种集成策略对分类准确率的影响,结果表明最小最大集成策略在大部分情况下能够获得较好的性能,且基于最小最大策略的集成特征选择可以有效处理大规模数据.  相似文献   

7.
集成学习中特征选择技术   总被引:1,自引:0,他引:1  
集成学习和特征选择是当前机器学习领域中的研究热点.集成学习通过重复采样可产生个体学习器之间差异度,从而提高个体学习器的泛化能力,特征选择应用到集成学习可进一步提高集成学习技术的效果,该研究有3个方面:数据子集的特征选择、个体学习器的选择和多任务学习.该文对近几年集成学习中特征选择技术的研究进行回顾,尤其对以上3个方面的研究分别进行总结,提出一些共性的技术指导以后的研究.  相似文献   

8.
基于集成学习的思想,提出一种分布式聚类模型.该模型的分布式处理过程分为2个阶段:先在局部站点局部聚类,然后在全局站点全局聚类.局部站点的局部聚类看作是一种基于数据子集的学习过程,所有的局部聚类结果组成了聚类集成系统的个体学习器,全局聚类采用平均法对局部结果进行集成,并定义了一个准则函数来度量集成的精度.把K-means算法推广到分布式环境,提出一种基于该模型的分布式K均值算法DK-means,该算法对局部数据的分布有较强的伸缩性.实验结果表明,DK-means在同等条件下能达到集中式聚类的精度水平,是有效可行的,从而验证了基于集成学习的分布式聚类模型的有效性.  相似文献   

9.
为进一步提升图分类算法的性能和稳健性,提出了差分进化算法优化的图注意力网络集成.首先,通过划分原始样本让不同的基学习器关注数据的不同区域;其次,利用差分进化算法良好的搜索能力,以分类器集成的分类错误率为目标函数优化基学习器的权重向量;最后,在权重向量基础上综合各基学习器的输出作为分类器集成的总体输出.实验引入引文数据集...  相似文献   

10.
提出了一种新的基于加权投票准则集成的极化合成孔径雷达系统(PolSAR)图像分类方法.该方法采用加权投票集成的方法根据不同个体的学习结果进行合,并从而提高极化SAR图像的分类精度.首先,输入极化图像数据并获得所需要的特征作为特征集.再从图像的每一类中选取多组像素点组成多个训练样本子集;然后,基于不同的样本子集训练学习得到不同的分类器,并对像素点进行分类得到预测标记,再由这些预测标记计算得出相应的加权系数;最后,通过加权系数将预测标记合并起来得到最终的极化SAR分类结果.实验结果证明,所提出的算法在AIRSAR和Radarsat-2数据上取得了很好的分类结果.  相似文献   

11.
短期光伏功率预测对于电网稳定运行具有重要意义。为了解决单一模型预测精度不佳的情况,提出了一种在Stacking集成学习框架下融合Bagging和Boosting算法的短期光伏功率预测模型。首先,引入Copula函数的相关性分析和轻量级梯度提升机的特征贡献度计算来进行特征筛选;然后,选取泛化性能较优的模型作为基学习器,并采用贝叶斯优化算法来对基学习器模型参数进行优化,最后,定义一个超级学习器,采用5折交叉验证,将基学习器与元学习器封装到超级学习器中训练。算例结果表明,在不同季节和不同天气条件下,Stacking模型相较于单一模型有着更高的预测精度。  相似文献   

12.
针对短时交通流具有随机性和不确定性等特征,提出一种基于小波分析和集成学习的组合预测模型.首先,对原始交通流数据的平均行程时间序列应用Mallat算法进行多尺度小波分解,且对各尺度上分量进行单支重构;其次,对于各重构的单支序列分别使用极端梯度提升模型(extreme gradient boosting,XGBoost)进...  相似文献   

13.
为了提高风电功率预测精度,提出了一种完全集成经验模态分解(complete ensemble empirical mode decomposition adaptive noise, CEEMDAN)、极限学习机(extreme learning machine, ELM)和改进天牛须搜索算法(improved beetle antennae search algorithm, IBAS)的组合预测模型来预测风电功率。引入动态惯性权重改进天牛的位置更新方式,提高天牛须搜索算法的寻优能力。在预测过程中,首先通过CEEMDAN对原始风电功率数据进行预处理,将非平稳信号分解为一组按照频率和振幅大小排列的序列分量,减少数据波动带来的预测误差。然后利用IBAS优化ELM构建预测模型,分别预测每个序列分量,最后叠加每个序列分量的预测值得到最终预测值。仿真结果表明,与其他预测模型相比,本预测模型预测精度最高,评价指标平均绝对误差(mean absolute error, MAE)、均方根误差(root mean square error, RMSE)、平均绝对百分比误差(mean absolute ...  相似文献   

14.
唐中君  吴凡  倪浪 《科技促进发展》2020,16(10):1221-1229
电影首映日票房预测对该日排片、后续放映日票房及总票房有显著影响。在构建考虑竞争的电影首映日票房预测变量集的基础上,建立首映日票房集成预测模型。首先使用多元线性回归(multiple linear regression, MLR)、支持向量回归(support vector regression, SVR)、套索回归(Least absolute shrinkage and selection operator, Lasso)和极端梯度提升(Extreme Gradient Boosting, XGBoost)等算法建立基学习器,随后使用XGBoost算法作为原学习器构建堆栈集成预测模型,最后利用收集到的数据进行对比实验。实验证明,加入竞争变量的电影首映日票房预测变量集适用于首映日票房预测;相比单一模型,提出的集成预测模型的准确性、泛化性能和稳定性均有提升,相比较传统预测方法对首映日票房预测更准确。提出的集成预测模型有助于提升首映日票房排片的有效性。  相似文献   

15.
将认知诊断和自适应学习相结合,利用认知诊断方法先诊断学习者对知识的掌握情况,然后依据遗传算法和多岛遗传算法为每个学习者智能化提供合适的学习材料,提出了基于认知诊断框架下的自适应学习材料智能推送算法.通过Monte Carlo模拟实验考察了新算法的科学性及其效果,研究结果表明:(i)基于认知诊断框架下的自适应学习材料智能推送算法具有较理想的效果;(ii)遗传算法和多岛遗传算法选取的学习材料具有低惩罚函数值和高学习材料匹配的正确率;(iii)遗传算法和多岛遗传算法选取的材料比随机算法更加适合学习者.  相似文献   

16.
介绍了一种可以对新生儿的心电信号 (ECG)和呼吸信号 (RESP)同时进行监测的仪表的设计 .当新生儿的呼吸停止 2 0s和心跳小于 10 0次 /min两种情况同时发生时 ,监护仪可发出报警的声光信号以便医护人员进行急救处理 .在ECG信号采集过程中 ,主要研究了QRS波的识别算法 ,并且对心电信号的滤波技术进行了深入的探讨 ,设计出性能优越 ,高速节时的滤波器和QRS波检测技术 ,相应地滤除了心电图 (ECG)信号中的肌电、基线漂移和 5 0Hz工频等干扰 .采用MIT/BIH数据库对算法进行检验 ,达到了理想的效果 .液晶显示模块LCD用于ECG和RESP信号的实时现场图形显示、预测、预报和主要心电和呼吸参数的数字显示  相似文献   

17.
针对实性肺结节CT影像数据量少、人工标注耗时耗力等问题,提出一种结合生成对抗网络和集成学习的实性肺结节良恶性计算机辅助诊断方法.首先,使用基于梯度惩罚的生成对抗网络对肺结节CT影像数据集进行扩充,缓解由数据量少、样本类别不均衡导致的模型过拟合.然后,利用卷积神经网络进行CT影像特征提取,并通过主成分分析对深度特征进行降维.最后,联合CT图像特征和有效临床信息,采用集成学习方法构建分类模型预测实性肺结节良恶性.基于多中心临床数据分析表明,相比于传统卷积神经网络模型,所提出方法有更好的预测性能.  相似文献   

18.
针对工业过程中难以实现实时在线测量的重要过程变量,在主成分降解变量分组的基础上,提出了一种基于即时学习与集成学习的多模型高斯过程回归建模方法.该方法首先利用多变量组合实现集成模型的多样性,然后借助即时学习的自适应能力进行即时建模,最终多模型加权获得最终的预测结果.将所提方法应用于实际的工业炼胶过程,实验结果表明,该方法具有很好的预测性能.   相似文献   

19.
提出了一种基于独立主成分分析(independent component analysis,ICA)变量分组和集成学习的软测量建模方法.该方法首先运用ICA对输入过程变量进行分组,建立多个变量组子空间.然后在各变量组子空间内提取子样本集,降低变量和变量组之间的耦合性,并基于核偏最小二乘法(KPLS)建立预测子模型.最后,采用贝叶斯方法对子模型的输出进行集成,给出最终预测结果.运用该方法对工业橡胶密炼过程的数据进行了预测,并与其它软测量方法的结果进行比较分析,实验结果表明,本文提出的方法具有更好的预测性能.   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号