首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 109 毫秒
1.
由于不同气象条件会影响太阳辐照度的有效利用,这制约了太阳能的应用和发展.为了基于不同站点不同采样时刻的气象属性预测中尺度站的太阳能辐照度,依据传统卷积神经网络的框架,建立了一种新型的卷积神经网络结构幵用于太阳能辐照度预测.为了缓解新型网络由超参数选取不当导致预测性能差的问题,利用融合算法对新型网络的超参数进行优化.为了提高融合优化算法的全局搜索能力,引入帐篷映射对粒子的初始位置和初始速度进行混沌初始化.首先,导入训练集更新新型卷积神经网络框架,训练结束后导入验证集检验当前模型参数下新型卷积框架的性能.其次,混沌融合算法依据新型卷积神经框架在验证集上的预测性能更新模型的超参数.对更新模型的超参数多次检验,直至最优的预测模型在验证集上的性能趋于收敛.最后,辒出模型的最优超参数,建立太阳能辐照度预测模型.基于气象实测数据建立太阳能辐照度预测实验,引入其他两种预测方法进行对比仿真研究,幵尽可能复现了Eustaquio and Titericz团队的预测方法(GBRT)作为太阳能辐照度预测性能的评估基准.实验数据表明:混沌融合算法可以有效地提高新型卷积神经网络的预测性能,所提出预测方法的全年太阳能辐照度的均方误差较GBRT降低25.9%,绝对平均误差较GBRT降低了10.7%;全年太阳能辐照度平均误差率降低了18.4%,误差率小于0.1的样本量增加了21.1%.  相似文献   

2.
教育规模不断扩大,高校在校生人数持续上升,导致学生的能力参差不齐.为了提升教育水平,教师需掌握学生在校期间的学习状态,预测学生期末成绩是教师掌握学生学习状态的重要途径之一.目前的研究工作主要采用传统的机器学习算法进行成绩预测,如随机森林、贝叶斯、深度森林等,但精度不高;也有利用深度学习算法进行预测,但模型缺少可解释性. Lightgbm(Light Gradient Boosting Machine)算法内存消耗低,时间复杂度低,而XGBoost(eXtreme Gradient Boosting)算法精度高.因此,基于提高精度与降低模型内存消耗的策略,将深度森林中的随机森林与极限随机森林模块分别替换为Lightgbm和XGbBoost,提出一种基于Lightgbm和XGBoost算法的优化深度森林算法LIGHT-XDF.在八个数据集上与其他模型进行对比实验,结果表明,LIGHT-XDF算法的综合性能最好.  相似文献   

3.
高价值移动通信用户预测是电信客户关系管理中的一项重要内容。针对建立预测模型时遇到的高维、大规模、类不平衡等数据处理问题,提出了一种基于有效特征选择的预测方法。利用欠采样方式从初始不平衡数据集提取多个平衡训练集,使用结合Pearson相关性分析和随机森林特征重要性评估的特征选择策略,在集成学习方法中嵌入加权和投票机制获得最优的特征子集,最后采用随机森林算法建立预测模型。实验结果表明,该预测模型可以有效降低特征集的维度并提升对高价值移动通信用户的预测性能。  相似文献   

4.
为有效进行城市空气质量预测、推进城市空气污染防治,弥补传统统计学模型在大数据时代背景下对城市空气质量预测准确率低、容错能力差等问题,提出利用随机森林回归构建城市空气质量预测模型;综合考量污染物浓度、气象参数、时间参数等多方面影响因素,通过网格搜索法调整参数的最优组合,构建基于随机森林回归算法的城市空气质量预测模型;基于重庆市2017-01-01—2020-07-31的指标数据,对重庆市空气质量进行预测分析,结果表明:在模型下训练集与测试集的确定性系数R~2均在99%以上,均方误差D_(MSE)和平均绝对误差D_(MAE)在训练集和测试集上的取值均在可接受范围内,证实模型具有运行速度快、预测误差小、具有较高的预测精度等优点,具备较好的学习能力与泛化能力。  相似文献   

5.
将随机森林(Random Forest)回归算法应用于混凝土早期抗裂性研究.以松通项目混凝土为例,基于大量文献和工程经验选取了7个主要影响因素的混凝土早期抗裂性指标体系.以原始数据建立训练样本集和测试集,通过计算基于Bootstrap自助重抽样得到的袋外数据(OOB)的模型误判率,确定随机森林预测模型的最优参数,并对影响因素进行重要性排序,利用Pearson相关性图分析各影响因素相关度,然后建立RF训练模型,输出模型训练集和预测集的预测拟合结果.通过RMSE和R~2值分析模型的预测精度,并将预测结果与BP神经网络和小波神经网络模型对比.结果显示,随机森林预测模型误差最小,精度最高,验证了模型的准确性和可靠性.提出的随机森林预测模型为实现混凝土早期抗裂性预测提供了一种有效的方法.  相似文献   

6.
常见的决策树分类算法、贝叶斯分类算法、神经网络分类算法为数据挖据分类算法研究提供了重要基础。但面对海量数据时,在时间效率、鲁棒性和精确性上都显示出了不足。为此,本文将模糊聚类的思想引入到神经网络分类算法中,首先通过模糊聚类子模型,将样本数据聚为几个数据子集,然后再采用不同的神经网络对各个数据子集同时进行训练学习。由于经过了模糊聚类子模型的预处理,每个神经网络训练学习样本的复杂性大大减少,使神经网络的学习效率大大提高。最后通过UCI下的实际数据库,对提出的分类算法进行了检验,结果显示了基于模糊聚类的神经网络在数据挖掘分类中应用的有效性。  相似文献   

7.
现今的推荐算法大多忽略用户偏好和项目属性中的多个特征,而是在单一推荐准则的基础上训练模型进行推荐. 基于多准则的推荐算法通过考虑用户偏好的多个方面,可以为用户行为提供更加准确的预测. 酒店是旅游行业中重要的环节,为了提高旅客体验,实现酒店评分预测,提出了基于矩阵分解与随机森林的多准则推荐算法. 该算法分两步实现,通过矩阵分解训练得出用户对物品在各个准则上的评分特征,然后随机森林学习评分特征预测最终评分. 实验结果显示,相较传统算法,基于矩阵分解与随机森林的多准则推荐算法的准确性和实用价值更高.  相似文献   

8.
为了提高冲击地压危害预测的准确性,基于主成分分析法和随机森林算法,构建了由主成分分析方法优化的随机森林模型,分析静态冲击地压数据并处理异常值,通过数据标准化处理、计算相关系数矩阵及累计方差贡献率,提取出5个主要特征.利用优化的随机森林模型训练冲击地压数据集,使模型参数不断得到优化.以混淆矩阵中的准确率作为评估指标,将优化的随机森林模型与单一随机森林模型进行比较分析.实验结果表明,优化的随机森林模型比单一随机森林模型具备更好的效果,其准确率达到了88.9%,高于单一的随机森林模型,进而得出结论,即优化的随机森林模型能有效地对冲击地压危害进行预测,通过随机森林优化模型,一定程度上有效缩减冲击地压危害预测的时间.  相似文献   

9.
随机森林算法是根据Bagging抽样和随机特征子集划分策略,由多棵决策树组成的集成算法.与其他分类算法相比,随机森林算法有更高的分类精度、更低的泛化误差以及训练速度快等特点,因此在数据挖掘领域得到了多方面的应用.然而随机森林算法在分类预测特征维度高且不平衡的数据时,分类性能受到了极大限制.为了更好地处理高维不平衡数据,...  相似文献   

10.
机器学习领域中的特征选择算法可简化模型输入,提高可解释性并帮助避免维度灾难及过拟合现象的发生.针对基于封装法进行特征选择时,评价模型通常将搜索出的特征子集直接作为输入,导致算法对特征利用和评估效果受限于评价模型的特征学习能力,限制了对更适特征子集的发现能力等问题,提出一种基于级联森林结构的子集特征预学习封装法.该方法在搜索算法与评价模型之间添加多层级联森林,重构待评价特征子集为高级特征集,降低评价模型模式识别难度,提高对子集性能的评价效果.实验对比了多种搜索算法及评价模型组合,本方法可在保证分类性能的前提下,进一步降低所选特征数量,同时维持了封装法的低耦合性.   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号