首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 92 毫秒
1.
针对Stacking算法计算时间较长和样本数据较少的问题,提出了一种基于新向量表示和交叉验证精度加权的改进Stacking算法.采用三层算法结构,第1、2层为初级层,使用随机森林、SVR、XGBoost 3个学习器;第3层为次级层,使用LightGBM对第2层输出再次学习以减弱噪声.用一种新的向量表示法来增大层级之间输...  相似文献   

2.
集成学习主要分为串行和并行学习方法.并行学习的优势在于分类器的并行学习和融合,对分类问题通常采用的融合策略为投票法或堆叠学习法,它们的代表分别为随机森林和堆叠泛化Stacking.为了进一步提高Stacking的分类性能,在经典Stacking算法原理的基础上,提出基于随机森林的多阶段集成学习方法,以随机森林作为基层的基学习算法,以投票法和学习法同时作为融合方法,来降低泛化误差.在UCI数据集上的实验结果表明,提出的模型在Accuracy和1F指标上,相比Bagging,随机森林和Stacking等分类器在分类性能上有很大的提升.  相似文献   

3.
设计了一个三层神经网络模型来实现电力系统的短期负荷预测。采用了改进的BP学习算法,以提高训练的收敛速度,预测仿真结果表明,所设计的神经网络是可以进行短期负荷预测的。  相似文献   

4.
基于Stacking集成学习的流失用户预测方法   总被引:1,自引:1,他引:0  
利用机器学习算法对商业活动中普遍存在的客户流失问题进行预测.借鉴了Bagging的自助采样法思想,提出了一种基于自助采样法的Stacking集成方法.首先对数据集进行多次采样并加入属性扰动,然后使用所得数据子集训练基分类器副本,基分类器决策结果由基分类器所对应的副本投票决定.最后在真实数据集中进行流失客户预测实验,结果显示,该文提出的方法在准确率、查准率和F1值3项指标上均好于所有基分类器和同结构的经典Stacking集成方法.  相似文献   

5.
结合中国国家统计局的数据,使用基于核主成分分析与加权支持向量机的方法建立模型,找出了影响就业(失业)的22个主要指标.考虑到这些指标相互之间的相关性,使用核主成分分析与加权支持向量机的方法建模,给出了算法的步骤,构造了非线性预测函数,并对1995-2009年的城镇登记失业率进行拟合预测,得到的结果具有较高的精度.  相似文献   

6.
缺失值数据是目前研究数据分析的一个重要领域,随着智能医疗的迅速发展,如何充分利用海量数据挖掘出其中的重要信息,对隐藏的疾病做出预测并进行提早的干预治疗显得尤为重要.但在实际预测中,经常面对不完备数据集,从心脏病数据集出发,基于随机森林算法加以贝叶斯优化算法动态调参,提出心脏病缺失值补足算法.以准确率ACC作为算法的评判依据,通过精度和时间2个方面进行验证,4种算法对比实验结果表明,提出的算法具有更准确的填补效果.  相似文献   

7.
针对当前校园扶贫工作普遍存在的“隐形贫困”及疑似“虚假贫困”等问题,提出了利用随机森林算法和决策树的贫困生认定方法首先,利用智慧校园大数据环境获取高校内学生的基本信息、消费信息等数据,找出10个具有分类能力的特征;然后使用基于permutation随机置换的残差均方减小量来衡量对于变量重要性评分;最后,基于随机森林算法和决策树进行判别与分类实验结果表明,提出的方法具有一定的准确性,相比Adaboost方法,无论是预测准确度还是平均绝对误差,随机森林方法都更出色  相似文献   

8.
蛋白质相互作用位点的识别对于突变设计和预测蛋白质相互作用的网络是非常重要的。基于支持向量机学习方法,该文提出一种用于预测蛋白质相互作用位点的有效数据属性抽取方法,该方法利用蛋白质的序列信息、蛋白质残基的可及表面积和进化率来构造向量,通过十倍交叉验证来对数据进行训练和预测。实际计算的结果显示,该方法的准确率为72.19%,比只利用序列信息和进化率信息的方法提高了5.71%。  相似文献   

9.
针对国内旅游人数预测研究了旅游人数的影响因素,讨论了输入层、隐含层、输出层等神经元的设置及网络训练的参数,综合考虑训练精度、训练时间、泛化能力等条件,动量—自适应学习速率调整算法是适合国内旅游人数预测的,并基于动量—自适应学习速率调整算法建立了神经网络模型;将模型应用于国内旅游人数预测系统,结果表明,该算法具有较好的准确性和鲁棒性,利用神经网络模型预测国内旅游人数是可行的.  相似文献   

10.
为精确预测食管癌病人的存活风险,通过构建食管癌编码基因(mRNA)和非编码基因(ncRNA)共表达网络,利用随机游走挖掘网络节点的拓扑权重,并与随机生存森林(RSF)整合,构建食管癌风险预测模型.结合5倍交叉证实和独立数据集验证,利用C-index评估算法预测性能.识别出了用于构建风险预测模型的最优lnc RNA分子标签,并实现了食管癌生存风险的精确预测.  相似文献   

11.
采取主动和被动相结合的方式分别控制方位角和仰角的自动跟踪,结合不需解决散热问题的尖顶型聚光方式,设计制造低成本和高可靠性的跟踪式尖顶型聚光光伏发电装置,使光伏发电量理论上增加1.9倍,较大地降低光伏发电成本,是实用的能够产业化推广的跟踪式聚光光伏发电技术.同时,通过分析实测发电数据,得出跟踪式聚光发电更适合建在直射光成分含量较多的地方.  相似文献   

12.
提出了一种基于三维卷积和卷积长短期记忆(convolutional long short-term memory,CLSTM)神经网络的水产养殖溶解氧预测模型。首先,将输入向量及其转置相乘形成一个单通道矩阵,把一定时间段内的单通道矩阵堆叠成一个立方体作为输入数据;然后,将输入数据进行连续两次三维卷积来细化溶解氧相关因素的特征,并删除池化层以简化计算;最后,将三维卷积抽取的特征结果输入CLSTM模型以提取时间维度的信息,在全连接层根据梯度下降算法将数据反向更新。采集湖北省襄阳市某家特种水产养殖有限公司的实际数据进行实验。结果表明:相比于传统BP神经网络模型、Conv3D、Conv2D,所提出的模型具有更快的训练收敛速度、更高的预测精度和更好的预测稳定性,可以满足实际生产的需要。  相似文献   

13.
针对现有预测模型不能充分提取交通流时空特征的问题,提出一种基于改进卷积神经网络(convolutional neural network,CNN)和长短时记忆(long short-term memory,LSTM)神经网络的短时交通流预测方法。首先,采用分层提取方法使设计的网络结构和一维卷积核函数自动提取交通流序列的空间特征;其次,优化LSTM网络模块来减少网络对数据的长时间依赖;最后,在端对端模型的训练过程中,引入改进后的自适应矩估计(rectified adaptive moment estimation,RAdam)优化算法,加快权重的拟合并提高网络输出的准确性和鲁棒性。实验结果表明:在工作日与周末分时段,所提出的模型相比堆栈自编码(stacked auto-encoders,SAEs)网络预测模型,性能分别提升3.55%与8.82%,运行时间分别缩减6.2%与6.9%;相比长短时记忆网络-支持向量回归(long-short term memory-support vector regression,LSTM-SVR)预测模型,性能分别提升0.29%与1.79%,运行时间分别缩减9.0%与9.7%。所提模型能够更加适用于不同时段下的短时交通流预测。  相似文献   

14.
功率谱估计是分析随机信号的一种重要方法.通过分析AR模型功率谱估计,介绍AR模型参数提取的L-D算法、Burg算法和Marple算法,并利用计算机仿真比较三者的性能.  相似文献   

15.
基于信息融合技术和DSP实现的温湿度控制系统设计   总被引:2,自引:0,他引:2  
信息融合技术是智能信息处理中的一个重要环节,多传感器信息融合可以充分提取对象的信息特征,采用信息融合技术,对温室温,湿度信号进行融合,得到温室控制信号,并用DSP(数字信号处理器)实现对温,湿度的控制。  相似文献   

16.
为了尽早检测出原发性肝癌患者,辅助医生进行医疗决策,提高患者临床疗效,提出一种基于临床常规检验指标的筛查方法。该方法使用支持向量机建模,采用差异进化算法进行参数优化,以接收者操作特征曲线下面积的值作为模型评价测度,将得到的最优模型用于检验数据识别,以判断该数据属于健康、良性病变还是原发性肝癌。此外,还根据临床需求绘制分类模型的性能指标曲线和阈值查找表,由用户选择阈值,使预测性能进一步提升。实验结果表明:与其他5种分类方法相比,该方法建立的模型具有更好的性能,其准确度可达0.94,Kappa系数可达0.90。研究结果可辅助医生进行原发性肝癌早期筛查,提高患者长期生存率。  相似文献   

17.
数据稀疏性是推荐系统中严重影响推荐结果准确性的重要因素之一.针对数据稀疏性提出了融合卷积神经网络(convolutional neural network,CNN)和降噪自编码(denoisingauto-encoder,DAE)神经网络混合的神经网络评分预测模型(convolutional-denosing autoencoder,CDAE)对用户未评分项目进行预测评分,从而解决数据稀疏性问题.首先将向量化后的用户评论数据通过卷积神经网络训练得到用户特征向量矩阵,其次将用户特征向量矩阵作为降噪自编码神经网络的初始权重,结合用户评分数据经过降噪自编码神经网络训练,得到用户-项目预测评分,然后在此基础上进行基于用户的协同过滤推荐.最后使用movielens-1M实验数据集对比验证了提出的混合神经网络协同过滤推荐(convolutional-denosing autoencoder collaborative filtering,CDAECF)模型.实验证明,所提出的CDAECF模型能够有效地结合隐性反馈和显性反馈数据,具有较高的推荐准确率.  相似文献   

18.
提出一种基于最优样本子集的在线模糊最小二乘支持向量机(least squares support vector machine,LSSVM) 混沌时间序列预测方法. 算法选择与预测样本时间上以及欧氏距离最近的样本点构成最优样本子集,并采用" 不敏感函数对其进行模糊化处理,通过模糊LSSVM 训练获得预测模型. 随着时间窗口的滑动,最优样本子
集和预测模型实时更新,模型更新采用分块矩阵方法降低运算复杂度. 实验中对时变Ikeda 序列进行预测,表明所提出的方法与离线和在线LSSVM 相比,训练速度更快,预测精度更高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号