首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
为有效防治大气污染,依据大气污染的各项指标值来预测城市空气质量级别并给出起主导作用的因素,提出基于随机森林的空气质量等级分类预测方法;随机森林模型直接给出影响空气质量指标的重要性评分以便于找出最重要的影响因素,比较不同的数据挖掘方法,结果显示:随机森林分类预测的准确率最高,因此该模型可广泛应用于空气质量预测中;测试集结果显示随机森林方法不易受噪声影响且泛化误差较低,重要性评分给出细颗粒物和可吸入颗粒影响为最重要的两个因素,并以保定市为例有针对性地给出提高空气质量的建议。  相似文献   

2.
机器学习算法广泛应用于电商用户行为数据分析及商业预测.其中,XGBoost算法作为一种常用的有监督机器学习算法,能够实现电商用户行为特征最优选择与行为模型构建、评估消费价值、预测重复购买行为概率、提高商业决策的精准性与可行性.本研究采用阿里云天池大数据竞赛“天猫复购预测”所提供的“双十一”电商购物节关联数据集中约42万电商平台用户产生的5 500万条行为数据,基于促销活动情境完成特征构造,实现有监督分类学习.本研究实现了XGBoost算法的参数优化与数据特征值处理过程优化,完成了促销活动后6个月内电商用户重复购买行为的预测模型演算.结果表明:优化后的XGBoost算法能够比较精准地预测电商用户重复购买行为、评估在线用户潜在购买价值、实现精准营销以及真正促进促销活动的长期投资回报率提高.  相似文献   

3.
提前24 h准确预测PM2.5浓度可以有效的避免严重污染天气对人体带来的不利影响.为了提高深度学习模型PM2.5浓度24 h预测的性能和泛化能力,在传统循环神经网络(RNN)模型上添加支持向量回归(SVR)作为下采样层提取非线性特征并降维;然后添加多核卷积神经网络(CNN)提升特征表达能力;最后利用门控循环网络(GRU...  相似文献   

4.
盗窃类案件是公安机关较为棘手的一类犯罪,呈现高发低破态势.提前预测发案情况是预防该类型犯罪的有效途径,因此对预测盗窃犯罪提出了一种以Bagging方法为基础、基于特征选择准确度和差异性双重考量的集成学习算法,根据集成学习器好而不同的原则,构造由异质基学习器集成的特征选择器,实现对影响盗窃犯罪发生因子的有效选择,使用更少维度的特征数据集提升犯罪预测的效率和准确度.实验结果表明,提出的SEFV_Bagging算法具有较好的泛化能力和稳定性,在测试数据上表现出的预测准确度也较为理想,且算法无需根据先验知识设置所选特征子集维数,在盗窃犯罪数据分析预测领域应用中有较为明显优势.   相似文献   

5.
【目的】为提高决策树集成的泛化能力和效率,解决集成全部决策树的情况下有时并不显著提高精度、反而导致额外存储和计算开销的问题,提出一种基于粗糙集的决策树集成学习算法。【方法】该算法基于粗糙集理论,从训练的全部决策树中选择一部分进行集成。【结果】与目前流行的集成学习算法Bagging和Boosting相比,本文提出的算法有效地减小了集成规模,并获得更好的泛化能力。【结论】该算法提高了决策树集成的泛化能力和效率。  相似文献   

6.
提出一种自适应权值的支持向量机集成学习方法。该方法以Bagging方法为基础,结合部分AdaBoost算法权值更新的思想,给各个子分类器赋予权值,同时结合支持向量机本身的特性,对训练数据进行选择,加大训练样本的差异性。相比较传统的Bagging方法,结合SVM的特性来更有针对性的训练错分样本。文中使用4个UCI数据集进行对比实验,结果表明本文算法相比较传统的Bagging算法可以在一定程度上提高分类器的泛化能力。  相似文献   

7.
针对当前软件缺陷序列预测算法准确度不高的问题,提出了基于非线性加权的集成学习软件缺陷序列预测算法(NLWEPrediction)。该算法在常见线性集成预测算法的基础上增加了非线性回归项,回归项代表了集成预测算法中基预测算法之间的相互关系,修正了线性集成预测的偏差,并通过梯度下降法求解了模型中的参数。实验表明:NLWEPrediction在14个软件缺陷数据集上的均方误差均小于250,并且平均绝对误差均小于13。通过与基预测算法、集成预测Bagging、Stacking算法和只考虑两个分类器关系的非线性加权集成学习算法进行对比,可以看出,NLWEPrediction预测算法的均方误差和平均绝对误差显著减小,预测精度显著提高,说明在线性集成预测算法基础上增加非线性回归项,能够有效提高集成学习算法的分类效果。  相似文献   

8.
9.
短期光伏功率预测对于电网稳定运行具有重要意义。为了解决单一模型预测精度不佳的情况,提出了一种在Stacking集成学习框架下融合Bagging和Boosting算法的短期光伏功率预测模型。首先,引入Copula函数的相关性分析和轻量级梯度提升机的特征贡献度计算来进行特征筛选;然后,选取泛化性能较优的模型作为基学习器,并采用贝叶斯优化算法来对基学习器模型参数进行优化,最后,定义一个超级学习器,采用5折交叉验证,将基学习器与元学习器封装到超级学习器中训练。算例结果表明,在不同季节和不同天气条件下,Stacking模型相较于单一模型有着更高的预测精度。  相似文献   

10.
针对极限学习机(Extreme Learning Machine,ELM)模型参数选取敏感问题,文章提出一种改进的海洋捕食者算法(Improved Marine Predator Algorithm,IMPA)优化极限学习机的权重和偏置。首先,针对海洋捕食者算法初始种群的多样性不足,运用准反射学习策略生成高质量的初始猎物种群。其次,引入柯西变异策略更新种群,增强算法的全局寻优能力。然后,运用纵横交叉策略对猎物种群进行修正,进一步提高算法搜索精度。最后,将改进后的海洋捕食者算法优化极限学习机的权重和偏置,构建了一种IMPA-ELM预测模型用于空气质量指数预测。实验结果表明,IMPA-ELM预测模型在空气质量指数预测精度上有所提高。  相似文献   

11.
基于集成学习的思想,提出一种分布式聚类模型.该模型的分布式处理过程分为2个阶段:先在局部站点局部聚类,然后在全局站点全局聚类.局部站点的局部聚类看作是一种基于数据子集的学习过程,所有的局部聚类结果组成了聚类集成系统的个体学习器,全局聚类采用平均法对局部结果进行集成,并定义了一个准则函数来度量集成的精度.把K-means算法推广到分布式环境,提出一种基于该模型的分布式K均值算法DK-means,该算法对局部数据的分布有较强的伸缩性.实验结果表明,DK-means在同等条件下能达到集中式聚类的精度水平,是有效可行的,从而验证了基于集成学习的分布式聚类模型的有效性.  相似文献   

12.
13.
随着时间的推移,网络协议流将出现不平衡的现象,经常出现不可预知的在线流量种类,传统在线流量分类模型无法对未知的流量种类进行分类,导致整体分类精度低,适应能力差。为此提出一种新的基于机器学习算法的在线流量分类方法,针对不同类别的在线流量样本流集合筛取出若干最近邻样本流,求出各个样本流特征权重,确定各个特征与类别的相关性,将相关性大的特征当成在线流量特征。依据得到的特征选取部分标识在线流量数据,确定K中值聚类的起始中心,构造映射关系,获取未知的在线流量种类。实验结果表明,所提方法有很高的分类精度,且扩展性和适应能力较强。  相似文献   

14.
针对现有的大部分细粒度图像分类算法都忽略了局部定位和局部特征学习是相互关联的问题,提出了一种基于集成迁移学习的细粒度图像分类算法。该算法的分类网络由区域检测分类和多尺度特征组合组成。区域检测分类网络通过类别激活映射(class activation mapping,CAM)方法获得局部区域,以相互强化学习的方式,从定位的局部区域中学习图像的细微特征,组合各局部区域特征作为最终的特征表示进行分类。该细粒度图像分类网络在训练过程中结合提出的集成迁移学习方法,基于迁移学习,通过随机加权平均方法集成局部训练模型,从而获得更好的最终分类模型。使用该算法在数据集CUB-200-2011和Stanford Cars上进行实验,结果表明,与原有大部分算法对比,该算法具有更优的细粒度分类结果。  相似文献   

15.
一种基于人工神经元网络的条件分支预测算法   总被引:1,自引:0,他引:1  
针对人工神经元网络学习速度较慢的缺点,提出了改进学习算法的基于人工神经元网络的条件分支预测算法.基于SimpleScalar模拟器,用SPEC95基准程序对改进的方案进行了性能评估.模拟测试表明,在学习初期,相比传统人工神经元网络预测算法,改进的分支预测算法能使预测失效率降低1%~2%,而在稳定期,可获得同等的预测精度.  相似文献   

16.
设计了一种电台主域积分双谱(PIB)特征参数提取方法,利用双谱特征的对称性,简化计算,提高计算效率。针对PIB特征参数冗余仍然较大,导致分类器复杂、识别效率低的问题,提出了一种改进的带监督局部线性嵌入(LLE)流形学习方法,利用电台数据类别信息的监督距离改进LLE算法中的邻域点搜索方法,并用于PIB参数的降维。将上述方法用于电台个体识别,采用概率神经网络作为识别分类器,对同型号同工作参数的10部电台进行个体识别实验。实验结果验证了上述方法的有效性,在接收信号信噪比为20 dB时电台的正确识别率超过90%。  相似文献   

17.
为了更好地解决路段行驶时间的短时预测问题,提出并改善了一种基于树的集成算法。针对小时间尺度下交通时变性强这一特性,构建更加鲁棒的梯度提升树(GBDT)以减少突变点的干扰。为了克服偏差 方差窘境,将随机树(RF)与GBDT进行融合,提出RF-GBDT的集成算法,并考虑各种历史旅行时间数据的相关变量以提高模型的可解释性。预测结果表明,与单独的RF或GBDT相比,RF-GBDT具有更好的预测准确度与算法稳定性。  相似文献   

18.
本文针对当前室内地磁定位技术存在地磁信号不稳定和地磁指纹不唯一所造成定位误差大等问题,提出一种基于集成学习与BP神经网络的室内地磁定位方法,提高地磁定位精度。将BP神经网络作为弱预测器,通过集成学习的方法把多组弱预测器集成为强预测器,使用地磁数据进行室内定位,与地磁指纹库中的真实位置信息进行对比并计算出定位误差。结果表明本方法与KNN、DTW以及BP神经网络相比,总平均定位误差分别降低了2.55、1.33和0.4 m。  相似文献   

19.
为了充分利用人脸图像的局部信息、改善现有基于整体特征的彩色人脸识别算法的识别率,提出了一种基于局部特征和集成学习分类器的鲁棒彩色人脸识别算法.在特征提取阶段,使用自适应四元数pseudo-Zernike矩(AQPZMs)来描述图像子块的特征.对于具有较大熵的图像子块使用较高阶次的四元数pseudo-Zernike矩(QPZMs)提取特征,反之则使用较低阶次的QPZM s.在匹配识别阶段,使用集成学习分类器进行判别.针对不同彩色人脸图像库的测试结果表明,当人脸图像受到光照、表情等因素影响时,与采用QPZMs或者四元数二维主成分分析(Q2DPCA)进行整体特征提取的识别算法相比,所提算法的识别率更高.  相似文献   

20.
在空气污染大数据预处理的基础上,提出了一个基于深度学习的空气污染物浓度预测平台.该平台架构分为数据采集层、模型层和可视化界面层3个层次,分别实现了数据采集与处理,基于长短期记忆(LSTM)网络模型的污染物浓度预测,以及预测结果可视化的功能,通过对用户个性化模型参数的设置,实现不同时间段污染物浓度时间序列的预测.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号