首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 171 毫秒
1.
为提高路段短时交通流的预测精度,选取路段平均旅行时间作为预测指标,建立了一种基于极端样度上升(extrem gradient boosting,XGBoost)的短时交通流预测模型。首先通过对交通流数据的分析,在考虑交通流时空特性的基础上,分别构建目标路段时间序列训练集、测试集以及时空序列训练集、测试集,然后基于XGBoost模型以及构建的训练样本集建立时间序列预测模型以及时空序列预测模型,并利用训练好的模型进行预测,最后将模型预测结果与线性回归模型、神经网络模型预测结果进行比较。实验结果表明:基于XGBoost的短时交通流预测模型能够对路段未来时段平均旅行时间进行比较准确的预测,其中时间序列预测模型均方根误差为5. 32,时空序列预测模型均方根误差为4. 82,均低于线性回归模型和神经网络模型,且相比于仅考虑时间因素的短时交通流预测模型,同时考虑时空因素的预测模型得到的误差更低,预测效果更好。  相似文献   

2.
为准确预测电力市场中的短期电价,提出了基于LSTM和XGBoost的组合预测模型。为了验证LSTM-XGBoost模型的有效性,该文先选用法国电力市场2019年1月1日至2020年12月31日的电价数据为训练集训练模型,对2021年1月1日不同模型预测的结果与实际电价值进行对比,得到LSTM-XGBoost以RMSE为0.74的误差率低于BP、LSTM、XGBoost的3.80、1.25、0.88,然后将算法应用到美国PJM电力市场,结果表明本文提出的LSTM-XGBoost组合预测模型MAPE平均值为1.83%,明显低于单一预测模型,也显著低于GRU-XGBoost组合模型,表明并非所有模型单一组合都能有效提高预测精度,该文提出的LSTM-XGBoost组合模型有效提升了短期电价的预测精度,且具有很强的普适性,可应用于电力市场短期电价预测,为市场参与者和监管机构提供有力决策依据。  相似文献   

3.
旅游客流量的预测受经济发展、季节因素影响等不确定性的影响,以三亚市旅游和文化广电体育局官网2012—2018年的月度统计数据的旅游客流量数据为研究对象,通过模型优选,基于XGB和GM模型对三亚市近7年的旅游客流量进行拟合,并对比两种模式预测的准确度。并在以上两种模式的拟合基础上,通过模型组合,对三亚市未来2019年、2020年的旅游客流量、入境过夜游客数量及旅游收入进行预测。  相似文献   

4.
为实现新零售优惠券的定向投放,提出了对用户优惠券使用行为预测的模型.该文采用XGBoost算法,突破了以TAM模型(技术接受模型)为基础解释个人优惠券使用意愿的传统方法,并基于口碑网的真实交易数据进行了特征提取和用户使用行为建模.在K折交叉验证之后通过变量重要性评分,确定了对消费者使用决策贡献度较高的特征,并与随机森林和GBDT(梯度提升决策树)算法进行了AUC(Area under curve)准确率的对比.该研究证明了基于XGBoost的集成学习算法在优惠券使用行为预测中的有效性,对新零售精准营销有重要的现实意义.  相似文献   

5.
本文提出了一种改进的XGBoost股票预测模型GC-XGBoost,并将该模型运用到股票市场进行股票价格短期预测.实验结果表明GC-XGBoost模型在MSE,MAE,R2三个评价指标上优于没有进行参数优化的XGBoost模型,说明GC-XGBoost模型比XGBoost模型提高了预测能力.  相似文献   

6.
特征构造的难题在数据挖掘过程中一直存在,传统固化的特征工程对于业务场景千变万化的数据挖掘任务所带来的效益十分有限,因此解决特征工程的特征构造问题已经成为数据挖掘的瓶颈之一;尤其在机器学习算法快速发展的情况下,特征逐渐成为模型中急需重视的部分。基于电商平台的用户行为数据,在原有特征群的基础上提出了二次组合统计特征的构建方法。利用二次交叉衍生出丰富而又切合业务场景的特征群,同时结合两种滑动窗口的方法,分别是定长滑动窗口获取更多的训练样本,变长滑动窗口获取具有时间权重的训练特征,以此来最大限度地还原出用户真实的行为习惯。最后,使用不同的特征组合结合降维的方法建立对照检验模型;并利用线性的逻辑回归模型、线性支持向量机以及树模型极端随机森林与XGBoost对模型进行交叉验证。结果表明,组合特征在树模型的算法中得到了非常好的表达效果;而且无论在线性模型还是树模型中衍生特征群模型的F1值都优于基础特征群。  相似文献   

7.
观来说,房价受到诸多因素的制约,正因如此,房价预测仍然是数据分析中一个非常经典且具有挑战性的问题.本文针对房价数据冗余,在实际场景中很难确定重要特征,提出了一种创新的数据预处理方式,并通过双模型迭代拟合的方式进行数据预测.首先从数据意义、数据形式和数据关联性三个方面进行初始数据预处理,然后根据数据选择适合的模型进行训练.在传统机器学习中,Random Forest和 XGBoost是两种常用的方法.RF 模型通过其 Bagging 过程,能够准确地评判“冗余”特征,而 XGB 模型在提高预测效果的同时,也囿于其泛化能力下降,无法稳定地反映特征重要性.因此,本文利用 RF 模型处理冗余数据,并使用XGB模型对新数据集进行拟合提高预测效果.本文在Kaggle竞赛的数据集("House Prices Advanced Regression Techniques")上进行了实验,测试结果显示,XGB回归模型最终的回归精度R2为87%,而单独的RF模型或XGB模型的R2分别为79.2%和78.7%.实验证明,该数据预测方法能够明显提高房价预测效果.同时,为充分体现模型拟合效果和预测能力,将“房价”改为具有“高”和“低”两类的离散变量,最终预测结果的精确度为93%,召回率为93%.  相似文献   

8.
风险评估是一种能够分析网络的运行状况,对风险等级进行预测的主动防护手段。为了解决传统的风险评估模型主观性强、对海量数据处理效率低及分类准确度不高等问题,运用极限梯度提升树XGBoost模型,以物理环境、软硬件故障等影响网络安全运行的因素作为输入,建立评估模型对网络安全风险等级进行预测,并与随机森林及GBDT两种方法进行对比。实验结果表明,基于XGBoost的网络安全风险评估模型可以根据收集到的信息,对信息网络风险等级进行快速准确地预测,且与随机森林及GBDT两种方法相比具有更高的准确率。  相似文献   

9.
客观来说,房价受到诸多因素的制约,正因如此,房价预测仍然是数据分析中一个非常经典且具有挑战性的问题.本文针对房价数据冗余,在实际场景中很难确定重要特征,提出了一种创新的数据预处理方式,并通过双模型迭代拟合的方式进行数据预测.首先从数据意义、数据形式和数据关联性三个方面进行初始数据预处理,然后根据数据选择适合的模型进行训练.在传统机器学习中,Random Forest和XGBoost是两种常用的方法.RF模型通过其Bagging过程,能够准确地评判“冗余”特征,而XGB模型在提高预测效果的同时,也囿于其泛化能力下降,无法稳定地反映特征重要性.因此,本文利用RF模型处理冗余数据,并使用XGB模型对新数据集进行拟合提高预测效果.本文在Kaggle竞赛的数据集(House Prices-Advanced Regression Techniques)上进行了实验,测试结果显示,XGB回归模型最终的回归精度R2为87%,而单独的RF模型或XGB模型的R2分别为79.2%和78.7%.实验证明,该数据预测方法能够明显提高房价预测效果.同时,为充分体现模...  相似文献   

10.
为了更加精准地预测二手房价格,该文以2019年深圳市二手房的真实交易数据为研究对象,利用线性回归模型、随机森林模型和XGBoost模型并加以POI计算来预测二手房价格.首先,对数据集进行清洗并可视化展示.其次,运用百度地图进行POI处理扩充数据集,使得数据集接近现实情况.接着,按照数据特征对房价影响的重要程度进行了排序,选取重要的特征来训练模型.最后,通过数值结果分析,XGBoost模型对二手房的房价评估效果最好,尤其是经过POI处理的数据集和XGBoost模型的这种组合,对于深圳市的二手房价格具有极好的预测效果.  相似文献   

11.
为了有效地监管网络舆情,辅助管理人员进行决策,微博信息传播预测方法的研究具有重要应用价值。针对传统微博信息传播预测方法存在指标单一、预测效果较差问题,提出一种基于XGBoost模型的融合多特征微博信息传播预测方法。首先,分析微博传播网络和用户节点特性,提取出博主特征、微博内容特征、传播特征3类特征并构建数据集;接着,基于XGBoost方法分别构建微博累计转发量预测模型和微博最大转发深度预测模型;最后,通过模型在测试数据集上的平均绝对误差验证模型的预测效果。通过与线性回归等传统的预测方法比较分析可以看出,提出的预测方法能够取得良好的预测效果。  相似文献   

12.
针对认知诊断方法未考虑学生的答题共性和矩阵分解方法未考虑学生知识点掌握个性的问题,提出一种结合认知诊断与XGBoost(eXtreme Gradient Boosting)的学生表现预测方法(PRNCD-XGBoost):首先,根据试题中知识点之间的共现关系探索知识点之间的相似性,并结合试题-知识点二分图挖掘试题中各知识点所占权重,从而进行认知诊断;然后,用认知诊断阶段的预测结果对历史得分矩阵进行填充;最后,采用非负矩阵分解方法提取出包含认知诊断因素的学生答题共性特征进行得分预测。并在ASSISTments2009和ASSISTments2017数据集上,将PRNCD-XGBoost方法与PMF、NeuralCD、PR-NCD、NMF-XGBoost、MNMF-XGBoost等方法进行对比实验。实验结果表明:PRNCD-XGBoost方法在学生表现预测方面具有更高的预测精确度。  相似文献   

13.
基于K-Factor GARMA模型的网络流量预测   总被引:1,自引:0,他引:1  
为衡量网络运行负荷和运行状态,在对目前网络流量预测模型进行研究的基础上,结合GARMA,对网络进行合理规划,使之能过较好描述长相关和短相关流量的特征,并且提出一个拥有简单参数改进的k-factor GARMA预测模型.仿真结果验证了所提方法的有效性.  相似文献   

14.
针对网络流量预测准确率不够高的问题,结合当下流行的集成学习(Ensemble Learning),提出一种Stacking集成多种模型的网络流量预测方法;将天气因素量化后作为输入,使用7个机器学习模型分别对网络流量进行预测,然后根据对不同模型预测结果的Pearson相关系数的分析,选取相关性较弱的5个模型作为Stack...  相似文献   

15.
李凡军  李颖 《山东科学》2009,22(3):62-65
当神经网络用于上市公司的ST预测建模时,取得高质量的样本是相当重要的.本文连续运用主元分析(也称动态主元分析),将多年的数据应用到经济预测模型中去,既增大了信息量又没有增加网络的复杂性,使得预测更加合理有效.最后将动态主元分析与BP网络结合构造了一个网络模型,并给出了实证研究的详细结果.  相似文献   

16.
目前基于深度学习的主机性能预测模型大部分缺乏普适性,实验数据缺乏公正性,无法准确预测能耗或性能峰值点且时间开销较大.为解决这些问题,文章提出了一种基于改进时序卷积网络的云服务器性能预测模型(ATCN模型).该模型将CPU利用率作为主机过载的衡量标准,利用多维性能指标构建N+1维能耗向量,建立输入向量与预测标准之间的关系;调整TCN中的卷积核大小并不断增大扩张因子,实现长期记忆效果.基于阿里云开源数据集的实验结果表明:ATCN模型具有强自适应性,在不同硬件配置和资源使用情况下,预测准确率和效率方面比LSTM模型提升大约20%.  相似文献   

17.
提出一种动态增删自组织映射(DGDSOM)神经网络,给出该模型的聚类算法描述及实现过程。定义了聚类节点信任度,并根据竞争结果、信任度、中心相似度,制定节点的增删策略,通过动态评价并变动节点,提升聚类效果。实际的聚类分析应用结果表明,该算法可以得到准确的聚类结果。  相似文献   

18.
提高剩余续驶里程预测精度可以缓解驾驶人的"续航焦虑",帮助车厂开发精细的电池管理系统,提高纯电动汽车的接受度.基于改进符号回归算法自动生成与标签字段高度相关的新数据特征字段,实现数据维度扩充.再将维度扩充后的数据传入经过超参数调优的XGBoost模型预测剩余续驶里程.对比仅使用经典特征字段的原始数据,维度扩充后的数据在...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号