首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 110 毫秒
1.
客观来说,房价受到诸多因素的制约,正因如此,房价预测仍然是数据分析中一个非常经典且具有挑战性的问题.本文针对房价数据冗余,在实际场景中很难确定重要特征,提出了一种创新的数据预处理方式,并通过双模型迭代拟合的方式进行数据预测.首先从数据意义、数据形式和数据关联性三个方面进行初始数据预处理,然后根据数据选择适合的模型进行训练.在传统机器学习中,Random Forest和XGBoost是两种常用的方法.RF模型通过其Bagging过程,能够准确地评判“冗余”特征,而XGB模型在提高预测效果的同时,也囿于其泛化能力下降,无法稳定地反映特征重要性.因此,本文利用RF模型处理冗余数据,并使用XGB模型对新数据集进行拟合提高预测效果.本文在Kaggle竞赛的数据集(House Prices-Advanced Regression Techniques)上进行了实验,测试结果显示,XGB回归模型最终的回归精度R2为87%,而单独的RF模型或XGB模型的R2分别为79.2%和78.7%.实验证明,该数据预测方法能够明显提高房价预测效果.同时,为充分体现模...  相似文献   

2.
为了更加精准地预测二手房价格,该文以2019年深圳市二手房的真实交易数据为研究对象,利用线性回归模型、随机森林模型和XGBoost模型并加以POI计算来预测二手房价格.首先,对数据集进行清洗并可视化展示.其次,运用百度地图进行POI处理扩充数据集,使得数据集接近现实情况.接着,按照数据特征对房价影响的重要程度进行了排序,选取重要的特征来训练模型.最后,通过数值结果分析,XGBoost模型对二手房的房价评估效果最好,尤其是经过POI处理的数据集和XGBoost模型的这种组合,对于深圳市的二手房价格具有极好的预测效果.  相似文献   

3.
为提高XGBoost算法预测精度,采用布谷鸟搜索算法全局优化XGBoost的超参数包括学习率、输出结点分裂的最小损失、树模型的最大深度和弱学习器的数量,构建CS-XGBoost模型训练数据集。实验结果表明,基于CS-XGBoost的收入分类模型的准确率、精确率、F1分数和AUC等指标分别为95.67%、97.17%、95.56%和97.96%,均优于Logistic回归、支持向量机、随机森林、XGBoost算法和基于网格搜索的XGBoost算法;基于CS-XGBoost的房价预测模型的决定系数、均方根误差及平均绝对误差分别为0.905 5、2.943 5及2.165 4,预测精度较XGBoost算法得到显著提升。  相似文献   

4.
本文提出了一种改进的XGBoost股票预测模型GC-XGBoost,并将该模型运用到股票市场进行股票价格短期预测.实验结果表明GC-XGBoost模型在MSE,MAE,R2三个评价指标上优于没有进行参数优化的XGBoost模型,说明GC-XGBoost模型比XGBoost模型提高了预测能力.  相似文献   

5.
为准确预测电力市场中的短期电价,提出了基于LSTM和XGBoost的组合预测模型。为了验证LSTM-XGBoost模型的有效性,该文先选用法国电力市场2019年1月1日至2020年12月31日的电价数据为训练集训练模型,对2021年1月1日不同模型预测的结果与实际电价值进行对比,得到LSTM-XGBoost以RMSE为0.74的误差率低于BP、LSTM、XGBoost的3.80、1.25、0.88,然后将算法应用到美国PJM电力市场,结果表明本文提出的LSTM-XGBoost组合预测模型MAPE平均值为1.83%,明显低于单一预测模型,也显著低于GRU-XGBoost组合模型,表明并非所有模型单一组合都能有效提高预测精度,该文提出的LSTM-XGBoost组合模型有效提升了短期电价的预测精度,且具有很强的普适性,可应用于电力市场短期电价预测,为市场参与者和监管机构提供有力决策依据。  相似文献   

6.
旅游客流量的预测受经济发展、季节因素影响等不确定性的影响,以三亚市旅游和文化广电体育局官网2012—2018年的月度统计数据的旅游客流量数据为研究对象,通过模型优选,基于XGB和GM模型对三亚市近7年的旅游客流量进行拟合,并对比两种模式预测的准确度。并在以上两种模式的拟合基础上,通过模型组合,对三亚市未来2019年、2020年的旅游客流量、入境过夜游客数量及旅游收入进行预测。  相似文献   

7.
为实现新零售优惠券的定向投放,提出了对用户优惠券使用行为预测的模型.该文采用XGBoost算法,突破了以TAM模型(技术接受模型)为基础解释个人优惠券使用意愿的传统方法,并基于口碑网的真实交易数据进行了特征提取和用户使用行为建模.在K折交叉验证之后通过变量重要性评分,确定了对消费者使用决策贡献度较高的特征,并与随机森林和GBDT(梯度提升决策树)算法进行了AUC(Area under curve)准确率的对比.该研究证明了基于XGBoost的集成学习算法在优惠券使用行为预测中的有效性,对新零售精准营销有重要的现实意义.  相似文献   

8.
为提高路段短时交通流的预测精度,选取路段平均旅行时间作为预测指标,建立了一种基于极端样度上升(extrem gradient boosting,XGBoost)的短时交通流预测模型。首先通过对交通流数据的分析,在考虑交通流时空特性的基础上,分别构建目标路段时间序列训练集、测试集以及时空序列训练集、测试集,然后基于XGBoost模型以及构建的训练样本集建立时间序列预测模型以及时空序列预测模型,并利用训练好的模型进行预测,最后将模型预测结果与线性回归模型、神经网络模型预测结果进行比较。实验结果表明:基于XGBoost的短时交通流预测模型能够对路段未来时段平均旅行时间进行比较准确的预测,其中时间序列预测模型均方根误差为5. 32,时空序列预测模型均方根误差为4. 82,均低于线性回归模型和神经网络模型,且相比于仅考虑时间因素的短时交通流预测模型,同时考虑时空因素的预测模型得到的误差更低,预测效果更好。  相似文献   

9.
特征构造的难题在数据挖掘过程中一直存在,传统固化的特征工程对于业务场景千变万化的数据挖掘任务所带来的效益十分有限,因此解决特征工程的特征构造问题已经成为数据挖掘的瓶颈之一;尤其在机器学习算法快速发展的情况下,特征逐渐成为模型中急需重视的部分。基于电商平台的用户行为数据,在原有特征群的基础上提出了二次组合统计特征的构建方法。利用二次交叉衍生出丰富而又切合业务场景的特征群,同时结合两种滑动窗口的方法,分别是定长滑动窗口获取更多的训练样本,变长滑动窗口获取具有时间权重的训练特征,以此来最大限度地还原出用户真实的行为习惯。最后,使用不同的特征组合结合降维的方法建立对照检验模型;并利用线性的逻辑回归模型、线性支持向量机以及树模型极端随机森林与XGBoost对模型进行交叉验证。结果表明,组合特征在树模型的算法中得到了非常好的表达效果;而且无论在线性模型还是树模型中衍生特征群模型的F1值都优于基础特征群。  相似文献   

10.
针对员工离职会增加企业运营成本,降低企业盈利能力的问题,提出使用机器学习的离职员工预测算法;通过Stacking集成学习算法组合Adaboost和Random Forest基本算法构建LRA预测模型,实现对某企业的员工离职预测;实验结果显示,LRA模型的预测准确率为89. 09%,相对于单一算法所构建验证的模型预测准确率明显提高,LRA模型的查准率、查全率以及F1度量指标证实模型的可行性与可靠性,通过对输入LRA模型的特征进行重要性排序,得到影响员工离职的主要因素有加班、工龄(0-3年)、收入、职业级别等,丰富已有研究的结论,有利于企业决策者,针对离职行为进行合理决策。  相似文献   

11.
基于主成分分析的住宅项目特征定价模型   总被引:11,自引:1,他引:10  
讨论了房地产特征价格模型在确定新建住宅项目单位销售均价中的应用,针对应用中出现的样本少、部分特征因素间存在相关性的问题,将主成分分析运用于房地产特征价格模型,建立了基于特征因素主成分分析的住宅项目特征定价模型.通过案例,分析了特征隐含价格的经济意义与作用,利用所建模型较准确地确定新建住宅项目的单位销售均价。  相似文献   

12.
针对股价数据具有高噪声、非线性和非平稳性等特征,使得股价精确预测非常困难的问题,提出小波-长短 记忆网络(LSTM-Wavelet)模型应用于股价预测。 首先,利用小波(Wavelet)分解降低金融时间序列的不稳定性,并 分析小波系数的细节特征;接着,发挥长短记忆网络(LSTM)模型的优势,深层挖掘小波系数中的长期依赖关系,对 分解后的各层小波系数分别建模预测;最后进行预测小波系数的数据重构。 使用中石油近两年的股价数据进行实 证分析,以每个交易日的开盘价、最高价、最低价、交易量为特征输入,预测当日中石油的收盘价。 结果表明:相较 于标准 LSTM 模型和小波- ARIMA (ARIMA-Wavelet)模型,提出的 LSTM-Wavelet 模型有更好的预测效果; 通过 小波分析将复杂股票数据,分解为长短记忆网络(LSTM)容易识别的小波系数,根据各层小波系数不同的数据特征 进行分层预测,提高了预测精度。  相似文献   

13.
刘清志  邢梓 《河南科学》2014,(4):645-649
随着我国经济的迅速发展,物价水平明显升高,居民的正常生活受到了很大影响.以居民消费价格指数(CPI)为研究对象,运用分形理论的相关预测知识,分析了我国2000—2011年的居民消费价格指数走势,结合散点图得出CPI指数还会持续上升的结论.在此基础上分析了CPI指数上升的原因,从政策和市场等方面提出相应措施以合理控制物价,确保市场运作的协调统一.  相似文献   

14.
为了分析沈阳市商品住宅市场情况,根据国内外编制价格指数的方法,结合沈阳市房地产市场的实际情况,采用特征价格法对沈阳市商品住宅价格指数进行研究.选择16个特征变量,采用半对数模型构建沈阳市商品住宅特征价格模型,并对模型进行检验,确定影响沈阳市商品住宅价格的14个特征变量及相互关系.通过价格指数计算公式,计算出2006年至2013年沈阳市商品住宅特征价格指数,得出沈阳市商品住宅价格增速正在逐年减缓的结论,并对未来市场可能出现的问题提出合理建议.  相似文献   

15.
为了有效地监管网络舆情,辅助管理人员进行决策,微博信息传播预测方法的研究具有重要应用价值。针对传统微博信息传播预测方法存在指标单一、预测效果较差问题,提出一种基于XGBoost模型的融合多特征微博信息传播预测方法。首先,分析微博传播网络和用户节点特性,提取出博主特征、微博内容特征、传播特征3类特征并构建数据集;接着,基于XGBoost方法分别构建微博累计转发量预测模型和微博最大转发深度预测模型;最后,通过模型在测试数据集上的平均绝对误差验证模型的预测效果。通过与线性回归等传统的预测方法比较分析可以看出,提出的预测方法能够取得良好的预测效果。  相似文献   

16.
张彦周  马秋香 《河南科学》2014,(12):2588-2592
针对商品住宅价格预测问题,分析整理了与房价相关的经济因素,首次提出将BP-Boosting回归算法运用到商品住宅价格的预测中.以郑州市房地产相关数据为实例,进行学习预测.模型结果表明,该方法简单有效,较为准确地预测出下一个季度的房价,与BP神经网络及灰色-马尔柯夫模型相比具有较为理想的预测精度.  相似文献   

17.
应用BP神经网络理论提出了我国股指期货市场价格走势短期预测模型。首先根据实验数据的特点分别构建单因素、多因素BP神经网络预测模型,再通过重复试验的方法,运用BP神经网络对股指期货价格序列进行训练,从而对股指期货价格进行预测。结果表明,通过BP神经网络预测模型得到的预测值与股指期货的实际价格有着很高的拟合度。  相似文献   

18.
房地产价格是房地产市场最重要和最直接的反映,而房地产价格受诸多因素的影响,使得房价与影响其变化的经济变量之间的定量关系无法用精确的数学表达式来描述.以昆明市作为研究对象,建立GM(1,1)模型,采用理论与实证相结合的方法进行研究,以历史价格数据预测未来价格,并检查其精度,为昆明市房地产投资决策管理提供一定的科学性借鉴.  相似文献   

19.
为提升铁路货运量预测精度和泛化能力,综合考虑铁路货运量时间序列数据的线性和非线性特征,提出了基于ARIMA-LSTM-XGBoost组合模型的铁路货运量预测方法。首先使用ARIMA模型对我国铁路货运量进行初步预测,再利用LSTM网络对残差进行校正,并将其与XGBoost模型结合,采用误差倒数法确定权重,构建一种加权组合模型。最后将组合模型与ARIMA、ARIMA-LSTM、LSTM、XGBoost模型进行对比,借助均方误差(MSE)、均方根误差(RMSE)、平均绝对值误差(MAE)、平均绝对百分比误差(MAPE)对上述模型的预测精度进行对比分析。使用2007年-2021年全国铁路货运量月度数据进行实验,实验结果表明:组合模型的MSE、RMSE、MAE、MAPE分别为0.011 9、0.109 4、0.068 3、1.775 2%,预测误差均低于上述对比模型,模型的预测精度和泛化能力都有所提升。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号