首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 62 毫秒
1.
针对安徽省人均GDP预测问题,以安徽省2000—2018年人均GDP数据为研究区间,其中2000—2017年数据作为训练集,2018年数据作为测试集,提出了一类新的预测评价指标-邻近度及基于邻近度的组合预测模型,并引入一种新的组合权系数求解方法;首先对训练集进行单项预测,即对训练集数据进行指数预测、抛物线预测和移动平均预测,接下来对各单项预测值综合考虑,建立基于邻近度的加权几何平均组合预测模型,通过求解模型得出各单项预测权系数进而求出基于邻近度的组合预测值,最后分别在测试集和训练集上与其他预测方法预测结果进行比较,并预测安徽省2019—2021年人均GDP数据。  相似文献   

2.
为提高路段短时交通流的预测精度,选取路段平均旅行时间作为预测指标,建立了一种基于极端样度上升(extrem gradient boosting,XGBoost)的短时交通流预测模型。首先通过对交通流数据的分析,在考虑交通流时空特性的基础上,分别构建目标路段时间序列训练集、测试集以及时空序列训练集、测试集,然后基于XGBoost模型以及构建的训练样本集建立时间序列预测模型以及时空序列预测模型,并利用训练好的模型进行预测,最后将模型预测结果与线性回归模型、神经网络模型预测结果进行比较。实验结果表明:基于XGBoost的短时交通流预测模型能够对路段未来时段平均旅行时间进行比较准确的预测,其中时间序列预测模型均方根误差为5. 32,时空序列预测模型均方根误差为4. 82,均低于线性回归模型和神经网络模型,且相比于仅考虑时间因素的短时交通流预测模型,同时考虑时空因素的预测模型得到的误差更低,预测效果更好。  相似文献   

3.
为有效进行城市空气质量预测、推进城市空气污染防治,弥补传统统计学模型在大数据时代背景下对城市空气质量预测准确率低、容错能力差等问题,提出利用随机森林回归构建城市空气质量预测模型;综合考量污染物浓度、气象参数、时间参数等多方面影响因素,通过网格搜索法调整参数的最优组合,构建基于随机森林回归算法的城市空气质量预测模型;基于重庆市2017-01-01—2020-07-31的指标数据,对重庆市空气质量进行预测分析,结果表明:在模型下训练集与测试集的确定性系数R~2均在99%以上,均方误差D_(MSE)和平均绝对误差D_(MAE)在训练集和测试集上的取值均在可接受范围内,证实模型具有运行速度快、预测误差小、具有较高的预测精度等优点,具备较好的学习能力与泛化能力。  相似文献   

4.
针对工程造价变化的时变性、混沌性,提出一种混沌理论和最小二乘支持向量机的工程造价预测模型.首先收集工程造价历史样本并进行相应的预处理,然后根据混沌理论确定最优延迟时间和嵌入维数,重建工程造价的训练集和测试集,最后用最小二乘支持向量机建立工程造价预测模型,并采用具体建筑工程造价数据进行仿真测试.结果表明,相对其他工程造价预测模型,该模型可以很好地反映工程造价的变化趋势,提高工程造价的预测准确性.  相似文献   

5.
针对矿井回采工作面瓦斯涌出量预测精度欠佳的问题,建立基于极端梯度提升(XGBoost)瓦斯涌出量预测模型。首先,为解决瓦斯涌出量影响因素维数高和信息冗余等问题,在预测模型中引入主成分分析法(PCA)对11种影响因素降维。其次,通过贝叶斯优化算法(BOA)对XGBoost中超参数进行优化以提高预测模型的精度。最后,将训练集数据作为预测模型的输入进行训练,利用训练好的模型对测试集数据进行验证,并与传统的BP神经网络和支持向量机进行对比。结果表明:PCA-BO-XGBoost模型的平均绝对误差为0.070 3,均方根误差为0.095 7,能够满足对瓦斯涌出量预测的精度要求。与其他机器学习算法相比,建立的模型预测精度更高、耗时更短、效率均更高,对煤矿井回采工作面瓦斯涌出量的预测精度和效率提升具有借鉴作用。  相似文献   

6.
为探究不同形态城市道路交通事故的发生原因,将事故形态的影响因素进行筛选和约简,选取3种不同算法对事故形态进行分析与预测,对比预测模型的准确性。采用粗糙集理论对原始交通事故形态影响因素变量进行转换和约简,获得满足建模要求的试验数据,并按照总体一致原则把数据等分为训练集和测试集。基于C5.0决策树算法,构建交通事故形态预测决策树模型并进行模型准确性验证,生成交通事故形态规则集;另外,采用似然比检验筛选自变量构建交通事故形态多元Logistic回归预测模型;构建多层感知器(MLP)神经网络预测模型,检验模型训练集与测试集的准确率并进行对比分析。结果表明:3种模型中,C5.0决策树算法对交通事故形态在训练集和测试集中的预测准确率分别为80.39%与79.63%,高于多元Logistic回归模型和MLP神经网络模型。采用C5.0决策树算法得到交通事故形态主要影响因素为交通方式的选取,行驶在道路横断面位置,违法行为与行驶状态等,解释性良好。研究可为分析及预测城市道路交通事故形态,分析事故产生原因提供方法参考,还可为交通管理部门提供决策依据。  相似文献   

7.
为了准确描述光纤通信网络的安全状态,保证光纤通信网络的安全通信,提出一种基于模式识别的大规模光纤通信网络安全分析模型.收集光纤通信网络安全状态的数据,按3∶1的比例划分为训练集和测试集,采用模式识别对光纤通信网络安全的训练集进行学习,建立光纤通信网络安全预测模型;采用测试集对光纤通信网络安全预测模型的性能进行测试.结果表明,该模型不仅提高了光纤通信网络安全预测精度,加快了光纤通信网络安全分析的速度,而且可以满足复杂多变的光纤通信网络安全分析要求.  相似文献   

8.
为了克服传统机器学习算法产量预测模型的缺点,以深度森林算法理论为基础,综合油井相关各项数据,建立了油井产量预测新模型。首先应用KNN最邻近方法和Z-Score标准化方法对油井相关数据进行预处理,利用MDI特征选择方法选择对油井产量影响最大的特征向量,然后将选出的特征向量作为深度森林模型的输入变量,建立深度森林产量预测模型,利用网格化搜索优化模型参数,最后在测试集上运行模型,对模型性能进行评估。研究结果表明,相对于BP神经网络等传统机器学习算法模型,深度森林模型的产量预测精度更高,可以准确预测油井产量,同时相对于深度神经网络等复杂学习算法,该算法参数少、调参及应用简单,为油井产量预测提供了一种新的方法和思路。  相似文献   

9.
当前基于机器学习的材料属性预测研究中,通常采用数据库获取的所有数据样本,通过计算其高维向量表示来训练预测模型。然而材料数据库样本的高冗余性导致了训练的模型具有很强的偏向性和过拟合的现象。为此,提出一种剔除数据集中冗余性样本的算法,从数据集中选择具有代表性样本;通过使用多种机器学习算法预测材料属性并进行比较,结果表明如果没有实行基准数据集的冗余控制,即使是随机原始数据集也可以由于高冗余样本而得到很好的预测性能指标;研究还发现使用具有代表性样本进行训练实际可以帮助训练出具有更高泛化能力和更具预测性的模型。因此,提出降低冗余度是评估材料性能预测模型的必要步骤。  相似文献   

10.
一种新的蛋白质亚细胞定位预测训练集构造方法   总被引:1,自引:0,他引:1  
设计了一种新的蛋白质亚细胞定位预测训练集构造方法.该方法针对传统预测方法缺乏足够的实验标记数据的问题,基于主动学习策略从非实验标记蛋白质数据中主动选择有效数据,并与原有的实验标记数据共同训练预测模型,以提高基准分类器的预测精度.结合支持向量机分类器,该方法在病毒蛋白质独立测试集上进行了预测实验,测试结果表明,该方法能够有效地提高基准分类器的预测能力,性能优于现有的病毒蛋白质预测系统.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号