首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 953 毫秒
1.
聚丙烯复合材料老化实验周期长, 且单次实验采集的数据样本少, 使用传统机器学习方法进行预测的准确度较低. 为了解决聚丙烯复合材料老化数据样本少与预测准确性低的问题, 提出了一种虚拟样本生成(virtual sample generation, VSG)的集成学习预测方法. 首先, 对聚丙烯复合材料老化数据使用高斯混合模型(Gaussian mixed model, GMM)虚拟样本生成方法平滑生成验证有效的虚拟样本; 然后, 使用生成后的数据集建立集成学习预测模型, 该模型包含随机森林(random forest, RF)、极端梯度提升(extreme gradient boosting, XGBoost)算法、轻量级梯度提升机(light gradient boosting machine, LightGBM)算法以及分类梯度提升(categorical boosting, CatBoost)算法. 实验表明: 集成学习模型的 LightGBM 算法与 CatBoost 算法性能最优, 在测试数据上均方误差为 0.001 3 与 0.000 1, 比 RF 算法与 XGBoost 算法分别高出 0.4 与 0.2. 聚丙烯复合材料老化虚拟样本生成与集成学习方法可以有效解决实验周期长、单次实验采集的数据样本少的问题, 并可取得比单一机器学习算法更优的性能.  相似文献   

2.
聚丙烯复合材料老化实验周期长,且单次实验采集的数据样本少,使用传统机器学习方法进行预测的准确度较低.为了解决聚丙烯复合材料老化数据样本少与预测准确性低的问题,提出了一种虚拟样本生成(virtual sample generation,VSG)的集成学习预测方法.首先,对聚丙烯复合材料老化数据使用高斯混合模型(Gaussian mixed model,GMM)虚拟样本生成方法平滑生成验证有效的虚拟样本;然后,使用生成后的数据集建立集成学习预测模型,该模型包含随机森林(random forest,RF)、极端梯度提升(extreme gradient boosting,XGBoost)算法、轻量级梯度提升机(light gradient boosting machine,LightGBM)算法以及分类梯度提升(categorical boosting,CatBoost)算法.实验表明:集成学习模型的LightGBM算法与CatBoost算法性能最优,在测试数据上均方误差为0.001 3与0.0001,比RF算法与XGBoost算法分别高出0.4与0.2.聚丙烯复合材料老化虚拟样本生成与集成...  相似文献   

3.
为解决BP神经网络拟合非线性函数的预测结果误差较大问题,笔者将标准粒子群算法进行改进,形成基于免疫接种的粒子群算法(IPSO);然后将该算法与BP神经网络理论相结合,实现基于IPSO算法优化的BP神经网络非线性函数拟合算法。新的拟合算法首先确定BP神经网络结构,然后用IPSO算法优化初始权值和阈值,最后进行BP神经网络预测。数值实验表明,本文提出的IPSO算法提高了BP神经网络的拟合能力,减小了拟合误差,提高了拟合精度。  相似文献   

4.
为有效减少网络安全事件造成的损失,并对高风险网络资产进行漏洞评估,提出了一种基于量子粒子群轻量级梯度升降算法(QPSO-LightGBM:Quantum Particle Swarm Optimization-Light Gradient Boosting Machine)的多分类预测模型。该模型通过对少量过采样技术(MOTE:Minority Oversampling)进行合成从而达到数据平衡,采用量子粒子群算法(QPSO:Quantum Particle Swarm Optimization)实现参数的自动最优化,并使用LightGBM进行建模,进而实现网络资产的多分类预测。为验证模型的有效性,将所提模型与其他算法模型进行了比对,实验结果表明,该模型在各类预测性能指标上都取得了较好的效果。  相似文献   

5.
火源热释放速率的准确测量对深入理解火灾演变过程至关重要,然而目前被广泛使用的氧耗法所需设备造价昂贵,成本较高。该文提出了一种基于机器学习的综合性框架,用于输入温度数据预测火源热释放速率。基于火灾动力学模拟(FDS)软件模拟ISO 9705房间内不同参数的火灾场景,获取不同位置的温度数据,并建立火灾数据库。分别基于最小绝对收缩和选择(Lasso)、随机森林(RF)两种模型的递归特征消除(RFE)算法进行特征筛选,得到两个不同的低维特征子集,并设置对照组。基于不同的特征子集,分析比较了线性回归(LR)、K最近邻(KNN)和轻量级梯度提升机(LightGBM)3种典型模型对热释放速率的预测性能。结果表明:基于随机森林模型的递归特征消除算法筛选所得的特征子集训练的LightGBM模型预测效果最佳,预测结果的根均方误差(RMSE)和均绝对误差(MAE)分别为23.89 kW和15.49 kW,决定系数为0.991 6。该基于机器学习的综合性框架预测效果优异且实施成本较低,为预测火源热释放速率提供了有效途径。  相似文献   

6.
提出了新的GW-LS两段算法,很好地改善了自回归滑动平均(ARMA)模型参数估计的性能。首先摈弃传统的拟合到AR模型的思考方法,而是基于ARMA模型的相关函数用Gevers-Wouters(GW)算法对ARMA模型拟合到高阶滑动平均(MA)模型;然后在拟合的MA模型参数基础上,用最小二乘(LS)算法求解一个不相容的线性方程组,从而估计出ARMA模型参数。最终的仿真实例说明了本算法较高精度、较快速度的收敛特性。  相似文献   

7.
设计和实现了一种改进的曲面拟合内插水深插值算法。以实现海岸带数字高程模型(DEM)为背景,比较几种不同的水深插值算法的优点和不足,设计一种曲面拟合内插算法并建模实现,表明该算法具有插值结果较精确和鲁棒性较好等优点,应用在MGIS上进行海岸带DEM实验并取得了较好的实验结果。  相似文献   

8.
针对现有基于机器学习算法的船舶航速预测模型无法兼顾计算精度高、泛化能力强及计算速度快的问题,提出基于LightGBM的船舶航速预测模型,并以一艘安装有能效监测系统的内河船舶为研究对象,运用LightGBM算法建立以实时风速、风向、水深、水流速度、尾轴转速、轴功率和主机油耗为输入的船舶航速预测模型,并同时与RR、SVR、DT、BPNN、RF、GBDT和XGBoost七种机器学习算法的航速预测结果进行比较。结果表明:基于LightGBM建立的船舶航速预测模型的精度、泛化能力、运算速度均排名第二,综合性能最好,可在保证较高预测精度和较强泛化能力前提下,实现对船舶航速的快速预测。  相似文献   

9.
《河南科学》2016,(6):917-922
锚杆轴力的演变和发展规律对评价边坡稳定性极为重要.将平均影响值MIV与传统BP模型相结合,对锚杆轴力的影响因素进行筛选.同时引入粒子群算法与遗传算法对BP模型进行优化,在筛选时间、温度和开挖等变量的基础上,建立多个锚杆轴力预测模型.研究表明,MIV变量筛选能够提高预测模型的精度和减小误差.基于MIV变量筛选的PSO-BP模型在预测精度、模型稳定性上表现最好,在边坡锚杆轴力预测中具有一定的工程应用价值.  相似文献   

10.
使用机器学习算法对建筑能耗进行预测正逐渐成为建筑设计初期重要的决策辅助工具,机器学习算法的选择及其参数设置一直是机器学习领域研究的热点和难点。但现有研究大多从算法原理角度进行预测模型的选择及参数设置,训练样本集的特征信息未得到充分利用。为此,提出一种以样本量及样本分布特征为出发点的样本集质量分类方法,针对不同质量样本集测试不同机器学习算法的学习性能,制定不同质量样本集的算法选择及参数设置策略。分析样本特征与算法性能之间的关系,为建筑设计提供有效指导。  相似文献   

11.
针对目前高炉炼铁模型精度不高问题,提出建立高炉生产过程中精确的多目标优化模型.首先对高炉的海量数据进行了数据预处理,其次采用支持向量机、随机森林、梯度提升树、XGBoost、LightGBM、人工神经网络6种机器学习算法对高炉焦比、K值进行了预测,并采用特征工程和超参调优对机器学习预测进行了优化,最后采用新的集成学习方法进行预测.预测结果不仅精准度高而且具有很好的鲁棒性.在机器学习的基础之上,采用NSGA-Ⅱ遗传算法对高炉参数进行了多目标优化分析,得到了Pareto最优解,高炉操作者可以根据该多目标优化结果针对不同的需求选择相应的控制参数.  相似文献   

12.
现有广告转化率预估模型缺乏对深层特征间相互作用的研究,针对这一问题提出了一种新的混合模型.通过高效的梯度提升机(light gradient boosting machine,LightGBM)模型提取高阶组合特征,并结合基于区域的因子分解机(field-aware factorization machines,FFM)模型有效处理稀疏数据的优点进行转化率的预估.为了验证模型的有效性和泛化能力,在两个数据集上讨论了参数对预估结果的影响,并将模型与其他模型进行对比实验.实验结果表明提出的混合模型的预估结果更准确.  相似文献   

13.
为了探索基于样本数据的煤矿瓦斯爆炸风险预测,依据本质安全理念构建了预测瓦斯爆炸风险的指标集,结合机器学习与特征优化算法提出了信息增益(information gain,IG)与支持向量机(support vector machine,SVM)的组合模型,通过对优化后的14种特征信息的分类学习,完成对风险未知样本的预测任务.以全国100家煤矿企业为研究对象,使用不同模型分别预测瓦斯爆炸风险并全面分析和比较,实验结果表明,经过IG优化后的SVM模型预测正确率达到了95.45%,相对于单一SVM模型提高了9.09%,同时高于其他预测模型,证明了该组合模型在瓦斯爆炸风险预测领域的优越性.  相似文献   

14.
股票市场预测一直是金融市场分析中的热点和难点,一些传统的预测模型很难对股票市场做出有效的预测;针对这一问题,将分形插值方法与机器学习算法相结合,提出了分形插值与SVM以及分形插值与BP神经网络两种混合模型;所提的混合模型利用机器学习算法首先计算出分形插值所需要的插值点,然后建立分形插值外推模型对所需其他值进行预测;实证结果发现两个混合模型的预测效果均比单独使用分形插值模型预测效果更佳,预测精度更高;因此分形插值方法与机器学习算法相结合所得到的混合模型,能较好地预测诸如股票市场指数等非平稳金融时间序列。  相似文献   

15.
期权定价已成为金融市场的重要组成部分之一。 由于市场是动态的,准确预测期权价格非常困难。 因此,设计和发 展了各种机器学习技术来预测期权价格未来趋势。 比较了支持向量机(SVM)模型和人工神经网络(ANN)模型在期权价格预 测中的有效性。 在测试和训练阶段,2 种模型都使用公开可用的基准数据集 SPY option price-2015 进行测试。 2 种模型均采 用主成分分析(PCA)转换后的数据,以达到更好的预测精度。 另一方面,为了避免过拟合问题,将整个数据集划分为训练集 (70%)和测试集(30%)2 组。 将支持向量机模型与基于均方根误差(RMSE)的神经网络模型的结果进行了比较。 实验结果 表明:神经网络模型优于支持向量机模型,预测的期权价格与相应的实际期权价格吻合良好。  相似文献   

16.
一种新的蛋白质亚细胞定位预测训练集构造方法   总被引:1,自引:0,他引:1  
设计了一种新的蛋白质亚细胞定位预测训练集构造方法.该方法针对传统预测方法缺乏足够的实验标记数据的问题,基于主动学习策略从非实验标记蛋白质数据中主动选择有效数据,并与原有的实验标记数据共同训练预测模型,以提高基准分类器的预测精度.结合支持向量机分类器,该方法在病毒蛋白质独立测试集上进行了预测实验,测试结果表明,该方法能够有效地提高基准分类器的预测能力,性能优于现有的病毒蛋白质预测系统.  相似文献   

17.
GA-SVM对上证综指走势的预测研究   总被引:1,自引:0,他引:1  
将支持向量机和遗传算法结合,建立了一种智能数据挖掘技术(GA-SVM),并用于对上证综指市场走势进行了探索.在这个混合的数据挖掘方法中,GA用于RBF参数的设定以及特征集的选择,从而智能的找到SVM的最佳参数,减少SVM特征值的复杂度,提高了SVM算法速度.SVM用于判断未来股票市场的走势,并与统计模型、时间序列模型方法、神经网络进行了对比.实验证明,GA-SVM优于其他几种方法,这种方法对于股票上涨或下跌的预测研究是有效的.  相似文献   

18.
摘 要: 针对山区环境中引发泥石流的影响因素复杂多样,影响因子之间易存在相互耦合,以及梯度提升树(Light Gradient Boosting Machine,LightGBM)预测模型易陷入局部最优问题,提出了核线性判别分析法(Kernel Linear Discriminant Analysis,KLDA)与经布谷鸟算法(Cuckoo Search,CS)寻优后的LightGBM预测模型。首先,对传感器采集到的原始数据进行清洗,并将“清洗”后得到的规范数据通过KLDA进行降维处理,得到相关性低且贡献率高的影响因子作为预测因子。采用随机取样的方法对降维后数据进行规划,选取70%的数据用于训练模型,剩余30%用于验证模型。然后,将训练数据作为输入,基于CS-LightGBM算法训练出最优预测模型。最后,结合鹅项沟监测数据进行仿真。结果证明,此方法能够将复杂的泥石流影响因子降维成利于建模的预测因子,使预测模型具有较好的预测准确度,为泥石流灾害预测方面的研究提供了新的思路。  相似文献   

19.
为解决高速公路路基沉降量难以获取的难题,提出一种基于主成分分析(principal compohent analysis,PCA)的相关向量机(relevance vector machine,RVM)路基沉降量预测方法。通过主成分分析法将多个易获取的土体常规物理参数降维成少数且独立的变量,借助相关向量机模型反映路基沉降量与4个主成分变量之间的非线性映射关系,建立基于PCA-RVM的高速公路路基沉降量预测模型。将该模型应用于工程实例,在同样学习样本情况下与4种神经网络预测模型对比分析,结果表明:PCA-RVM预测模型通过分析各因素的相关性与贡献率,将多个影响因素合理化为少数主成分变量,在信息筛选方面明显优于其余4种模型;各模型预测结果显示,在路基沉降量预测结果的相对误差及均方差方面,PCA-RVM预测模型均占据较大优势。PCA-RVM模型具有精度高、离散性小、可靠度高等优点,为高速公路路基沉降量预测提供了一种新方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号