首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 343 毫秒
1.
聚丙烯复合材料老化实验周期长,且单次实验采集的数据样本少,使用传统机器学习方法进行预测的准确度较低.为了解决聚丙烯复合材料老化数据样本少与预测准确性低的问题,提出了一种虚拟样本生成(virtual sample generation,VSG)的集成学习预测方法.首先,对聚丙烯复合材料老化数据使用高斯混合模型(Gaussian mixed model,GMM)虚拟样本生成方法平滑生成验证有效的虚拟样本;然后,使用生成后的数据集建立集成学习预测模型,该模型包含随机森林(random forest,RF)、极端梯度提升(extreme gradient boosting,XGBoost)算法、轻量级梯度提升机(light gradient boosting machine,LightGBM)算法以及分类梯度提升(categorical boosting,CatBoost)算法.实验表明:集成学习模型的LightGBM算法与CatBoost算法性能最优,在测试数据上均方误差为0.001 3与0.0001,比RF算法与XGBoost算法分别高出0.4与0.2.聚丙烯复合材料老化虚拟样本生成与集成...  相似文献   

2.
聚丙烯复合材料老化实验周期长, 且单次实验采集的数据样本少, 使用传统机器学习方法进行预测的准确度较低. 为了解决聚丙烯复合材料老化数据样本少与预测准确性低的问题, 提出了一种虚拟样本生成(virtual sample generation, VSG)的集成学习预测方法. 首先, 对聚丙烯复合材料老化数据使用高斯混合模型(Gaussian mixed model, GMM)虚拟样本生成方法平滑生成验证有效的虚拟样本; 然后, 使用生成后的数据集建立集成学习预测模型, 该模型包含随机森林(random forest, RF)、极端梯度提升(extreme gradient boosting, XGBoost)算法、轻量级梯度提升机(light gradient boosting machine, LightGBM)算法以及分类梯度提升(categorical boosting, CatBoost)算法. 实验表明: 集成学习模型的 LightGBM 算法与 CatBoost 算法性能最优, 在测试数据上均方误差为 0.001 3 与 0.000 1, 比 RF 算法与 XGBoost 算法分别高出 0.4 与 0.2. 聚丙烯复合材料老化虚拟样本生成与集成学习方法可以有效解决实验周期长、单次实验采集的数据样本少的问题, 并可取得比单一机器学习算法更优的性能.  相似文献   

3.
建立地质灾害易发性评价模型并开展易发性评价,对提高区域地质灾害预报预警效率和精度有重要意义.然而,如何建立既切合区域实际、又具有推广适用价值的地质灾害易发性评价模型是制约地质灾害预报预警的关键科学问题.以云南省南华县2015年地质灾害详查数据为基础,选择地形、地貌等11个因子,基于均值法,采取梯度提升树算法(XGBoost、LightGBM、CatBoost)、信息量模型与地理加权回归模型开展了地质灾害易发性评价研究.结果表明:(1)地理加权回归模型预测结果存在过拟合现象,信息量模型则存在欠拟合现象;(2)均值法效果最好,AUC(Area Under Curve)值为0.933 7,精度较地理加权回归模型、XGBoost、LightGBM、CatBoost、信息量模型分别提高了1.7%、1.8%、2.0%、3.8%、4.0%;(3)Catboost对正样本的预测效果最差,但是对负样本的预测效果最好,而XGBoost对正样本的预测效果最好,对负样本的预测效果很差,基于3种梯度算法的均值法则对正负样本的预测精度有了明显提高;(4)南华县地质灾害主要诱因有道路修建、断层活动、降雨冲刷、河流侵...  相似文献   

4.
针对传统的区域滑坡易发性评价建模过程可能存在的样本数据量纲不统一以及模型参数选取误差等问题,本文以陕西省留坝县为研究区,选取高程、坡度、水系、降雨量、地层岩性等10个评价因子,采用确定性系数模型(CF)计算各评价因子的敏感值作为支持向量机模型(SVM)和随机森林模型(RF)的输入样本属性值,引入麻雀搜索算法(SSA)分别对SVM模型和RF模型的参数进行优化,获取最优参数对两种模型进行训练,最终构建了CF-SSA-SVM和CF-SSA-RF模型,从而对整个研究区进行预测,完成滑坡易发性评价,并通过受试者工作特征曲线(ROC)对两种模型进行精度验证。结果表明,两种模型的评价结果均有较多滑坡点落在极高易发区,无滑坡点落在极低易发区,评价结果均有较高的准确率。其中,CF-SSA-RF模型的成功率和预测率曲线AUC值分别为0.994和0.940,高于CF-SSA-SVM模型;并以三处典型滑坡为例进行验证,结果显示易发性分区与历史滑坡点分布较为吻合。进一步表明CF-SSA-RF模型更适用于留坝县的滑坡易发性评价,为当地滑坡灾害风险评估提供了指导依据。  相似文献   

5.
地震会引起地表振动及破坏,同时加大滑坡、崩塌、泥石流等次生灾害的发生概率,对位于地震带区域城市进行地质灾害易发性预测,是地质灾害防治的有效措施。为了探究地震带区域地质发育程度对地质灾害的影响,以松潘-较场典型地震带的平武县为例,从地形地貌特征、地层地质条件、气象水文、地震带发育特征、土壤植被、人类工程活动影响六个方面选取地质灾害的诱发因子,采用信息量模型、信息量-AHP和信息量-随机森林(RF)三种评价模型对平武县地质灾害进行易发性评价,结果表明信息量-RF模型的对比分析结果优于其他两种模型,ROC曲线精度评估信息量-RF模型的AUC值(0.991)高于信息量模型(0.931)和信息量-AHP模型(0.920),说明基于信息量耦合随机森林的综合易发性评价模型更适用于地震带地区的地质灾害易发性评价,具有良好的预测精度。  相似文献   

6.
为提高光伏电站辐照强度的预测精度,提出一种基于长短时记忆网络(long short term memory network,简称LSTM)和轻梯度提升机(light gradient boosting machine,简称LightGBM)的组合模型.以LightGBM模型的预测结果作为LSTM模型的一个特征输入,然后采用误差倒数法对以上两种模型的数据进行加权组合,得到组合模型的预测值.算例分析结果表明:与其他3种模型比较,该文组合模型的预测精度最高.  相似文献   

7.
以临潼区作为研究区,在收集资料的基础上,选取12类影响因素作为评价因子,采用滑坡相对点密度分析滑坡点与评价因子的空间分布关系,通过Spearman对因子相关性进行分析,剔除地形起伏度因子;分别采用支持向量机模型(support vector machine,SVM)与逻辑回归模型(logistic regression,LR)对区内滑坡易发性进行评价,评价结果表明:SVM、LR模型的预测准确率分别为81. 8%、86. 4%。在此基础上,通过建立max{LSI(SVM)、LSI(LR)}函数,提出SVM-LR模型并用于研究区滑坡灾害易发性评价中。最后采用受试者特性曲线(receiver operate curve,ROC)对3种模型的预测精度进行检验与对比,检验结果表明:SVM-LR模型的成功率与预测率均高于SVM、LR模型,在极高易发区—高易发区内,滑坡灾害点所占百分率提高了2. 8%。研究结果可以为滑坡易发性评价提供一种新的思路。  相似文献   

8.
区域滑坡易发性制图对滑坡灾害的防治非常有意义。以江西省上犹县滑坡为例,首先基于遥感(remote sensing, RS)和地理信息系统(geographic information system, GIS)平台获取11个滑坡评价因子;进一步利用频率比(frequency ratio, FR)联接方法和支持向量机(support vector machine, SVM)模型耦合出FR-SVM模型进行滑坡易发性预测,并对结果进行易发性分级;同时建立以原始评价因子作为模型输入变量的单独SVM模型,再次对上犹县进行滑坡易发性预测制图;最后通过受试者特征工作曲线下的面积(area under receiver operating characteristic curve, AUC)曲线开展FR-SVM和单独SVM建模工况下的精度验证分析。结果表明:FR-SVM模型对于区域滑坡易发性制图具有比单独SVM模型更好的预测性能。FR-SVM和单独SVM模型的AUC值分别为0.893和0.798,进一步表明FR-SVM模型在描述滑坡易发性指数分布及评价因子对滑坡发育影响特征方面要优于单独SVM模型。  相似文献   

9.
蛋白质类泛素化修饰位点的准确识别对基础研究和药物开发都具有重要意义.该文提出了一种基于蛋白质序列特征的类泛素化修饰位点预测模型.该模型结合氨基酸的物理化学属性统计特征和氨基酸序列二元语法模式特征,训练一种轻量型梯度提升机(Light gradient boosting machine,LightGBM)分类器预测某个蛋...  相似文献   

10.
随着物联网、大数据技术的深入发展,一型装备交付部队的同时,往往需同步提供数字孪生模型以优化视情维护过程。论文基于某型号飞机试飞数据,提出一种将机器学习技术用于飞机起落架着陆载荷预测模型构建的方法。以某型号飞机飞行参数为输入,以传感器实测的左起落架垂向载荷为输出,经数据清洗和特征降维后,分别建立极端梯度提升(extreme gradient boosting, XGBoost)、随机森林(Random Forest)和多层前馈(back propagation, BP)神经网络模型,并对所建模型进行调优。经对比和评估,XGBoost模型具有最高的预测精度,对起落架载荷绝大多数样本的预测误差均保持在6%以内,同时建模时间少,泛化能力强,为起落架载荷预测最优模型。  相似文献   

11.
机器学习用于地质灾害的易发性评价分析是当前研究的热点之一,不同的学习模型其效果不尽相同。为合理有效地评价滑坡地质灾害的易发性,依托浙江省温州市飞云江流域地质灾害的调查数据,应用地理信息系统(Geographic Information System,GIS)技术提取坡度、坡向、坡形、地表覆盖、地形湿度指数(Topographic Wetness Index,TWI)、极端小时降雨量、内摩擦角、黏聚力、容重与风化层厚度10个滑坡致灾因子,基于极端梯度提升算法(eXtreme Gradient Boosting,XGBoost)构建模型用于滑坡地质灾害的易发性多分类评价。模型结果通过多分类混淆矩阵进行评价,并与支持向量机(Support Vector Machine,SVM)模型进行精度比对分析。研究结果显示,训练后的XGBoost 算法模型对测试集中极高易发区识别的召回率和精确率分别达到了97.92%和98.06%,F1值达到97.99%,均优于SVM,可为研究地区的滑塌地质灾害易发性评价提供模型支持。  相似文献   

12.
基于生理信号客观评估心理压力状态成为目前的研究热点,但最佳评估算法有待进一步探索.本文选择心算任务诱发受试者的心理压力,采集了21位在校大学生的脑电、心电、皮肤电导、脉搏波4种生理信号.提取各生理信号时域和频域的多种特征,使用方差分析(ANOVA)、最大相关最小冗余(mRMR)、单个特征支持向量机(SVM)分类准确率、随机森林(RF)特征重要性、梯度上升决策树(GBDT)特征重要性、极端梯度提升(XGBoost)特征重要性6种特征选择方法筛选出有效特征,利用SVM、K近邻(KNN)、高斯朴素贝叶斯(GNB)、自适应提升算法(Adaboost)、GBDT、XGBoost 6种分类器对提取的特征进行分类.结果得出,GBDT特征筛选与XGBoost分类器的组合模型对心理压力的等级评估效果最佳.  相似文献   

13.
针对认知诊断方法未考虑学生的答题共性和矩阵分解方法未考虑学生知识点掌握个性的问题,提出一种结合认知诊断与XGBoost(eXtreme Gradient Boosting)的学生表现预测方法(PRNCD-XGBoost):首先,根据试题中知识点之间的共现关系探索知识点之间的相似性,并结合试题-知识点二分图挖掘试题中各知识点所占权重,从而进行认知诊断;然后,用认知诊断阶段的预测结果对历史得分矩阵进行填充;最后,采用非负矩阵分解方法提取出包含认知诊断因素的学生答题共性特征进行得分预测。并在ASSISTments2009和ASSISTments2017数据集上,将PRNCD-XGBoost方法与PMF、NeuralCD、PR-NCD、NMF-XGBoost、MNMF-XGBoost等方法进行对比实验。实验结果表明:PRNCD-XGBoost方法在学生表现预测方面具有更高的预测精确度。  相似文献   

14.
唐中君  吴凡  倪浪 《科技促进发展》2020,16(10):1221-1229
电影首映日票房预测对该日排片、后续放映日票房及总票房有显著影响。在构建考虑竞争的电影首映日票房预测变量集的基础上,建立首映日票房集成预测模型。首先使用多元线性回归(multiple linear regression, MLR)、支持向量回归(support vector regression, SVR)、套索回归(Least absolute shrinkage and selection operator, Lasso)和极端梯度提升(Extreme Gradient Boosting, XGBoost)等算法建立基学习器,随后使用XGBoost算法作为原学习器构建堆栈集成预测模型,最后利用收集到的数据进行对比实验。实验证明,加入竞争变量的电影首映日票房预测变量集适用于首映日票房预测;相比单一模型,提出的集成预测模型的准确性、泛化性能和稳定性均有提升,相比较传统预测方法对首映日票房预测更准确。提出的集成预测模型有助于提升首映日票房排片的有效性。  相似文献   

15.
为深入挖掘驾驶人因素与交通事故之间的关系,提出一种基于SMOTENC和极端梯度提升(extreme gradient boosting, XGBoost)的驾驶人交通状态优劣分类算法。首先针对交通事故发生与否不平衡的特点,使用SMOTENC算法对数据进行上采样并在采样过程中加入随机扰动,解决了数据不平衡问题。然后使用Embedded算法结合L1正则化,通过模型评估完成对特征子集的选择。最后使用机器学习的方法将XGBoost算法用于执行数据的特征提取和分类过程。实验表明,在对驾驶人的交通状态进行综合评价的任务上,XGBoost模型的准确率为99.85%,相较于随机森林、支持向量机等对照组模型,提升了约1.12%-1.80%。除此之外,使用SMOTENC算法对数据不平衡问题进行处理后,通过混淆矩阵观察到模型对于好坏个体均具备较好的识别能力。  相似文献   

16.
为了在围岩类别不平衡的条件下实现围岩类别有效判断,进而提高隧洞工程施工仿真准确性,基于改进极限梯度提升(XGBoost)不平衡围岩超前分类方法进行隧洞工程施工仿真研究。采用自动邻域确定合成过采样(AND-SMOTE)方法优化围岩类别不平衡性,并采用改进的XGBoost不平衡围岩超前分类模型进行围岩超前分类,进而优选仿真参数,提高仿真结果的准确性,其中,以模型交叉验证平均准确率为目标,采用哈里斯鹰优化(HHO)算法自动优化XGBoost超参数,以提高围岩分类精度。工程应用表明,相比未改进的XGBoost不平衡、KNN、SVC等6个模型,改进的XGBoost不平衡围岩超前分类模型分类精度更高;考虑围岩类别不平衡性后,改进的XGBoost不平衡围岩超前分类模型分类精度提高了8.6%;此外,基于围岩超前分类的隧洞工程施工仿真结果与实际进度的相对偏差相比传统仿真降低了11.3%,更符合工程实际。  相似文献   

17.
在恶劣的油藏条件下,化学驱提高采收率方法的可行性主要在实验室进行,以探究化学驱方案在现场实施的可能效果,但此类实验通常昂贵且费时。为了提高筛选效率和研究变量关系,进行了3个聚合物驱油实验项目,其次通过构建14种机器学习基础模型来预测低渗透砂岩聚合物驱油实验的效率。结果表明多层感知机(MLP)、随机树(RF)和极限梯度上升(XGB)模型表现最佳,它们在测试集的确定系数均为0.99,均方根误差分别为0.855、0.836和0.859。模型表明特征重要性由强至弱依次为含水率、累积注入孔隙体积、渗透率、非均质系数、孔隙度、聚合物注入量、聚合物浓度、注入压力。本研究为室内物理低渗透砂岩聚合物驱提供了可靠的数据,给出了14种机器学习模型预测性能直接对比,建立了高拟合高泛化高稳定低误差的低渗透砂岩聚合物驱预测模型,这将有助于化学驱方案快速在低渗透储层应用,以及降低失败风险。  相似文献   

18.
针对传统的协同过滤推荐算法中评分矩阵过于稀疏和算法准确度不高的问题,提出一种融合矩阵分解和XGBoost算法的推荐算法(MFXGB,Matrix Factorization XGBoost),其特点是利用SVD++算法(SVD,Singular Value Decomposition)对用户项目评分矩阵进行填充,避免过多的缺失值对算法精确度的影响,再利用XGBoost(eXtreme Gradient Boosting)算法训练有监督的模型用于预测用户评分.为了克服计算成本过高的困难,提出利用K-均值聚类方法进行特征提取用于训练XGBoost模型.将MFXGB算法应用于MovieLens数据集进行实验分析,结果显示,MFXGB算法的推荐精确度比传统的3种方法分别提高了8.91%、10.18%和11.79%,效果明显优于传统的推荐算法.  相似文献   

19.
商品预测是使用以往商品信息去估计和推断未来商品的销售趋势,并以此作为对商品进行合理调配与规划的依据.为实现对商品销售的精确预测,在GBDT基础上,提出了一种层次化集成预测模型(HGBDT).针对数据表征的高维问题,基于Bagging思想,在特征空间构建了该模型,实现对商品的有效描述,以此提高预测模型的性能与泛化能力.在开放数据库上的实验结果验证了本文模型的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号