首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 187 毫秒
1.
采用决策树(DT)模型及其衍生的随机森林(RF)模型、极端随机树(ET)模型和梯度提升树(GBDT)模型,对用于甲烷吸附的金属有机框架材料(MOFs)进行了高通量的计算筛选。利用1 800种材料的特征向量数据,计算了特征向量之间的相关性并进行重要度分析,发现材料的结构特征与化学信息特征的相关性不大,但是结构特征的重要度较高。将数据库中的1 260种材料作为训练集并使用上述4种机器学习模型进行训练,再将剩余的540种材料作为测试集对模型的筛选结果进行比较和评估。接收者操作特征(ROC)曲线和查准率-查全率(PR)曲线结果表明,GBDT模型自身稳定性强且预测结果精度高,因而成为筛选吸附甲烷的高性能金属有机框架材料的最佳模型。针对RF模型和GBDT模型进行参数优化,发现协调单个决策树的个数和决策树节点的分裂特征数量能够有效改善RF模型的性能,而调节回归树的学习速率和迭代次数可有效改善GBDT模型性能。最后基于540种材料的测试集,利用GBDT模型筛选出前20种高性能吸附材料,分析了它们的主要特征向量与甲烷吸附量之间的关系。  相似文献   

2.
针对梯度提升决策树(gradient boosting decision tree, GBDT)参数难以选择的问题, 提出一种基于改进鲸鱼优化算法(improved whale optimization algorithm, IWOA)的GBDT回归预测算法. 首先, 提出一种改进的鲸鱼优化算法, 利用混沌映射初始化种群提高种群多样性, 引入惯性权重与差分进化算法中的变异交叉策略解决迭代后期易陷入局部最优的问题; 其次, 利用IWOA对GBDT的关键参数寻优, 避免参数选择的盲目性, 提高回归预测模型的泛化能力; 最后, 建立IWOA-GBDT回归预测模型, 并利用UCI数据集对模型进行验证. 实验结果表明, 相比于决策树、 支持向量机、 Adaboost和GBDT算法, 该模型算法具有更好的拟合效果, 并有一定的实用价值.  相似文献   

3.
针对风电功率预测问题进行研究,为了提高风电功率预测的精度,首先利用拉依达法则对原始数据进行预处理,以此来保证数据的完整性和准确性,其次利用梯度提升决第树算法构建时间预测模型,并对该模型进行计算和验证。根据本研究的日前预测问题,将其同常规BP神经网络算法相比较,结果显示所提出的基于GBDT的风电功率预测模型较BP神经网络在该问题上具有更优的预测性能。  相似文献   

4.
为了减少电动汽车大规模集成到电网造成的不利影响,提出了一种能够实现充电站充电负荷精准预测的方法。该方法利用LightGBM(light gradient boosting machine)与XGBoost(eXtreme gradient boosting)模型构建线下?线上组合模型。考虑充电负荷、时间、温度、天气等历史数据,利用LightGBM模型初步建立充电负荷线下预测模型;基于XGBoost模型,以线下预测模型输出负荷和实际负荷的误差为优化目标,实时变化的交通流量为协变量,建立线上预测模型,并对初步预测结果进行误差修正。某市实际充电站预测结果表明,相比于随机森林(RF)、LightGBM模型、XGBoost模型、多层感知机(MLP)以及LightGBM?RF组合模型,该组合模型具有更高的预测精度,同时可以准确预测不同充电站的实时充电负荷。  相似文献   

5.
针对热镀锌钢卷力学性能预报建模条件属性选取难、预报精度不足的问题,研究了热镀锌钢卷力学性能梯度提升树(gradient boosting decision tree,GBDT)预报模型。利用互信息差算法综合评估工艺参数、化学成分和钢卷尺寸参数等条件属性的相对重要性以及属性之间冗余性,进行模型条件属性筛选;采用同分布原理进行样本划分,结合网格搜索法和交叉验证法优化模型参数,建立力学性能GBDT预报模型。将GBDT模型预报结果与随机森林(random forest,RF)、AdaBoost算法和BP神经网络的预报结果进行比较,比较表明GBDT模型优于其他模型,90%的数据样本预测的绝对误差小于14.24 MPa,94.6%的数据样本相对误差在6%范围内,具有更高的预测精度。  相似文献   

6.
采用贡献度与相关性分析(correlation analysis)相结合的办法从目前最常用的244种股票技术指标中提取最优技术指标,进而利用梯度提升树(GBDT)算法对股票的趋势进行预测.对由贡献度、相关性分析与GBDT算法构成的组合模型(简称GBDT组合模型)进行实证分析,首次将GBDT算法应用于沪深300股票的预测.对由不同算法构成的组合模型的预测精度也进行比较分析.实验结果表明,GBDT组合模型在预测精度上优于线性回归组合模型及随机森林组合模型.  相似文献   

7.
列控车载设备的健康管理和故障预测是实现高速铁路关键装备智能化视情维护的重要途径.为了克服列控车载设备故障建模的复杂性和健康监测手段受限等问题,充分运用现场收集的设备运行记录数据,提出一种基于数据驱动的列控车载设备故障预测体系框架.建立了高速列车列控车载设备运行数据管理平台,基于大量历史现场数据构建训练及测试样本集,运用极端梯度提升(eXtreme Gradient Boosting,XGBoost)算法实施特定故障类型的模型训练与学习,并将所得故障模型用于故障概率的预测分析.以CTCS2-200H型列控车载设备为对象,运用实际数据对所提出的故障建模方法进行了验证,对不同建模样本规模、故障类型维度下的模型性能以及不同建模算法性能进行了对比.结果表明:基于XGBoost算法的建模方法能够有效揭示各特征量与故障之间的关联,所采用树的深度值越高,迭代收敛速度越快;相较于GBDT、RF算法,基于XGBoost的建模方法能够实现更高的预测正确率,在给定样本条件下达到稳定正确率所需训练时间分别减少了78.55%、12.47%,验证了该方法在大规模数据条件下的适用性和性能优势.  相似文献   

8.
聚丙烯复合材料老化实验周期长,且单次实验采集的数据样本少,使用传统机器学习方法进行预测的准确度较低.为了解决聚丙烯复合材料老化数据样本少与预测准确性低的问题,提出了一种虚拟样本生成(virtual sample generation,VSG)的集成学习预测方法.首先,对聚丙烯复合材料老化数据使用高斯混合模型(Gaussian mixed model,GMM)虚拟样本生成方法平滑生成验证有效的虚拟样本;然后,使用生成后的数据集建立集成学习预测模型,该模型包含随机森林(random forest,RF)、极端梯度提升(extreme gradient boosting,XGBoost)算法、轻量级梯度提升机(light gradient boosting machine,LightGBM)算法以及分类梯度提升(categorical boosting,CatBoost)算法.实验表明:集成学习模型的LightGBM算法与CatBoost算法性能最优,在测试数据上均方误差为0.001 3与0.0001,比RF算法与XGBoost算法分别高出0.4与0.2.聚丙烯复合材料老化虚拟样本生成与集成...  相似文献   

9.
聚丙烯复合材料老化实验周期长, 且单次实验采集的数据样本少, 使用传统机器学习方法进行预测的准确度较低. 为了解决聚丙烯复合材料老化数据样本少与预测准确性低的问题, 提出了一种虚拟样本生成(virtual sample generation, VSG)的集成学习预测方法. 首先, 对聚丙烯复合材料老化数据使用高斯混合模型(Gaussian mixed model, GMM)虚拟样本生成方法平滑生成验证有效的虚拟样本; 然后, 使用生成后的数据集建立集成学习预测模型, 该模型包含随机森林(random forest, RF)、极端梯度提升(extreme gradient boosting, XGBoost)算法、轻量级梯度提升机(light gradient boosting machine, LightGBM)算法以及分类梯度提升(categorical boosting, CatBoost)算法. 实验表明: 集成学习模型的 LightGBM 算法与 CatBoost 算法性能最优, 在测试数据上均方误差为 0.001 3 与 0.000 1, 比 RF 算法与 XGBoost 算法分别高出 0.4 与 0.2. 聚丙烯复合材料老化虚拟样本生成与集成学习方法可以有效解决实验周期长、单次实验采集的数据样本少的问题, 并可取得比单一机器学习算法更优的性能.  相似文献   

10.
为了准确地预测高速公路收费站的短时交通流量,以便收费站根据不同时段的交通流量科学合理地制定人员配置方案来缓解收费站交通拥堵,文中提出了一种基于多特征GBDT模型的预测方法。引入一种新的机器学习算法GBDT,并通过数据分析,挖掘出时段、星期与天气3种有效的新特征,对广州机场高速机场收费站短时交通流量进行预测。结果表明,将挖掘的新特征应用于传统的BP神经网络模型建立多特征BP神经网络模型可以将预测误差降低4.67%,而文中提出的模型相对于多特征BP神经网络模型可以将预测误差降低0.91%,从而证明了该模型的有效性和可行性。  相似文献   

11.
为解决货车司机出行路径选择行为缺少考虑差异化收费政策影响的问题,通过出行费用、出行距离、优惠折扣、收费系数和是否关注差异化收费政策这5个变量刻画差异化收费,通过构建分路段差异化收费条件下货车司机出行路径选择的RF模型。以银昆高速(G85)昭通至水富段及麻水线与昭麻二级路问卷调查数据为基础开展实证分析。结果表明:所构建的分路段差异化收费条件下货车司机出行路径选择的RF模型的分类准确率优于AdaBoost模型、GBDT模型和传统Logit模型;整体重要度方面,优惠折扣是影响货车司机出行路径选择最主要的因素(38.56%),出行费用(13.55%)、出行距离(10.06%)及出行时段(7.08%)对意愿结果存在显著影响;同时,部分分路段差异化收费变量对货车司机出行路径选择意愿存在明显的阈值效应。  相似文献   

12.
基于生理信号客观评估心理压力状态成为目前的研究热点,但最佳评估算法有待进一步探索.本文选择心算任务诱发受试者的心理压力,采集了21位在校大学生的脑电、心电、皮肤电导、脉搏波4种生理信号.提取各生理信号时域和频域的多种特征,使用方差分析(ANOVA)、最大相关最小冗余(mRMR)、单个特征支持向量机(SVM)分类准确率、随机森林(RF)特征重要性、梯度上升决策树(GBDT)特征重要性、极端梯度提升(XGBoost)特征重要性6种特征选择方法筛选出有效特征,利用SVM、K近邻(KNN)、高斯朴素贝叶斯(GNB)、自适应提升算法(Adaboost)、GBDT、XGBoost 6种分类器对提取的特征进行分类.结果得出,GBDT特征筛选与XGBoost分类器的组合模型对心理压力的等级评估效果最佳.  相似文献   

13.
应用时间序列分析及灰色系统的有关理论提出了一种新的组合模型,并用这一模型对大连港的客流量进行了预测。  相似文献   

14.
将基于循环前缀的时域相位跟踪与基于频域导频的CPE校正技术相互结合,提出了一种旨在提高无线OFDM接收机抵抗相位噪声能力、低复杂度的相位噪声自适应补偿方案,时域跟踪可以对信道相位偏移低频成分起到初步的抑制作用,而在频域则通过引入导频子载波可信度判决机制,将CPE估计放在信道判决前进行,更为精确地消除由频率选择性相位偏移对CPE估计所带来的影响.仿真结果表明,本方案能够显著改善OFDM接收机在相位噪声条件下的系统误码率性能.  相似文献   

15.
城市轨道交通乘客出行路径集是否正确,是乘客路径选择估计以及网络客流分布计算的前提和基础.从现有客流分布模型中有效路径选择集问题及OD实际旅行时间聚类特征出发,引入Rodriguez-Laio快速聚类算法,提出基于旅行时间聚类分析的城市轨道交通乘客路径集验证方法.以北京地铁网络为例进行算例分析,结果表明,该方法可以在全网络范围内对路径选择集问题OD作出快速识别及滚动验证,并为以原因分析为导向的现场客流调查与模型修正工作提供重要参考.  相似文献   

16.
针对宽频带大口径相控阵雷达孔径渡越时间问题,提出了一种直接宽带数字中频的宽频带相控阵雷达实现框架,并基于chirp信号提出了使用数字去斜技术补偿孔径渡越时间,使用数字本振相位调整补偿射频通道一致性的信号处理方法.结合实际硬件系统验证了方法的有效性和工程可实现性,结果表明本文方法可有效补偿孔径渡越时间和射频通道的不一致性.   相似文献   

17.
卡车路段行程时间的实时动态预测   总被引:2,自引:0,他引:2  
分析了建立卡车路段行程时间预测模型传统方法的不足,考虑到高度非线性的露天矿运输系统有别于公路交通系统,针对卡车运行时间的随机性,采用多因子预测,阐述了应用人工神经网络(ANN)原理和方法对卡车路段行程时间预测的可能性和优越性,建立了预测模型的基本结构,描述了行程时间与其影响因素间的非线性映射关系,从而提出了基于人工神经网络原理的行程时间预测模型。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号