首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
为实现新零售优惠券的定向投放,提出了对用户优惠券使用行为预测的模型.该文采用XGBoost算法,突破了以TAM模型(技术接受模型)为基础解释个人优惠券使用意愿的传统方法,并基于口碑网的真实交易数据进行了特征提取和用户使用行为建模.在K折交叉验证之后通过变量重要性评分,确定了对消费者使用决策贡献度较高的特征,并与随机森林和GBDT(梯度提升决策树)算法进行了AUC(Area under curve)准确率的对比.该研究证明了基于XGBoost的集成学习算法在优惠券使用行为预测中的有效性,对新零售精准营销有重要的现实意义.  相似文献   

2.
为了解决燃料电池汽车功率分配中的实时性与准确性问题,提出使用离线非线性规划+在线XGBoost算法对燃料电池汽车功率进行预测.首先搭建燃料电池混合动力汽车的动力系统模型,并且通过聚类分析获取车辆行驶的典型混合工况;其次使用非线性规划算法离线计算在该工况下燃料电池与锂电池的最优分配比例;最后XGBoost算法以非线性规划计算结果为训练数据进行模型训练验证.结果表明:所提出的算法强化了目前离线计算中对于燃料电池混合动力系统动态性能多目标优化的考虑,增强了在线机器学习训练数据的准确性,同时所提出的XGBoost算法可以加快计算速度以及避免数据的过拟合,实现对燃料电池混合动力汽车功率的精确估计.  相似文献   

3.
为精准有效地预测电商客户粘性,提升经济效果,研究数据挖掘技术在电商客户粘性预测中的应用。利用可变网格的K-means聚类算法,聚类获取电商客户粘性预测相关数据;通过有效性指标优化可变网格K-means聚类算法的聚类数,确定最佳聚类数,提升数据聚类效果;采用技术接受模型,依据聚类获取的数据,建立电商客户粘性预测指标体系;通过模糊层次分析法,结合指标体系,建立电商客户粘性预测模型,获取预测分值。实验结果表明,该模型可有效确定最优聚类数,精准聚类电商客户粘性预测相关数据;所建立的预测指标体系的指标相关性较低,结构较稀疏、较全面。总体说明,该模型可有效预测电商客户粘性。  相似文献   

4.
针对如何利用消费者购买行为数据进行产品销量的有效预测问题,以高卷入度产品——汽车为例,挖掘用户生成的评论以及搜索行为留下的数据,构建基于不同数据来源的预测模型,采用线性以及非线性机器学习算法对不同的预测模型求解均方误差MSE。研究结果表明,增加用户关注度的数据能够增强基准数据的预测效果,而添加具体口碑数据后,可以有效地增强搜索数据的预测效果。  相似文献   

5.
针对供应链金融领域中小企业融资的信用风险控制问题,提出了一种在Bagging算法框架下结合贝叶斯优化和XGBoost算法的集成学习模型BO-XGBoost-Bagging(BXB)。首先,基于XGBoost特征重要度进行特征筛选,建立供应链金融信用评价指标体系。其次,通过贝叶斯优化获得XGBoost的最优超参数,并结合Bagging算法得到集成模型BXB。最后,在中小企业数据集上进行预测,通过实证研究验证信用评价模型的有效性。实证结果表明,BXB模型相比其他模型具有更好的预测效果,能够更加准确、全面地对中小企业的信用风险进行评估,更好地区分风险企业和正常企业,最大程度减少违约损失,在供应链金融信用评价方面有着较高的应用价值。  相似文献   

6.
针对目前高炉炼铁模型精度不高问题,提出建立高炉生产过程中精确的多目标优化模型.首先对高炉的海量数据进行了数据预处理,其次采用支持向量机、随机森林、梯度提升树、XGBoost、LightGBM、人工神经网络6种机器学习算法对高炉焦比、K值进行了预测,并采用特征工程和超参调优对机器学习预测进行了优化,最后采用新的集成学习方法进行预测.预测结果不仅精准度高而且具有很好的鲁棒性.在机器学习的基础之上,采用NSGA-Ⅱ遗传算法对高炉参数进行了多目标优化分析,得到了Pareto最优解,高炉操作者可以根据该多目标优化结果针对不同的需求选择相应的控制参数.  相似文献   

7.
教育规模不断扩大,高校在校生人数持续上升,导致学生的能力参差不齐.为了提升教育水平,教师需掌握学生在校期间的学习状态,预测学生期末成绩是教师掌握学生学习状态的重要途径之一.目前的研究工作主要采用传统的机器学习算法进行成绩预测,如随机森林、贝叶斯、深度森林等,但精度不高;也有利用深度学习算法进行预测,但模型缺少可解释性. Lightgbm(Light Gradient Boosting Machine)算法内存消耗低,时间复杂度低,而XGBoost(eXtreme Gradient Boosting)算法精度高.因此,基于提高精度与降低模型内存消耗的策略,将深度森林中的随机森林与极限随机森林模块分别替换为Lightgbm和XGbBoost,提出一种基于Lightgbm和XGBoost算法的优化深度森林算法LIGHT-XDF.在八个数据集上与其他模型进行对比实验,结果表明,LIGHT-XDF算法的综合性能最好.  相似文献   

8.
针对传统的协同过滤推荐算法中评分矩阵过于稀疏和算法准确度不高的问题,提出一种融合矩阵分解和XGBoost算法的推荐算法(MFXGB,Matrix Factorization XGBoost),其特点是利用SVD++算法(SVD,Singular Value Decomposition)对用户项目评分矩阵进行填充,避免过多的缺失值对算法精确度的影响,再利用XGBoost(eXtreme Gradient Boosting)算法训练有监督的模型用于预测用户评分.为了克服计算成本过高的困难,提出利用K-均值聚类方法进行特征提取用于训练XGBoost模型.将MFXGB算法应用于MovieLens数据集进行实验分析,结果显示,MFXGB算法的推荐精确度比传统的3种方法分别提高了8.91%、10.18%和11.79%,效果明显优于传统的推荐算法.  相似文献   

9.
为改善患者身体健康,降低非计划再入院率,减轻患者负担和社会资源浪费,本研究基于我国某区域卫生信息平台的医疗数据,利用机器学习方法,构建了非计划再入院风险预测模型.不同于已有仅预测了再入院概率的研究,本研究通过将风险预测建模为多分类问题,实现了在时间和可能性两个维度对再入院风险进行预测.通过调整机器学习算法参数设置,构建了基于神经网络、随机森林和支持向量机算法的3大类共10个再入院风险备选预测模型.基于真实数据集的实验结果表明,在备选风险预测模型中,使用多项式核函数的支持向量机模型预测效果最好,预测准确率达到96.65%.本研究成果可以使医疗机构基于患者历史医疗数据,从时间和可能性两个维度更全面、精准地评估患者再入院风险,进而采取必要的干预措施,降低非计划再入院率.   相似文献   

10.
针对智能电能表在运行过程中出现烧损的现象,在对各类因素进行关联分析后, 提出了一种基于XGBoost算法的智能电能表烧损预测方法,以某省份2019—2020年的数据为例进行了测试验证. 采用该方法结合电能表基本信息数据、运行数据和环境数据进行烧损识别,并与K最邻近法(K-NearestNeighbor,KNN)、朴素贝叶斯和支持向量机等传统机器学习算法进行对比. 结果表明,基于极限梯度提升算法(eXtreme Gradient Boosting, XGBoost)的算法精度达到91%,召回率达到66%,综合指标F1达到76.51%,远高于传统算法. 算法模型在进行系统部署的过程中,运用长短期记忆算法(Long Short Term Memory, LSTM)对部分缺失值进行了填充,经试点验证,该模型可较为准确地预测低压台区电能表烧损现象.  相似文献   

11.
针对电商销量数据的复杂性和现有预测模型的稳定性及泛化能力不足问题,本研究基于大样本多变量数据,应用随机森林和渐进梯度回归树等机器学习模型进行分析。研究结果表明,相比于广义线性回归、弹性网络、支持向量回归、KNN回归树、决策树、多层感知机、AdaBoost,随机森林和渐进梯度回归树对电商销售数据预测拟合更加精确。相比于广义线性回归、弹性网络等7种传统机器学习算法,随机森林和渐进梯度回归树这两种集成学习的方法对电商销量预测更加精确,且渐进梯度回归树算法拟合效果更好、均方根误差更小,是一种更加有效的电商销量预测方法。  相似文献   

12.
室内人行为的准确识别,包括人员位置和活动类型的判定,是智能家居领域中各类电器设备实现多场景控制模式的重要输入参数.采用被动红外(PIR)传感器阵列监测人行为,分析人员不同位置及不同强度动作的数据特征.基于机器学习算法建立室内人员位置及动作识别模型,并对比不同累加时长和机器学习算法的模型预测准确度.最终以PIR传感器当前...  相似文献   

13.
智能学业预警是教育大数据、云计算等智能技术应用的热点,许多研究采用数据挖掘、机器学习、深度学习等技术来预测成绩.在线上教学常态化的背景下,智能学业预警和精准干预为下一步混合教学和职业教育的"三教"改革决策提供实证,也是教育大数据的重要研究内容.本研究设计了基于随机森林的预测模型分析教师和学生行为,并评估教师和学生行为中...  相似文献   

14.
为优化周期性概念漂移分类精度,提出了一种基于隐马尔可夫模型的周期性流式数据分类(HMMSDC)算法,算法结合实际可观测序列的输出建立漂移概念状态序列的转移矩阵概率模型,由观测值概率分布密度来预测状态的转移序列.当预测误差超过用户定义阈值时,算法能够更新优化转移矩阵参数,无须重复学习历史概念即可实现对数据概念漂移的有效预测.此外,算法采用半监督K-Mean学习方法训练样本集,降低了人工标记样例的代价,能够避免隐形马尔可夫模型因标记样例不足而产生的欠学习问题.实验结果表明:相对传统集成分类算法,新算法对周期性数据漂移具有更好的分类精确度及分类时效性.  相似文献   

15.
为了科学有效地评估高速公路服务区交通通行服务能力和进行基础设施优化配置,提出一种基于改进粒子群算法(Improved Particle Swarm Optimization,IPSO)和XGBoost融合的高速公路服务区交通量预测模型.首先对粒子群算法的拓扑关系结构进行改进,将粒子群划分为主粒子和从粒子,获得多个改进粒子组,并给出改进后主从粒子速度和位置的更新方法;其次利用线性递增和递减函数对粒子的迭代寻优速度进行自适应调整;最后在模型训练过程中,引入交通量调查数据这一重要特征,并利用IPSO算法对XGBoost模型的主要超参数进行优化选择,建立了交通量调查数据和服务区各交通量之间的IPSO_XGBoost预测模型.结果表明:提出的改进粒子群算法具有更强的参数寻优能力,迭代收敛速度更快,能够搜索出XGBoost模型的理想超参数,实现对服务区交通量的有效预测.同时,提出模型的预测性能明显优于LSTM、XGBoost、CNN-LSTM和PSO_XGBoost,对小型车、大型车、货车、车当量和人当量数据的预测精度分别达到了0.913、0.815、0.872、0.931和0.924.  相似文献   

16.
用户成长值反映用户粘性,预测用户成长值有助于实现精准营销。聚焦用户成长性画像研究,针对用户原始数据记录复杂多样、难以提取有效特征的问题,通过散点图分析挖掘影响用户成长值的因素,提取行为特征和相对稳定的时间特征,并对比基于树的特征筛选算法和L1范数进行特征筛选。针对已标注成长值的用户数据不足问题,改进COREG算法,通过半监督学习模型丰富训练数据,提高模型的预测准确度,同时降低原算法的时间复杂度,最后采用模型融合整合不同模型的优势。在CSDN博客平台提供的SMP CUP 2017数据集上进行实验,结果表明,建立的模型有效地提高了泛化能力和预测准确度。  相似文献   

17.
串联排队系统是排队网络的基本结构,研究串联排队系统对分析排队网络具有重要意义.串联排队系统中站与站之间存在关联性,上游站的输出过程是下游站的输入过程,对于不满足马尔可夫性的排队系统,下游站的到达过程很难用解析的方法分析.对于一般的串联排队系统,本文基于机器学习对串联排队系统的平均等待时间进行预测,通过数值实验比较机器学习中线性回归模型和非线性回归模型的预测效果.实验结果表明,非线性回归模型优于线性回归模型,XGBoost算法对串联排队系统的平均等待时间的预测准确度较高.此外,本文将XGBoost算法与传统的近似分析方法进行比较,发现XGBoost算法的预测效果优于传统的近似分析方法.  相似文献   

18.
聚丙烯复合材料老化实验周期长, 且单次实验采集的数据样本少, 使用传统机器学习方法进行预测的准确度较低. 为了解决聚丙烯复合材料老化数据样本少与预测准确性低的问题, 提出了一种虚拟样本生成(virtual sample generation, VSG)的集成学习预测方法. 首先, 对聚丙烯复合材料老化数据使用高斯混合模型(Gaussian mixed model, GMM)虚拟样本生成方法平滑生成验证有效的虚拟样本; 然后, 使用生成后的数据集建立集成学习预测模型, 该模型包含随机森林(random forest, RF)、极端梯度提升(extreme gradient boosting, XGBoost)算法、轻量级梯度提升机(light gradient boosting machine, LightGBM)算法以及分类梯度提升(categorical boosting, CatBoost)算法. 实验表明: 集成学习模型的 LightGBM 算法与 CatBoost 算法性能最优, 在测试数据上均方误差为 0.001 3 与 0.000 1, 比 RF 算法与 XGBoost 算法分别高出 0.4 与 0.2. 聚丙烯复合材料老化虚拟样本生成与集成学习方法可以有效解决实验周期长、单次实验采集的数据样本少的问题, 并可取得比单一机器学习算法更优的性能.  相似文献   

19.
针对传统银行网点选址方法中存在的人为主观因素较大、数据量支撑不够、考虑因素理想化等问题,提出一种基于多源大数据融合的银行网点选址方法。该方法通过多源数据构造人流量、交通拥堵指数、用户价值、周边竞争网点数和人均收入5个基础特征,并利用协同训练的半监督学习方法扩充训练集。基于基础特征与机器学习算法构建多个子模型,将子模型的输出概率作为特征,构建基于逻辑回归的集成算法,作为银行网点选址模型,同时提出一种优化银行网点权重的损失函数,以保证模型预测中更佳的银行网点具有更高的权重。通过实验分析表明,该算法相较于传统算法预测评估更为准确,能够很好地解决银行网点选址问题。  相似文献   

20.
为了更加精准地预测二手房价格,该文以2019年深圳市二手房的真实交易数据为研究对象,利用线性回归模型、随机森林模型和XGBoost模型并加以POI计算来预测二手房价格.首先,对数据集进行清洗并可视化展示.其次,运用百度地图进行POI处理扩充数据集,使得数据集接近现实情况.接着,按照数据特征对房价影响的重要程度进行了排序,选取重要的特征来训练模型.最后,通过数值结果分析,XGBoost模型对二手房的房价评估效果最好,尤其是经过POI处理的数据集和XGBoost模型的这种组合,对于深圳市的二手房价格具有极好的预测效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号