首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 171 毫秒
1.
基于非平衡数据的随机森林分类算法改进   总被引:1,自引:0,他引:1  
随机森林算法作为一种组合分类器有较好的分类性能,适合多样的分类环境。算法同样也存在一些缺陷,例如算法处理非平衡数据时不能很好地区分正类和负类。针对这一问题,通过对抽样结果增加约束条件来改进Bootstrap重抽样方法,减少抽样对非平衡性的影响,同时尽量保证算法的随机性。之后利用生成数据的非平衡系数给每棵决策树进行加权处理,提升对非平衡数据敏感的决策树在投票环节的话语权,从而提升整体算法对非平衡数据的分类性能。通过上述两种改进可以明显提高随机森林在决策树数量不足情况下的分类精度。  相似文献   

2.
基于线型激光的热轧带钢表面在线检测系统   总被引:1,自引:1,他引:0  
针对基于面阵CCD摄像机的热轧带钢表面缺陷检测系统所存在的问题,提出采用线阵CCD摄像机作为热轧带钢的表面图像采集装置,将激光线光源作为照明光源,解决了高温环境下的远距离均匀照明问题.采用这种图像采集方式可以使系统的精度达到0.5mm以上.针对热轧带钢表面存在的氧化铁皮、水及光照不均等问题,提出了对于不同缺陷类型建立单独的缺陷检测算法的思想.目前已经建立了纵裂与边裂的检测算法,对这两类缺陷的检出率达95%以上.  相似文献   

3.
针对光伏功率预测没有充分利用历史数据的问题,提出一种改进随机森林算法与长短期记忆神经网络相结合的预测方法(IRF-LSTM)。利用粒子群算法优化随机森林算法中的参数,并对原始气象数据进行特征选择。将特征选择后的结果作为输入,对预测模型输出的结果进行反归一化处理得到预测的功率序列。选用某光伏电站的实测数据对该算法模型进行预测,结果表明:该方法能充分利用预测时刻之前的气象时间序列,有效提高光伏功率预测精度,与RF-LSTM方法、单一LSTM方法相比具有更高的准确性,预测误差更小。  相似文献   

4.
随机森林算法是根据Bagging抽样和随机特征子集划分策略,由多棵决策树组成的集成算法.与其他分类算法相比,随机森林算法有更高的分类精度、更低的泛化误差以及训练速度快等特点,因此在数据挖掘领域得到了多方面的应用.然而随机森林算法在分类预测特征维度高且不平衡的数据时,分类性能受到了极大限制.为了更好地处理高维不平衡数据,...  相似文献   

5.
随机森林在分类不平衡数据时,容易偏向多数类而忽略少数类。可以将代价敏感用于分类器的训练;但在传统代价敏感随机森林算法中,代价函数没有考虑样本集实际分布与特征权重,且在随机森林投票阶段,没有考虑基分类器的性能差异。提出一种改进的代价敏感随机森林算法ICSRF,该算法首先根据不平衡数据集的实际分布构造代价函数;并将权重距离引入代价函数,然后根据基分类器的性能采取权重投票,提高分类准确率。实验结果表明,ICSRF算法能有效提高少数类的分类性能,可以较好地处理不平衡数据。  相似文献   

6.
针对分类算法在非平衡数据集的情况下分类性能不理想的问题,总结了常见的数据平衡化方法,包括改造数据集与改进算法,提出一种全新的基于最大平衡度的自适应随机抽样算法,进一步优化了随机森林算法的分类效果.将其应用在随机森林算法的数据预处理阶段,并通过实验证明了该随机抽样方法的有效性,在合理的整体精度范围内能够较好地处理非平衡数据.产生的新数据比较拟合初始数据,能够提高分类器处理非平衡数据的能力.  相似文献   

7.
针对传统弯辊力预设定模型的缺陷和带钢热连轧轧制特点,利用某钢铁公司1580mm热轧线生产数据,对精轧机组末机架进行了基于遗传算法优化神经网络的弯辊力预报模型研究.以大量实际数据作为神经网络训练输入,充分考虑了输入参数之间的影响作用,模型结构简单、容易实现,其整体性能用平均绝对百分误差、均方根误差和相关系数R评价.通过将预测结果与实测结果比较,验证了模型的精度.研究发现,提出的弯辊力预测模型相比于传统模型可实现高度非线性拟合,适用于提高热轧带钢头部板形控制精度,为实际弯辊力设定提供指导和试验基础.  相似文献   

8.
针对现今传统统计方法难以准确及时的揭示经济参量时空信息且估算GDP精度不足的问题,本文利用国家极轨卫星携带的可见光和近红外成像辐射计(NPP/VIIRS)获取的2012-2018年夜间灯光影像为数据源,对数据产生的误差进行处理得到了可以用来定量分析的长时间序列数据;首先采用随机森林算法对数据集进行预测研究,在此基础上提出一种基于袋外数据估计的回归误差,采用改进的网格搜索算法(Grid Search)对随机森林模型进行参数调优。同时也使用贝叶斯优化(Bayesian Optimization)对随机森林(RF)模型进行参数调优。运用嵌套5F-CV,并通过外部5F-CV循环估算模型的泛化能力,内部5F-CV循环用于确定最佳参数找出最优参数模型,建立自动预测系统,根据输入的研究区数据,使算法模型自动进行精准预测。结果表明基于贝叶斯优化改进的随机森林算法在预测GDP时最好,预测精度达到97%,具有较高的准确率和鲁棒性。研究结果展示了机器学习算法和夜间光照指数用于在县级尺度上预测GDP表现出显著的能力。  相似文献   

9.
对半导体成品率进行预测分析可有效控制产品成本,提高产品质量,而缺陷问题是导致半导体成品率损失的关键因素。因此,考虑晶圆缺陷聚集特性和数据嵌套性,研究了一种密度聚类与多水平逻辑回归相结合的受缺陷限制的成品率预测方法。首先采用密度聚类算法获取晶片缺陷模式类型;将在线缺陷数据在晶片水平进行整合,作为多水平逻辑回归模型的输入参数;根据多层次晶圆结构,在模型中加入嵌套变量,在批次层、晶圆层和组别层构建随机截距效应模型;在产品层构建非随机变化截距与斜率模型进行成品率预测;最后,根据回归结果分析引起成品率损失的主要因素并提出相应的改进措施。通过仿真实验表明,多水平逻辑回归模型的预测精度优于常用的Seed’s成品率模型与嵌套结构逻辑回归模型,该模型具有更高的预测能力与可行性。  相似文献   

10.
提高剩余续驶里程预测精度可以缓解驾驶人的"续航焦虑",帮助车厂开发精细的电池管理系统,提高纯电动汽车的接受度.基于改进符号回归算法自动生成与标签字段高度相关的新数据特征字段,实现数据维度扩充.再将维度扩充后的数据传入经过超参数调优的XGBoost模型预测剩余续驶里程.对比仅使用经典特征字段的原始数据,维度扩充后的数据在...  相似文献   

11.
针对基于降维的神经网络分类器预测模型在分析过程中存在特征丢失, 并导致精度下降的问题, 提出一种基于随机森林算法优化的多层感知器(MLP)回归预测模型. 该优化模型通过在MLP回归模型网络的全连接层和逻辑回归层之间增加一个优化机制, 利用随机森林算法对隐藏层状态的优化实现改进, 从而解决了降维过程中神经网络丢失数据特征的问题. 在借贷客户信息数据集上的实验结果表明, 该模型在保证主要特征的同时大幅度提升了预测准确率, 证实该模型在特征工程中具有较高的实用性.  相似文献   

12.
Global Positioning System(GPS) trajectory data can be used to infer transportation modes at certain times and locations. Such data have important applications in many transportation research fields, for instance,to detect the movement mode of travelers, calculate traffic flow in an area, and predict the traffic flow at a certain time in the future. In this paper, we propose a novel method to infer transportation modes from GPS trajectory data and Geographic Information System(GIS) information. This method is based on feature extraction and machine learning classification algorithms. While using GIS information to improve inference accuracy, we ensure that the algorithm is simple and easy to use on mobile devices. Applied to GeoLife GPS trajectory dataset, our method achieves 91.1% accuracy while inferring transportation modes, such as walking, bike, bus, car, and subway, with random forest classification algorithm. GIS features in our method improved the overall accuracy by 2.5% while raising the recall of the bus and subway transportation mode categories by 3.4% and 18.5%. We believe that many algorithms used in detecting the transportation modes from GPS trajectory data that do not utilize GIS information can improve their inference accuracy by using our GIS features, with a slight increase in the consumption of data storage and computing resources.  相似文献   

13.
针对传统线性支持向量机在训练数据集时均等对待每一维输入特征,以及在原始空间直接分类造成预测准确率低的问题,提出低阶多项式数据映射和特征加权相结合的方法,来提高线性支持向量机的分类性能。该方法首先将每个样本映射到多项式核对应的2 阶显式特征空间,从而增加样本的隐性信息,然后使用模糊熵特征加权算法计算每一维特征的权重,通过权重衡量特征对分类结果的贡献大小。从不同数据库选取7个数据集进行测试,在训练时间和预测准确率2个方面将该方法与核支持向量机、线性支持向量机的其他改进算法进行比较。结果显示,随着数据集规模的扩大,训练时间降低一个数量级,预测准确率在一些数据集上取得与核支持向量机相接近的效果。结果表明:所提方法可以有效提高线性支持向量机的整体性能。  相似文献   

14.
田佳  王德勇  师文喜 《科学技术与工程》2023,23(29):12612-12619
针对短时交通流数据具有非线性、不确定性等特点,提出一种基于集合经验模态分解(ensemble empirical mode decomposition,EEMD)和随机森林(random forest,RF)的组合预测模型。首先,利用EEMD算法将原始交通流数据的区间平均速度序列分解为若干个本征模函数(intrinsic mode function,IMF)和一个残差分量(residual,RES),提取出交通流数据在不同时频的信息;接着,将第一个分量进行二次EEMD分解,细化交通流的随机信息;然后,将分解得到的各个分量分别使用RF进行预测,构建子模型;最后,将所有子模型的预测值线性求和,得到最终的预测结果。采用阿拉尔市某路段的实际交通流数据进行实验,结果表明,EEMD和RF的组合预测模型优于单一的RF模型,并且对IMF1进行二次EEMD分解可进一步提高组合预测模型的准确率。  相似文献   

15.
风力发电机叶片开裂直接影响风力发电机运行,采用梯度提升决策树算法与基于lightGBM框架改进的梯度提升决策树算法对风力发电机叶片开裂进行预测。对比分析了预测准确度与可行性。基于lightGBM改进的梯度提升决策树算法分析的风力发电机运行数据得出的预测结果优于梯度提升决策树算法,且对于风力发电机叶片开裂预测准确度较高,并具有实用价值。同时该算法能够大幅降低样本中的无效数据,减少计算量。其独立特征合并能够使得划分点特征数量降低,提高风力发电机叶片开裂预测的准确性。最后,风力发电机叶片开裂预测实验结果表明,基于lightGBM改进的梯度提升决策树算法取得了更好的预测结果,计算量更小且能够准确预测风力发电机叶片开裂故障。  相似文献   

16.
针对稀疏表示超分辨率重建算法中稀疏表示系数正则化效果不明显、字典完备性弱以及重建图像存在虚边缘等问题,提出了一种改进的稀疏表示超分辨率重建算法.首先对正则化正交匹配追踪(regularized orthogonal matching pursuit,ROMP)稀疏表示系数求解算法进行了改进,通过引入局部约束加权来提高稀疏表示系数的精度、增强图像的纹理特性;然后,将Huber影响函数用于提取图像的先验特征信息,以增强图像特征、提升高分辨率字典的表示能力;最后,提出了基于学习的迭代反投影方法,提高了图像后处理阶段预测误差的准确性,进一步改善了高分辨率重建图像效果.实验结果表明,该方法在峰值信噪比和视觉效果上都有所提高,重建图像的纹理特性和质量得到了有效增强.  相似文献   

17.
在灰色预测GM(1,1)算法的基础上,针对小样本、穷信息、不确定性和以时间为序列的特征数据,运用限定条件下的随机非线性规划方法、动态调整GM(1,1)算法均质生成数列中的发展系数,构建一套优化预测模型,藉此提高算法的数据预测精度.结果表明:优化算法的预测结果精确度高,在数据预测方面,优于传统的GM(1,1)算法.  相似文献   

18.
针对深度学习网络在网络流量预测建模过程中的参数优化难题, 以改善网络流量预测结果为目标, 提出一种基于改进灰狼算法优化深度学习网络的网络流量预测模型. 首先, 收集网络流量历史数据, 并对数据进行相空间重构、 归一化等预处理; 其次, 引入灰狼算法快速搜索到全局最优深度学习网络的相关参数, 并根据最优参数对预处理后的网络流量历史数据进行学习, 建立能挖掘网络流量历史数据变化规律的预测模型; 最后, 与其他算法优化深度学习网络的网络流量预测模型进行对比分析. 实验结果表明, 基于改进灰狼算法优化深度学习网络的网络流量预测精度超过90%, 远高于其他对比模型, 且预测建模过程的建模时间少于对比模型, 可满足网络流量管理的高精度和实时性要求.  相似文献   

19.
为提高车载双目系统户外工作性能,提出了一种车载双目系统立体匹配算法。在代价计算阶段,提出了一种3bitCensus变换,该变换提高了对局部特征的描述能力并具有较强的鲁棒性;在代价聚合阶段,提出了基于边缘截断的自适应窗口聚合算法,该算法能够根据局部特征和边缘信息自适应的调节聚合窗口,提高了算法匹配精度;在视差计算阶段,利用跳跃式视差计算方法,进一步提高了计算效率。实验证明:基于3bit-Census变换+基于边缘截断的自适应聚合+跳跃式视差计算的立体匹配结构能够有效提高双目系统的鲁棒性、匹配精度及计算效率,适用于车载双目系统。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号