首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 484 毫秒
1.
基于多波束对长江河道底质分类关键问题进行了研究,对多波束反射强度数据进行改正并对多波束声呐图像进行预处理,采用灰度共生矩阵对底质反向散射强度图像进行纹理特征提取,最后将提取底质图像样本作为自组织特征映射神经网络和随机森林两种分类方法的训练数据,使用训练好的预测分类模型对反向散射强度图像进行全图底质分类.实验结果表明,SOM与随机森林分类方法的总体分类精度分别达到了82.5%与85.4%,对底质声呐图像实现了较好的预测分类效果.  相似文献   

2.
为了提高冲击地压危害预测的准确性,基于主成分分析法和随机森林算法,构建了由主成分分析方法优化的随机森林模型,分析静态冲击地压数据并处理异常值,通过数据标准化处理、计算相关系数矩阵及累计方差贡献率,提取出5个主要特征.利用优化的随机森林模型训练冲击地压数据集,使模型参数不断得到优化.以混淆矩阵中的准确率作为评估指标,将优化的随机森林模型与单一随机森林模型进行比较分析.实验结果表明,优化的随机森林模型比单一随机森林模型具备更好的效果,其准确率达到了88.9%,高于单一的随机森林模型,进而得出结论,即优化的随机森林模型能有效地对冲击地压危害进行预测,通过随机森林优化模型,一定程度上有效缩减冲击地压危害预测的时间.  相似文献   

3.
乔瀚  容芷君  许莹  但斌斌  赵慧 《科学技术与工程》2021,21(36):15497-15502
考虑样本数据集的差异性和相关性对疾病预测结果有着直接影响,提出一种基于多特征属性患者相似的糖尿病早期预测方法,根据患者之间特征具有相似性这一特点,对患者特征进行混合属性相似预分组,再把分组结果导入随机森林分类器进行疾病预测。首先以临床概念作为患者的特征项,通过聚类定量化分析不同特征属性类型间的距离来度量患者之间的混合相似度,根据患者混合相似度将患者集预分组为多个患者相似组。最后以随机森林分类器对相似组进行细分类,得到最终的疾病预测结果,该结果与基于全样本数据的随机森林分类结果相比,分类准确率提高了8.3%;与基于单一属性相似组的随机森林分类结果相比,分类准确率提高了5.1%。结果表明该方法具有较高的预测准确率,可为糖尿病诊断预测提供支持。  相似文献   

4.
提出基于粗糙集和随机森林算法辅助糖尿病并发症分类。首先,运用简化的分明矩阵法对属性约简,产生新的决策信息系统;其次,采用随机森林算法对该新信息系统生成随机森林,实现分类;最后,通过糖尿病并发症临床诊断数据子集测试。实验表明该方法有效性,并优于直接用随机森林算法分类。  相似文献   

5.
本文采用随机森林分类方法提取MODIS影像中的水体,根据水体和非水体在不同波段的反射率特征差异计算水体指数,选择一年内水体指数总和大于零的点构造分类特征,以全球30 m地表覆盖数据作为真值进行训练和验证.依据在随机森林中分类特征的重要性选出了10个分类特征,并通过一定量的实验统计选出有较好分类结果的随机森林模型参数.采用混淆矩阵及相关精度指标、Kappa系数等进行精度评价,获得较好的水体分类结果.  相似文献   

6.
针对传统预测模型易陷入过拟合、缺失数据敏感、计算量大等不足,利用随机森林算法的双重随机性、处理数据集优异等特点,对A股股票涨跌预测进行研究。首先运用相关性分析对初始指标体系进行一次Spearman和二次Pearson筛选,去除指标体系中的冗余指标。然后对随机森林的各项重要参数进行优化,并对优化后的模型采用重要性估计方法以提升训练模型精确度。通过不同指标体系的对比,验证实验过程的正确性。最后,对比不同建模方法的实证预测结果,表明随机森林模型比传统机器学习方法二元logistic回归在性能上更优越,具备较高的预测准确度。  相似文献   

7.
有别于以往直接从介质几何结构或前期流场数据预测流场的方法,根据有限随机行走模型建立二维多孔介质随机行走数据矩阵作为输入,以相同介质利用LBM算法获得二维速率矩阵为输出,主要使用随机森林方法,在包含5000个数据的训练集上开展训练,得到预测函数.经测试集数据检验,预测流场与LBM算法计算所得结果非常接近.  相似文献   

8.
为了给消费者信贷决策提供合理依据,基于真实的客户信贷数据,运用逐步Logistic回归方法依据AIC准则进行变量选择建立经典决策树、条件推断树、随机森林、支持向量机等分类模型,并对4个分类模型的预测结果进行比较.结果表明:基于逐步Logistic回归建立的随机森林分类模型准确率达97%,预测效果最优;随机森林算法具有较...  相似文献   

9.
基于GPS轨迹数据的拥堵路段预测   总被引:1,自引:0,他引:1  
基于真实的GPS轨迹数据,对城市拥堵路段进行预测.在此过程中,摒弃传统的基于交通流预测和拥堵识别的方法,提出一种新的基于拥堵向量和拥堵转移矩阵的拥堵路段预测方法.该方法同时考虑路段拥堵的时间周期性和时空相关性,通过对出租车GPS轨迹数据进行挖掘和训练,建立拥堵向量和拥堵转移矩阵,实现对拥堵路段的预测.真实数据集上的实验验证了所提的拥堵路段预测方法的有效性.  相似文献   

10.
为提高对网络性能预判的准确度, 提出了运用多元时间序列的相关性计算方法, 时间序列的模糊化方法和模糊规则矩阵的构建方法, 建立了一种基于二元时间序列的接通率预测模型, 将拥塞率序列融入到对接通率的预测过程中。该方法克服了传统网络性能指标预测方法中, 只考虑单一时间序列, 不考虑其他变量与待预测变量的相关性的弊端。仿真实验结果表明, 该模型能够实现网络接通率的有效预测, 为网络性能综合预测提供理论基础和新方案。提高了预测精度。  相似文献   

11.
提出了一种非负矩阵分解-自回归模型,并用该模型对居民出行流量进行预测.该模型首先利用非负矩阵分解方法挖掘城市区域内的居民出行特征,而后在非负矩阵分解获得的特征矩阵和系数矩阵基础上对时序系数矩阵建立自回归模型,进而对起讫矩阵进行预测.以北京市出租车数据为基础,与时空权重K近邻、传统K近邻、反向神经网络、朴素贝叶斯、随机森林和C4.5决策树回归模型对比,实验结果表明,该模型的预测准确率有显著提升.  相似文献   

12.
为了提高蛋白质相互作用位点预测的精度,该文基于蛋白质位置特异性得分矩阵(Position specific scoring matrix,PSSM),提出了一种新的加权得分矩阵直方图特征表示方法;针对训练数据的极端不平衡,结合下采样和分类器集成方法,训练随机森林集成分类器。相对于传统的特征,该文所提新特征具有更低的维数,同时拥有更好的鉴别性。分类器集成则缓解了下采样带来的信息丢失,并提高了分类精度。实验结果验证了所述方法是有效的,在标准数据集上的结果优于其他最新的蛋白质相互作用位点预测方法。  相似文献   

13.
针对单一的分类器用于旋转机械故障诊断时存在准确率不高的问题,提出一种基于随机森林算法的旋转机械齿轮组故障诊断方法。该方法利用随机森林多分类器组合决策树的思想,通过多分类器的组合学习提高故障诊断的准确率,并在风力涡轮动力传动系统故障诊断模拟器系统上进行了多工况多故障的实验验证。首先,收集多工况、多故障的齿轮传感器信号,提取传感器信号的时域特征作为随机森林的输入特征量。然后,利用构建好的随机森林模型进行齿轮组的故障诊断,并将随机森林算法的分类结果与支持向量机方法的分类结果进行对比。通过对故障诊断结果的分析,随机森林算法避免了复杂的寻参过程和传统分类器的过拟合现象,能够处理大规模数据集,通过分类器的组合,提高了故障诊断准确率,并缩短了分类模型的预测时间,具有较好的应用前景。  相似文献   

14.
在更加复杂的地质因素影响下,常规测井方法识别煤体结构准确度低,为精确识别煤体结构,研究了煤体结构测井曲线响应机理以及随机森林决策树个数的优选,从而建立煤体结构与测井曲线的随机森林分类模型进行煤体结构识别。结果表明:决策树个数为500时,随机森林分类模型效果最佳;通过袋外误差和模型对测试集样本的预测结果可知,随机森林分类模型的结果稳定且泛化性强,并且适合处理非均衡数据,预测精度较高。可见随机森林算法能有效识别煤体结构,为煤层气开发提供帮助。  相似文献   

15.
针对城市公交实时客流数据多样化和特征复杂的状况,提出一种基于S-Catboost模型的客流特征提取及短时客流预测方法和影响因子分析流程。首先,通过爬虫技术获取公交客流数据的环境和时变特征,扩充客流数据的特征维度。其次,通过对客流数据进行时间和精度加权并采用LSTM和随机森林2种基模型对客流数据进行堆叠(Stacking),提取强特征并加入第二层子模型的特征矩阵。最后,利用Catboost算法对类别特征进行数值化处理,得到预测结果。实验结果表明该模型比传统LSTM、随机森林、GBDT以及SVM在预测准确度和计算时间上都有明显的优势,并给出了不同影响因子对客流量的相对贡献度和各自的偏效应,该模型对于公交系统进行实时线网优化调度和线路拥挤度信息发布具有比较高的实用价值。  相似文献   

16.
针对电信行业客户流失预测问题的复杂性,本文将能够处理大规模数据、容噪性能较好的组合分类器算法——随机森林方法应用于电信行业的客户流失预测中.针对影响组合分类器性能的关键指标——差异度,提出了一种新的基于随机森林相似度矩阵的差异度测度,并在此基础上提出了一种改进的组合剪枝技术,对随机森林的基分类器进行剪枝,得到规模较小但泛化性能更优的基于剪枝随机森林的客户流失预测模型.实验结果表明,与其他方法相比,新的差异度测度方法更好地描述单个分类器之间的差异度,本文提出的基于剪枝随机森林的客户流失预测模型具有更高的预测准确率、更小的组合分类器规模和更好的效率,有望成为该领域一种可行且有效的方案.  相似文献   

17.
在肿瘤特征基因选择过程中,传统分类方法会选出大量冗余基因,而大量冗余基因会造成分类精度低和时间复杂度较高等问题,为了解决上述问题,提出一种结合信噪比过滤法与随机森林算法的肿瘤特征基因选择方法.该方法包含两个过程:首先使用信噪比过滤法剔除原始特征空间中的无关和冗余基因,从而获得与分类属性相关性较高的基因,选择出分类能力较强的预选特征子集;其次使用随机森林算法对特征基因子集进行分类,最终获得分类结果.实验结果显示,该算法可以快速有效地选择出肿瘤特征基因,并具有较高的分类精度.  相似文献   

18.
随机森林算法是根据Bagging抽样和随机特征子集划分策略,由多棵决策树组成的集成算法.与其他分类算法相比,随机森林算法有更高的分类精度、更低的泛化误差以及训练速度快等特点,因此在数据挖掘领域得到了多方面的应用.然而随机森林算法在分类预测特征维度高且不平衡的数据时,分类性能受到了极大限制.为了更好地处理高维不平衡数据,...  相似文献   

19.
为了能够精准可靠地估计太阳能辐照度,本文提出一种基于贝叶斯模型组合的随机森林算法用于太阳能辐照度预测.首先,引入K-means聚类和K折交叉验证将气象数据训练集生成多个训练子集,以增加训练子集的多样性并保证均匀采样.其次,将随机森林作为基学习器建立集成学习预测模型,导入训练子集并训练各个随机森林.之后,依据各个随机森林在验证集上的预测性能,采用贝叶斯模型组合算法制定组合策略.个体随机森林在测试集上的预测值经过模型组合策略得到最终输出.最后,基于气象实测数据建立仿真实验,并引入其他四种预测方法进行对比仿真研究,通过实验结果验证了文中所提出预测方法在太阳能辐照度预测问题中的准确性和可靠性.  相似文献   

20.
为了提升传统随机森林算法的分类精度,本文首先对传统随机森林模型中的决策树根据分类性能评价指标AUC值进行降序排列,从中选取出AUC值高的决策树,计算这些决策树之间的相似度并生成相似度矩阵,然后根据相似度矩阵对这些决策树进行聚类,从每一类中选出一棵AUC最大的决策树组成新的随机森林模型,从而达到提升传统随机森林算法分类精度的目的。通过UCI数据集的实验表明,改进后的随机森林算法分类精度上最大提高了2.91%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号