首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 638 毫秒
1.
基于多波束对长江河道底质分类关键问题进行了研究,对多波束反射强度数据进行改正并对多波束声呐图像进行预处理,采用灰度共生矩阵对底质反向散射强度图像进行纹理特征提取,最后将提取底质图像样本作为自组织特征映射神经网络和随机森林两种分类方法的训练数据,使用训练好的预测分类模型对反向散射强度图像进行全图底质分类.实验结果表明,SOM与随机森林分类方法的总体分类精度分别达到了82.5%与85.4%,对底质声呐图像实现了较好的预测分类效果.  相似文献   

2.
针对传统预测模型易陷入过拟合、缺失数据敏感、计算量大等不足,利用随机森林算法的双重随机性、处理数据集优异等特点,对A股股票涨跌预测进行研究。首先运用相关性分析对初始指标体系进行一次Spearman和二次Pearson筛选,去除指标体系中的冗余指标。然后对随机森林的各项重要参数进行优化,并对优化后的模型采用重要性估计方法以提升训练模型精确度。通过不同指标体系的对比,验证实验过程的正确性。最后,对比不同建模方法的实证预测结果,表明随机森林模型比传统机器学习方法二元logistic回归在性能上更优越,具备较高的预测准确度。  相似文献   

3.
有别于以往直接从介质几何结构或前期流场数据预测流场的方法,根据有限随机行走模型建立二维多孔介质随机行走数据矩阵作为输入,以相同介质利用LBM算法获得二维速率矩阵为输出,主要使用随机森林方法,在包含5000个数据的训练集上开展训练,得到预测函数.经测试集数据检验,预测流场与LBM算法计算所得结果非常接近.  相似文献   

4.
为了给消费者信贷决策提供合理依据,基于真实的客户信贷数据,运用逐步Logistic回归方法依据AIC准则进行变量选择建立经典决策树、条件推断树、随机森林、支持向量机等分类模型,并对4个分类模型的预测结果进行比较.结果表明:基于逐步Logistic回归建立的随机森林分类模型准确率达97%,预测效果最优;随机森林算法具有较...  相似文献   

5.
本文采用随机森林分类方法提取MODIS影像中的水体,根据水体和非水体在不同波段的反射率特征差异计算水体指数,选择一年内水体指数总和大于零的点构造分类特征,以全球30 m地表覆盖数据作为真值进行训练和验证.依据在随机森林中分类特征的重要性选出了10个分类特征,并通过一定量的实验统计选出有较好分类结果的随机森林模型参数.采用混淆矩阵及相关精度指标、Kappa系数等进行精度评价,获得较好的水体分类结果.  相似文献   

6.
乔瀚  容芷君  许莹  但斌斌  赵慧 《科学技术与工程》2021,21(36):15497-15502
考虑样本数据集的差异性和相关性对疾病预测结果有着直接影响,提出一种基于多特征属性患者相似的糖尿病早期预测方法,根据患者之间特征具有相似性这一特点,对患者特征进行混合属性相似预分组,再把分组结果导入随机森林分类器进行疾病预测。首先以临床概念作为患者的特征项,通过聚类定量化分析不同特征属性类型间的距离来度量患者之间的混合相似度,根据患者混合相似度将患者集预分组为多个患者相似组。最后以随机森林分类器对相似组进行细分类,得到最终的疾病预测结果,该结果与基于全样本数据的随机森林分类结果相比,分类准确率提高了8.3%;与基于单一属性相似组的随机森林分类结果相比,分类准确率提高了5.1%。结果表明该方法具有较高的预测准确率,可为糖尿病诊断预测提供支持。  相似文献   

7.
为了提高冲击地压危害预测的准确性,基于主成分分析法和随机森林算法,构建了由主成分分析方法优化的随机森林模型,分析静态冲击地压数据并处理异常值,通过数据标准化处理、计算相关系数矩阵及累计方差贡献率,提取出5个主要特征.利用优化的随机森林模型训练冲击地压数据集,使模型参数不断得到优化.以混淆矩阵中的准确率作为评估指标,将优化的随机森林模型与单一随机森林模型进行比较分析.实验结果表明,优化的随机森林模型比单一随机森林模型具备更好的效果,其准确率达到了88.9%,高于单一的随机森林模型,进而得出结论,即优化的随机森林模型能有效地对冲击地压危害进行预测,通过随机森林优化模型,一定程度上有效缩减冲击地压危害预测的时间.  相似文献   

8.
提出基于粗糙集和随机森林算法辅助糖尿病并发症分类。首先,运用简化的分明矩阵法对属性约简,产生新的决策信息系统;其次,采用随机森林算法对该新信息系统生成随机森林,实现分类;最后,通过糖尿病并发症临床诊断数据子集测试。实验表明该方法有效性,并优于直接用随机森林算法分类。  相似文献   

9.
在更加复杂的地质因素影响下,常规测井方法识别煤体结构准确度低,为精确识别煤体结构,研究了煤体结构测井曲线响应机理以及随机森林决策树个数的优选,从而建立煤体结构与测井曲线的随机森林分类模型进行煤体结构识别。结果表明:决策树个数为500时,随机森林分类模型效果最佳;通过袋外误差和模型对测试集样本的预测结果可知,随机森林分类模型的结果稳定且泛化性强,并且适合处理非均衡数据,预测精度较高。可见随机森林算法能有效识别煤体结构,为煤层气开发提供帮助。  相似文献   

10.
细胞类型鉴定是单细胞RNA测序的主要任务之一.针对整个问题,提出基于随机森林的细胞类型自动识别(automatic identification of cell type based on random forest, AICTRF)方法来识别单细胞测序数据中的细胞类型,该方法使用随机森林分类模型进行训练,根据训练的模型进而预测未知的细胞类型.在人类外周血单核细胞(PBMC)测序数据集上训练了随机森林分类模型,利用该模型预测了人类PBMC中B细胞的相关亚型细胞类型.实验结果表明,该方法可以帮助相关研究人员快速而有效地自动识别单细胞测序数据中的细胞类型.  相似文献   

11.
为了提升传统随机森林算法的分类精度,本文首先对传统随机森林模型中的决策树根据分类性能评价指标AUC值进行降序排列,从中选取出AUC值高的决策树,计算这些决策树之间的相似度并生成相似度矩阵,然后根据相似度矩阵对这些决策树进行聚类,从每一类中选出一棵AUC最大的决策树组成新的随机森林模型,从而达到提升传统随机森林算法分类精度的目的。通过UCI数据集的实验表明,改进后的随机森林算法分类精度上最大提高了2.91%。  相似文献   

12.
提出了一种非负矩阵分解-自回归模型,并用该模型对居民出行流量进行预测.该模型首先利用非负矩阵分解方法挖掘城市区域内的居民出行特征,而后在非负矩阵分解获得的特征矩阵和系数矩阵基础上对时序系数矩阵建立自回归模型,进而对起讫矩阵进行预测.以北京市出租车数据为基础,与时空权重K近邻、传统K近邻、反向神经网络、朴素贝叶斯、随机森林和C4.5决策树回归模型对比,实验结果表明,该模型的预测准确率有显著提升.  相似文献   

13.
选择凝灰岩岩屑作为预测对象,对测井数据进行标准化处理,对砂砾岩储层薄片鉴定结果和测井数据进行相关性分析,优选对岩屑敏感的CNL、GR、RT、RI、SP测井参数作为训练学习的对象;分别利用SVM、BP神经网络、CART、BP神经网络-Bagging、CART-Bagging、随机森林等机器学习方法建立岩屑预测模型,对西北缘X723井百口泉组岩屑成分进行预测、对比和分析。结果表明:单个机器学习方法预测效果不佳,而经集成学习方法优化的BP神经网络-Bagging、随机森林取得较好的实验结果,尤其是随机森林的预测效果最好,平均相对误差绝对值为17.17%,证实机器学习方法在本工区预测岩屑成分是有效的,可以进行推广。  相似文献   

14.
为了提高蛋白质相互作用位点预测的精度,该文基于蛋白质位置特异性得分矩阵(Position specific scoring matrix,PSSM),提出了一种新的加权得分矩阵直方图特征表示方法;针对训练数据的极端不平衡,结合下采样和分类器集成方法,训练随机森林集成分类器。相对于传统的特征,该文所提新特征具有更低的维数,同时拥有更好的鉴别性。分类器集成则缓解了下采样带来的信息丢失,并提高了分类精度。实验结果验证了所述方法是有效的,在标准数据集上的结果优于其他最新的蛋白质相互作用位点预测方法。  相似文献   

15.
为对高校大学生综合素质进行科学有效的分类,提出一种基于互信息-图注意力网络的大学生综合素质分类模型(Mutal_GAT).首先,对原始数据进行预处理和分析,并通过门控循环单元算法(GRU)获得特征向量矩阵;然后,通过互信息方法提取数据之间的关联信息,并以此形成互信息关联矩阵;最后,通过图注意力网络的多头机制实现分类预测.结果表明,Mutal_GAT模型在均方误差、准确率和召回率3项指标上均优于未加入互信息的图注意力网络、支持向量机、贝叶斯和随机森林随机梯度决策树分类算法.该模型在高校学生综合素质评定领域中具有良好的应用前景.  相似文献   

16.
 为快速、准确地预测冲击地压危险性,借鉴随机森林理论,选取影响冲击地压的10 项主要因素:煤层、倾角、埋深、构造情况、倾角变化、煤厚变化、瓦斯浓度、顶板管理、卸压、响煤炮声作为判别因子,建立冲击地压危险性识别的随机森林模型.利用重庆砚石台矿24 组实测数据作为学习样本建立随机森林分类器,在对样本分类的同时,计算预测变量的重要性值GI,发现构造情况为最重要的评价指标,其后是响煤炮声和倾角.利用其他12 组现场数据作为预测样本对该模型进行测试,预测结果与实际情况吻合较好.  相似文献   

17.
为了提升传统随机森林算法的分类精度,首先对传统随机森林模型中的决策树根据分类性能评价指标AUC(area under curve)值进行降序排列,从中选取出AUC值高的决策树,计算这些决策树之间的相似度,并生成相似度矩阵;然后根据相似度矩阵对这些决策树进行聚类。从每一类中选出一棵AUC最大的决策树组成新的随机森林模型,从而达到提升传统随机森林算法分类精度的目的。通过UCI(university of Californialrvine)数据集的实验表明,改进后的随机森林算法在分类精度上最大提高了2.91%。  相似文献   

18.
基于DPCA-BP神经网络的中长期电力负荷预测方法   总被引:1,自引:0,他引:1  
针对PCA-神经网络预测方法解决预测问题时,忽视数据自相关性而造成的预测结果难以满足实际工程要求精度的研究现状,建立了预测数据的增广矩阵.通过计算前l时刻数据确定增广矩阵的维数,并把得到增广后的预测数据作为BP神经网络的输入变量,建立了基于DPCA-BP神经网络的预测模型,给出了模型结构.该模型能有效地去除自变量系统中与因变量无关的数据信息,增加自变量系统中数据的自相关性.算例比较分析表明,所建立模型的模型成分解释性增强,预测精度提高,预测效果优于PCA-BP神经网络方法.  相似文献   

19.
为高效准确预测旅客选择空铁联运各中转城市的概率并揭示相关因素影响机制,基于互联网客票脱敏数据,应用随机森林算法、特征重要度和部分依赖图方法探究解释变量与中转城市备选集间的复杂作用关系.结果 表明,随机森林模型可有效处理不均衡分布样本,具有更高的预测精度,总体分类准确率可达88.54%,并具备描述自变量非线性作用的能力....  相似文献   

20.
随机森林在高光谱遥感数据中降维与分类的应用   总被引:2,自引:0,他引:2  
高光谱数据的特征数目庞大,而且波段之间存在冗余信息,对高光谱数据进行分类的成本较高,因此需要提取合适的特征达到提高效率的目的.随机森林作为一种热门算法,广泛应用于各种分类、特征选择等问题中,均取得了良好的效果.本文选择北京小汤山农业试验区的OMIS高光谱影像作为研究数据,利用随机森林算法计算每个特征的重要性指标并对其排序,针对面向精度和效率的特征选择策略,使用RF-RFE波段选择方法去除价值低的特征分别得到最佳波段组合,实现高光谱数据降维,进行随机森林、支持向量机分类.实验结果表明随机森林分类精度为72.82%,SVM分类精度为65.21%,随机森林分类器优于SVM,是一种较好的高光谱数据分类器.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号