首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 687 毫秒
1.
利用随机森林算法,提出了一种基于随机森林特征选择的视频烟雾检测方法.首先,提取四种表征烟雾的特征:RGB颜色特征,小波变换高频子图,多尺度局部最大饱和度,多尺度暗通道;其次,根据烟雾图像信息模型利用无烟图片合成烟雾图片并分块得到随机森林训练样本;第三,训练随机森林进行特征选择并通过训练支持向量机得到识别烟雾块和非烟雾块的分类器,并由此得到视频图像帧的疑似烟雾区域;最后通过视频烟雾区域的凸形度和增长率分析,得到烟雾检测的结果。实验结果表明,该方法能够及时的预警烟雾同时降低火灾预警的误报率.  相似文献   

2.
对于专利价值的不确定性和影响因素的复杂性,以及评估工作中缺乏可操作性强并且科学高效的评估方法等问题,对价值评估指标体系进行分析,并使用随机森林算法选择最有效的指标集,同时基于DBSCAN(density-based spatial clustering of applications with noise)聚类选择高精度且一致性低的决策树子森林改进传统随机森林算法,使用改进前后的两种随机森林模型在专利数据样本上进行实验并比较。结果表明,改进的随机森林模型提升了传统模型的精度,在专利价值评估中具有一定的作用,总体上比较有效地反映了专利的价值度。  相似文献   

3.
随机森林在高光谱遥感数据中降维与分类的应用   总被引:2,自引:0,他引:2  
高光谱数据的特征数目庞大,而且波段之间存在冗余信息,对高光谱数据进行分类的成本较高,因此需要提取合适的特征达到提高效率的目的.随机森林作为一种热门算法,广泛应用于各种分类、特征选择等问题中,均取得了良好的效果.本文选择北京小汤山农业试验区的OMIS高光谱影像作为研究数据,利用随机森林算法计算每个特征的重要性指标并对其排序,针对面向精度和效率的特征选择策略,使用RF-RFE波段选择方法去除价值低的特征分别得到最佳波段组合,实现高光谱数据降维,进行随机森林、支持向量机分类.实验结果表明随机森林分类精度为72.82%,SVM分类精度为65.21%,随机森林分类器优于SVM,是一种较好的高光谱数据分类器.  相似文献   

4.
针对传统异常用电检测在面临高维数据中的维数诅咒,以及不相关特征对异常检测的影响,造成检测精度低等问题。提出了一种基于无监督密度子空间选择的孤立森林检测算法。首先,提出了一种有效的基于密度的紧凑数据表示方法,提高了子空间选择策略的效率。然后,应用最小冗余-最大相关-密度准则(min-Redundancy-Maximum-Relevance-to-Density , mRMRD),用于选择基于互信息的相关子空间。最后,在相关子空间中构建隔离树并集成孤立森林,实现对异常用电数据的检测。通过实验分析,与传统检测算法相比,所提方法在准确率、ROC曲线下面积(Area Under Curve,AUC)、F1-Score指标上均有提升,提高了异常用电检测的效果。同时,灵敏性分析也验证了无监督密度子空间孤立森林检测算法的有效性。  相似文献   

5.
提出了一种新的大迎角非线性非定常气动力和气动力矩建模方法.传统的依据物理机理分析、实验观测等来建立飞机气动系数与飞行状态之间的建模方法在大迎角非线性非定常气动力和气动力矩建模中存在着局限性,导致模型精度不高,针对这个问题,提出了随机森林建模方法.根据风洞中飞机大迎角俯仰机动的特点,结合随机森林模型的原理,确定了与大迎角随机森林模型相关的输入特征,通过误差分析实验确定了随机森林模型中决策树个数和内部节点随机选择属性个数等关键参数的取值,利用F-18缩比模型在低速风洞中实验数据进行实验,结果表明,与经典的多项式模型相比所建立的随机森林模型得到的预测结果与真实数据之间的误差更小.   相似文献   

6.
煤与瓦斯突出是煤矿事故发生的主要原因.正确预测煤与瓦斯突出,对于煤炭企业安全生产具有重要意义.对和煤与瓦斯突出相关的5个特征进行分析,采用拉依达准则处理数据异常值.针对数据变量缺失的情况,选择具有代表性的均值插补、多重插补、K近邻插补和随机森林插补方法完成数据插补.采用随机森林、支持向量机和K近邻模型进行煤与瓦斯突出预测.采用精确度,特异度和敏感度作为性能指标.实验表明,采用随机森林数据插补方法并利用随机森林模型完成的预测,取得了精度98.94%、敏感度98.67和特异度100%的性能,在所有数据插补方法和预测模型组合中性能最优.  相似文献   

7.
本文采用随机森林分类方法提取MODIS影像中的水体,根据水体和非水体在不同波段的反射率特征差异计算水体指数,选择一年内水体指数总和大于零的点构造分类特征,以全球30 m地表覆盖数据作为真值进行训练和验证.依据在随机森林中分类特征的重要性选出了10个分类特征,并通过一定量的实验统计选出有较好分类结果的随机森林模型参数.采用混淆矩阵及相关精度指标、Kappa系数等进行精度评价,获得较好的水体分类结果.  相似文献   

8.
针对两个紧耦合子任务的任务分配问题,从宏观层面上进行了数学建模,通过求解该数学模型,获得了任务分配需要遵循的基本分配原则.根据该原则设计了一个随机任务选择模型以及相应算法,通过统计机器人操作子任务的时间,算出每个子任务的选择概率,然后以该概率随机选择子任务.对基于该算法的随机系统进行了统计建模,分析表明该算法下任务分配结果与基本分配原则保持一致.最后,建立了一个多机器人物品搬运仿真实验系统,将任务分配算法应用到该系统,分析了算法的有效性以及各种参数对实验结果的影响.  相似文献   

9.
将无线OFDMA Ad-hoc网络的最优调度建模为条件受限的联合层资源分配优化模型,基于该模型,该文提出了一个基于启发探索机制的分布式调度算法(DSA).该算法根据局部子载波信道状态为每一个链路选择子载波,采用随机概率选择机制来保证链路子载波选择的有效性.仿真结果表明:与传统方法相比,该文提出的DSA算法能够取得更好的有效性,通过改变DSA算法的链路子载波选择概率阈值,总体的公平性能够进一步提高.  相似文献   

10.
使用ASD Field3在武夷山实测的9种鲜茶叶数据,该数据经过预处理后,计算24种光谱指数,用于对9种茶叶的分类,用SVM-RFE对光谱反射率数据和光谱指数数据进行特征选择,最后用线性SVM和随机森林分类.检验SVM分类器的性能和SVM-RFE选择特征的适用性,其中SVM分类器在4个数据集中都达到了95%以上的分类精度.随机森林分类器在其中3个数据集达到90%以上的精度,一个70%的精度.研究表明SVM-RFE是一个稳定有效的特征选择算法,并且SVM的性能优于随机森林.  相似文献   

11.
为了给消费者信贷决策提供合理依据,基于真实的客户信贷数据,运用逐步Logistic回归方法依据AIC准则进行变量选择建立经典决策树、条件推断树、随机森林、支持向量机等分类模型,并对4个分类模型的预测结果进行比较.结果表明:基于逐步Logistic回归建立的随机森林分类模型准确率达97%,预测效果最优;随机森林算法具有较高的分类精度,可以很好地应用在个人信用评估问题研究中.  相似文献   

12.
在肿瘤特征基因选择过程中,传统分类方法会选出大量冗余基因,而大量冗余基因会造成分类精度低和时间复杂度较高等问题,为了解决上述问题,提出一种结合信噪比过滤法与随机森林算法的肿瘤特征基因选择方法.该方法包含两个过程:首先使用信噪比过滤法剔除原始特征空间中的无关和冗余基因,从而获得与分类属性相关性较高的基因,选择出分类能力较强的预选特征子集;其次使用随机森林算法对特征基因子集进行分类,最终获得分类结果.实验结果显示,该算法可以快速有效地选择出肿瘤特征基因,并具有较高的分类精度.  相似文献   

13.
针对信用卡诈骗犯罪侦查工作中可疑交易识别问题,提出一种可疑交易检测方法,测试了不同参数环境下属性重要性的敏感性,采用随机森林方法进行特征选择,设计了可疑交易检测的模型.采用一组真实的信用卡交易数据对所提出的方法进行了实验,并与逻辑回归和支持向量机方法进行了比较分析.实验结果表明:所提出的基于随机森林的检测方法在综合指标上优于其他两类方法.研究成果为信用卡诈骗犯罪侦查提供了有效的分析手段,有助于提高可疑交易的识别效率.  相似文献   

14.
全国第三次土地调查内业当中要求作业员将不同地物进行分类,常用的方法是在Arcgis中对地物进行手动勾绘,此操作对作业员的目视解译要求较高且费时费力。基于此本文提出利用面向对象的随机森林方法对研究区进行分类。首先通过选择最优分割尺度与影像特征,再利用随机森林进行分类得到分类结果,并与面向对象的最近邻分类方法进行对比,结果表明:随机森林的总体分类精度为89%,比面向对象提高了4%,随机森林的Kappa系数为0.74,比面向对象提高了0.09。因此利用随机森林分类方法更适合第三次全国土地调查的分类。  相似文献   

15.
随机子空间聚类集成通过属性随机采样产生属性子空间,并将子空间上的基聚类结果进行集成得到最终聚类结果.在这一过程中,子空间产生的随机性虽然为聚类集成提供了很大的差异度,但是无法保证基聚类结果的有效性,这是因为随机产生的子空间有可能只包含极少的重要属性.针对这一不足,提出了一种带核随机子空间生成策略:首先依据粗糙集理论中的互补互信息选出对于刻画数据集整体信息至关重要的属性子集,作为每个属性子空间的"核心",再从剩余属性集中随机选择一定数量的属性与核心属性共同构成聚类子空间.这种策略在兼顾子空间之间差异性的同时也提高了每个属性子空间对数据整体信息的刻画能力,从而得到更好的聚类集成结果.在大量UCI数据集上的实验证实了所提方法的合理性和有效性.  相似文献   

16.
随机森林在企业信用评估指标体系确定中的应用   总被引:3,自引:0,他引:3  
评估指标体系的确定是企业信用评估的一个关键环节,指标体系选取的好坏直接影响模型的预测准确率.本文引进组合学习算法的新方法随机森林(Random Forest,RF)来选择指标,使得到的指标体系更加客观,更加符合机器学习的特点.实验证明,该方法确定的指标体系能更有效地体现企业的信用状况,使用该指标体系建立的随机森林评估模型具有更高的预测准确率.  相似文献   

17.
针对k均值聚类算法的聚类结果易受初始中心随机选择和噪声的影响,本文提出了一种改进的快速全局k均值聚类算法,该方法将聚类中心选择转化为一系列子问题,解决了k均值原始聚类中心的随机选择而导致聚类结果不正确的问题,通过中值方法选择新一轮聚类中心,缓解了k均值聚类结果易受噪声影响的问题.实验结果表明,本文提出方法提高了图像聚类分割的准确性.  相似文献   

18.
提出一种利用Landsat数据和时间序列子序列的退耕监测方法.首先利用随机森林方法,对每年的Landsat数据统计值进行分类,得到每个像元属于农田的概率,由每年的农田概率构成年际的农田概率时间序列;然后,对退耕(农田变为非农田)及相关地物类别的农田概率时间序列进行分析,得到代表退耕的时间序列片段,即特征子序列;最后,计...  相似文献   

19.
研究了一类随机时变森林发展系统.通常情况下,随机时变森林系统很难求出解析解.根据Euler方法,构造了系统的数值解,并应用It(o)公式和Burkholder Davis Gundy不等式证明了数值解的收敛性.  相似文献   

20.
将随机森林的相似度矩阵看做一种特殊的核度量,利用该度量对模型参数的鲁棒性和特征变化的敏感性,提出一种特征选择的方法.采用相似度矩阵,计算训练样本类内和类间相似性比率.再利用特征值随机置换技术,将相似性比率的变化量作为特征重要性度量指标,从而对所有特征进行排序.试验结果表明,该方法能充分利用全部样本的信息,有效地进行特征选择,且其性能优于基于袋外数据误差率估计的特征选择方法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号