首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
高光谱图像植被类型的CART决策树分类   总被引:2,自引:0,他引:2  
为提高植被分类的精度, 在利用高光谱图像提取植被信息时需要考虑训练样本和地形等其他因素的影响。以长白山为研究背景, 基于CART(Classification And Regression Tree)算法构建决策树模型, 对高光谱图像进行植被分类。由于混合像元的影响, 以采用PPI(Pixel Purity Index)提取的纯净像元作为训练样本, 提取植被指数、 纹理和地形等分类特征变量。基于这些变量构建CART决策树对植被分类, 并将结果与最大似然法分类结果进行比较。结果表明, CART决策树分类法可实现光谱、 纹理和地形特征的有效组合, 有较好的分类效果。  相似文献   

2.
基于Hyperion高光谱影像,对提取植被覆盖度的传统像元二分法进行了改进,提出通过地物分类来提高植被覆盖度提取精度的算法.该算法先对研究区进行分类,在较高分类精度的基础上,结合不同地物的NDVI频率累积图和实际情况得到各类地物的植被覆盖度,最后得到研究区域的整体植被覆盖度.结果表明,经支持向量机分类的总体精度为83.2%,Kappa系数为0.710;相同NDVI值,林地的植被覆盖度农田的植被覆盖度草地的植被覆盖度,实验结果与实际基本相符;改进的像元二分算法改善了传统像元二分法中存在的水体、裸地非植被覆盖区得到非0的植被覆盖度和高植被覆盖地区检测灵敏度下降等问题,丰富了传统像元二分法的细节信息,得到更符合实际的植被覆盖度.  相似文献   

3.
基于决策树和遗传算法的模糊分类系统设计   总被引:1,自引:0,他引:1  
提出一种基于决策树初始化和遗传算法优化的模糊分类系统的设计方法.该方法首先采用分类和递归树(CART)算法进行决策树的生长,树的修剪过程简化了初始决策树;然后,把修剪后的决策树转化为模糊模型,利用匹茨堡型实数编码的遗传算法优化该模糊模型.为了提高模型的解释性,在遗传算法中利用基于相似性的模型简化方法对模型进行约简.最后利用该方法对Iris问题进行研究,仿真结果验证了该方法的有效性.  相似文献   

4.
决策树作为从大规模数据中探索概念构成的代表,是弱化模型结构仅从数据出发构建概念的典型,所以决策树作为数据挖掘的典型技术得到了广泛的应用。根据临床检验资料信息,利用决策树模型建立2型糖尿病预测模型,为能更准确地诊断2型糖尿病提出理论依据。首先,搜集数据并进行预处理;然后,利用R语言编程构造ID3算法和CART算法的分类模型;再通过对ID3算法和分类回归树(CART)算法研究相比较,分析对比每个单一算法的性能和挖掘收集到的糖尿病数据;最后,比较2种方法的准确率,对预测结果进行评估。构建的诊断模型都具有较高的预测准确度,且CART模型优于ID3模型,对预测2型糖尿病的患病风险具有一定的临床参考价值。  相似文献   

5.
文章首次把CART决策树方法应用在关键词抽取工作中,并引进相似度进行了决策树方法的改进.在对特征值选择时,根据档案文本书写特征及习惯,选取档案文本的标题、档案关键词词性组合作为特征向量,并基于以往关键词抽取的先验知识加入词位置、相对频数、词语组合个数等作为特征向量.在CART决策树方法基础上,通过引入Jaccard系数合并相似度高的属性元素改进算法,来提高分类的准确率以及减小算法的复杂度.文章选取大量文本作为训练集,通过CART决策树方法进行训练学习而建立模型,建立好的模型能大大减少关键词抽取工作量,并提高关键词抽取的准确率.  相似文献   

6.
提出一种新颖的基于决策树方法的电能质量扰动自动分类方法.该方法首先对采集到的扰动信号进行小波多分辨率分解,扰动信号在每个小波分解尺度的能量分布构成一个特征向量;然后利用CART决策树算法从这些特征向量构成的训练样本中自动提取相应的分类规则,得到决策树分类模型,并将该模型应用到电能质量扰动测试数据中.仿真结果表明所提电能质量扰动数据分类挖掘方法的有效性和鲁棒性.  相似文献   

7.
王磊  郑任儿 《科技信息》2012,(30):156-157
本文分析与比较了两种既能处理离散数据又能处理连续数据的决策树经典算法C4.5与CART。首先论述了两种算法的思想,并通过实例解析了C4.5算法和CART的实现过程,最后基于WEKA平台对它们进行了对比实验,利用实验结果的各项评价指标对这两种算法进行了性能分析与比较。  相似文献   

8.
大多数机器学习算法能得到较好的分类效果,但模型却无法解释;而随机森林等模型有良好的可解释性,却无法处理中医数据中兼证的情况。本文利用极值随机森林算法对慢性胃炎中医数据进行证候分类研究,其中决策树的叶节点能输出多个标签,通过加权机制综合分量来处理兼证问题。与已有多标记学习算法和C4.5、CART等基于决策树的算法进行比较,实验结果表明,极值随机森林算法无论在6个证型的分类准确率上,还是在多标记评价指标上都具有更好的效果,而且模型中得到的规则基本符合中医理论。  相似文献   

9.
针对决策树泛化能力差,容易产生过拟合问题,提出基于随机化属性选择和决策树组合分类器。首先运用随机化邻域属性约减产生多个分类较高的属性子集;其次每个属性子集作为分类回归树(CART)的输入,训练多个基分类器;最后对得到的多个分类精度结果进行投票融合的方式获得最后的分类结果。实验表明,提出的随机属性选择和决策树集成算法有效性。  相似文献   

10.
分类是数据挖掘的一个重要研究方向,使用决策树进行分类是一种常用而且高效的分类方法。目前传统的算法有ID 3、C 4.5、CART等,这些算法都有如下的局限性:必须人工输入归类集合,划分属性,确定最优的分类集合。为了解决这些问题,本文做了如下工作:①提出信息增益排列GEP染色体头部的思想;②给出基于信息增益的GEP构造决策树属性约简算法(IG-GEPDTAR)并用实验进行验证;③实验表明该算法构造的决策树在具有100%准确性的同时,比使用GEP算法构造的决策树减少了冗余分支,其节点数比传统的ID 3算法和P ID算法构造的决策树的节点数分别减少了82.9%和31.2%。  相似文献   

11.
采用开放应用架构(OAA)准则训练多个二分类感知机,以Gini指数筛选最优的方法构建二叉决策树.推算说明感知机多分类准则在每个树节点上对空间划分的局限性,将基于口袋算法的二叉树与多叉树在8个UCI数据集上进行比较,并与单变量决策树CART和C4.5的结果进行对照.结果表明:采用口袋算法基于OAA方法构建的二叉树,在准确率和空间划分的可解释性上优于基于经典多分类准则构建的多叉树.  相似文献   

12.
CRUISE 2D决策树分类算法作为一种数据挖掘和知识发现的监督分类方法,综合了FACT,CART,QUEST决策树分类的思想.通过单因子和双因子交互检验和引导校正,快速有效地降低分割变量选择时产生的偏差,提高树的可读性,建立简单、高效、准确的决策树模型.基于CRUISE 2D决策树方法,以藏南地区为研究区,综合利用TM影像6个波段、NDVI,NDWI,SBI,GVI等波段信息,基于相同的训练样本和检验样本,利用判别规则建立决策树对影像进行分类;并将其与传统的监督分类方法 QUEST,SVM相比较,CRUISE 2D决策树分类方法总精度94.09%,比QUEST,SVM分类分别高10.86%,10.24%;Kappa系数0.931 0,比QUEST,SVM分类分别高出0.126 8,0.119 6.结果表明:CRUISE 2D能有效的改善传统监督分类中的错分漏分现象,在遥感分类上具有很高的稳健性和鲁棒性.  相似文献   

13.
针对目前不平衡大数据分类算法分类效果较差的问题,提出基于随机森林模型的不平衡大数据分类算法。首先采用SVM(Support Vector Machine)支持向量机算法对不平衡大数据进行信息过滤,然后利用反k近邻法检测并消除离群点,通过增量主成分分析法去掉不平衡大数据中协方差矩阵存在的奇异性,并依据熵值法对其展开权重解析,进而提取不平衡大数据特征信息。将CART(Classification and Regression Trees)决策树当作不平衡大数据的基分类器,进而构建随机森林决策树分类器,最后将提取的不平衡大数据特征信息输入分类器中,实现不平衡大数据分类。实验结果表明,该算法对不平衡大数据的采样效果较好,并且分类精准度、稳定性和性能都较高。  相似文献   

14.
土地利用信息是进行土地规划和管理的重要数据,有着重要的经济价值.采用计算机仿真技术对遥感影像进行自动分类是一种获取土地利用数据十分有效的手段.然而遥感影像的不确定、不一致现象易导致过度拟合,增加了分类难度.提出了一种新的基于粗集的决策树用于遥感影像分类.经试验表明该分类方法较CART树、ID3树等算法在分类精度、防止过度拟合方面均有所提高.  相似文献   

15.
样本分类规则提取是基因表达谱数据挖掘工作中的重要内容,提取肿瘤病理组织与正常组织的样本分类规则具有重要的生物学意义与临床诊断价值.针对该问题,基于机器学习与数据挖掘技术,研究了用于区分肿瘤与正常组织样本的分类规则提取问题.首先,利用改进的Relief算法生成候选特征子集,并以支持向量机作为样本分类模型,利用交叉验证方法在训练集上评估候选特征子集的样本分类能力,确定分类特征基因集合;然后,利用CART(classification and regression trees)学习算法构建决策树获得样本分类规则;最后,对所得规则进行了分析和解释.  相似文献   

16.
针对退役动力电池存在一致性差、等级筛选效率低的难题,提出了一种基于改进CART算法的退役动力电池等级筛选方法。首先,分析了传统CART算法的基本原理,为克服算法计算量大的缺陷,将Fayyad边界点判定定理与CART算法相结合,通过选取属性最优阈值点来减少计算量,提高分类效率;其次,基于代价复杂度后剪枝算法,采用交叉验证法对算法进行进一步优化;最后,将改进CART算法用于退役动力电池筛选分类,实验结果表明改进CART算法在保持较高准确率的情况下,可以有效提高退役动力电池的等级筛选效率。  相似文献   

17.
2000-2014年呼伦贝尔草原植被覆盖度时空变化分析   总被引:1,自引:0,他引:1  
以呼伦贝尔草原核心区的新巴尔虎右旗、新巴尔虎左旗、陈巴尔虎旗和鄂温克族自治旗为主要研究区,基于MODIS NDVI数据,利用像元二分模型反演得到植被覆盖度,并结合土地覆盖分类产品,构建2000—2014年研究区植被覆盖度时间序列.通过时间序列分析,从不同的时间和空间尺度分析草原植被覆盖度的变化规律;同时引入覆盖度异常变化点检测算法,并结合该地区同期气象数据,进一步探讨研究区植被覆盖度变化与气象因子之间的内在驱动力关系.结果表明,植被覆盖度在空间分布上主要表现为:从东往西依次递减,特别是研究区西南部,覆盖度最低;15年来研究区植被年际变化总体上呈现前10年下降、后5年缓慢上升的趋势.对植被覆盖度的异常变化进行分析,结果显示:返青期和枯萎期覆盖度的剧烈变化与温度的相关性较大,生长旺季内(7—8)月覆盖度的剧烈变化主要与降水量有关.  相似文献   

18.
为了分析研究不同地表发射率反演算法的精度和适用性,文中选取西安市的遥感影像Landsat 8为基础数据,运用ENVI,ArcGIS等软件,首先对Landsat 8数据进行预处理,提取西安市的NDVI影像;然后,建立决策树模型得到西安市地表分类影像,并基于像元二分模型反演得到植被覆盖度,基于NDVI得到4种不同算法的地表发射率;最后,以精度0. 01的MODIS LSE产品为标准数据,从像元尺度上对比分析了4种算法的精度,并依据回归决策树方法的分类结果,对比分析了不同算法在各类地表覆盖类型上的发射率反演差异。结果表明:在像元尺度上,植被指数混合模型法与NDVI~(TEM)改进算法精度较高且较为接近;从不同下垫面的反演差异来看,在植被区域4种算法之间的差异较小,而对于水体区域,4种算法之间的差异较大;从反演方法的适用性而言,植被指数混合模型法与NDVI~(TEM)改进算法较为适合本研究区。  相似文献   

19.
决策树分类算法的分析和比较   总被引:2,自引:0,他引:2  
在数据挖掘中存在多种算法,决策树分类算法是应用比较多的一种。基于决策树分类算法的研究现状,对各种决策树分类算法的基本思想进行了阐述,并对不同的算法进行了分析和比较。  相似文献   

20.
为提高滨海区域湿地信息提取的精度,以曹妃甸地区为例,通过融合主成分分析、形状、纹理、几何、水体指数、植被指数等52个特征变量,采用Relief-F算法模型优选出20个特征变量,对比分析C5.0、CART、QUEST决策树算法在滨海区域的分类精度.研究结果表明:特征优选下QUEST决策树方法的分类精度最高,总体分类精度为...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号