共查询到20条相似文献,搜索用时 62 毫秒
1.
本文分析与比较了两种既能处理离散数据又能处理连续数据的决策树经典算法C4.5与CART。首先论述了两种算法的思想,并通过实例解析了C4.5算法和CART的实现过程,最后基于WEKA平台对它们进行了对比实验,利用实验结果的各项评价指标对这两种算法进行了性能分析与比较。 相似文献
2.
决策树C4.5算法在森林资源二类调查中的应用 总被引:3,自引:0,他引:3
C4.5算法是基于信息熵理论进行数据分类分析的经典决策树数据挖掘算法.它主要包括数据预处理、决策树生成、决策树修剪、决策树规则提取等步骤.笔者将C4.5算法应用于森林资源二类调查的数据分析中,通过对调查数据挖掘分析表明,数据挖掘在森林资源调查数据分析中具有广泛的应用前景. 相似文献
3.
数据挖掘技术从产生以来得到了广泛的研究和应用,在数据的分类技术方面C4.5算法的研究已经比较成熟,但在学生成绩挖掘方面的应用比较少,本文首先论述了主要分类技术,详细介绍了C4.5决策树分类算法,并以实际学生成绩数据为依据,进行学生成绩的数据挖掘,通过对挖掘结果的分析表明,C4.5决策树算法高效、准确,是对学生成绩数据挖掘的首选工具. 相似文献
4.
由于现有断路器的开断策略过于复杂,算法设计者不能完全预测算法的执行结果,而将决策树算法应用到智能断路器中,利用C4.5算法对断路器采集的信息进行自动提取知识,根据获得的知识,以最大信息增益率来建立决策树,并进行了简化,能够满足对断路器实时性的要求。 相似文献
5.
王文霞 《吉林大学学报(理学版)》2017,55(5):1274-1277
针对传统C4.5决策树分类算法需要进行多次扫描,导致运行效率低的缺陷,提出一种新的改进C4.5决策树分类算法.通过优化信息增益推导算法中相关的对数运算,以减少决策树分类算法的运行时间;将传统算法中连续属性的简单分裂属性改进为最优划分点分裂处理,以提高算法效率.实验结果表明,改进的C4.5决策树分类算法相比传统的C4.5决策树分类算法极大提高了执行效率,减小了需求空间. 相似文献
6.
电网调度中心报警信息中的大量噪声信息不仅加重了调度员的工作量,而且严重影响了事故异常处理的准确性和快速性。为了对报警信息进行噪声滤除,分析了决策树算法中C4.5算法的信息增益率的计算原理和特点,针对其计算量大的特点,对原C4.5算法进行改进,使其在相同准确率的情况下有更高的计算效率。将改进后的C4.5算法应用到报警信息噪声处理中。 相似文献
7.
8.
介绍了决策树算法的含义和构筑方法,对基于加权平均粗糙度构造决策树算法进行改进,通过实例说明了改进算法的优势。 相似文献
9.
许俊 《河北理工大学学报(自然科学版)》2007,29(2)
决策树是分类数据挖掘的重要方法.C4.5算法延用了经典ID3算法的基本策略,增加了处理连续属性的方法.在C4.5算法的基础上,讨论了新的基于属性变换的连续属性处理方法.该方法基于统计概率信息,依据概率属性的最佳分裂对应分裂连续属性,增加了决策树的分类精度. 相似文献
10.
本文简明扼要的介绍了数据挖掘中决策树SPRINT算法,并对其进行了一定程度上系统的分析和改进. 相似文献
11.
AdaBoost算法是一种将多个基学习器通过合理策略结合生成强学习器的集成算法,其性能取决于基学习器的准确率和多样性。但弱学习器分类精度不高往往也导致了最终强分类器性能较差,因此进一步为了提高算法的分类精确率,本文提出一种MDTAda模型,首先利用基尼指数迭代构造一棵不完全决策树,然后在决策树的非纯伪叶结点上添加简单分类器,生成MDT(模型决策树),将MDT作为AdaBoost算法的基分类器,加权平均生成强分类器。在标准数据集上的实验表明,相比传统的AdaBoost算法,本文提出的算法拥有更好的泛化性能和更优的间隔分布,且在与AdaBoost算法达到相同精度时所需迭代次数更少。 相似文献
12.
综合分析了岩爆的主要影响因素,选取岩石应力系数σ_θ/σ_c、岩石脆性系数σ_c/σ_t和弹性能量指数Wet作为评价指标,采用决策树方法进行岩爆烈度预测。以国内外比较典型的32个岩石地下工程实例作为基础样本数据,结合ID3算法建立了判定岩爆烈度的决策树模型。再选取15个工程实例,运用建立好的决策树模型对其岩爆烈度进行分级,并与实际岩爆等级以及采用模糊灰关联法、距离判别法、ν-SVR算法的评判结果进行对比。结果表明,本文提出的决策树方法具有计算简单、准确可靠、预测效率高的特点。 相似文献
13.
一种新的模糊决策树模型及其应用 总被引:1,自引:0,他引:1
模糊决策树是决策树在模糊环境下的一种推广,虽然其表示形式更符合人类的思维,但在构造时会增加预处理的工作量和创建树时的开销。基于这种情况,提出了一种混合算法,算法保留了较少属性值的Shannon熵,计算多属性和连续属性值模糊化后的模糊熵。将该算法应用于滑坡数据的挖掘中,得到了更易于理解的决策树和有效的规则,与传统算法的性能比较也证明了该算法的有效性。 相似文献
14.
针对数据挖掘过程中的数据库精炼问题,在分析现行属性约简方法的特点和不足的基础上,结合决策树算法操作简单、分类速度快的特点,通过知识的规则化描述以及规则族之间的相似性比较,建立了一种基于决策树的属性约简方法(简记为BD-RED),讨论了规则族之间的相似性度量的可释化构建问题,给出了BD-RED的具体实施策略,并结合实例分析了BD-RED的性能。结果表明,BD-RED具有良好的结构特征和较强的可操作性,可以有效实现不同决策理念下的属性约简,适合不同类型的大规模数据库的属性约简。 相似文献
15.
驾驶倾向性反映了驾驶员在车辆操作和运动过程中表现出的心理情感状态,对交通安全极为重要,准确地确定驾驶倾向性是研究驾驶员行为的难点.从研究驾驶员生理-心理特性的角度出发,利用决策树能融知识表示与获取于一身的优点,将决策树用于驾驶员驾驶倾向性的研究,实现了对驾驶员行为的模拟再现.仿真结果表明,该方法用于驾驶员驾驶倾向性的研究是可行的. 相似文献
16.
17.
利用Spark平台对电力用户侧的大数据进行分析,提出基于梯度提升树的并行负荷预测方法.首先对历史负荷和天气数据集进行并行化分割处理,并采用特征提取与转换方法获取到预测模型所需的特征向量;然后合理设定Spark集群节点数以及调节Hadoop分布式文件系统(HDFS)分块大小;最后将参数调优后的梯度提升树模型部署到Spark分布式平台上进行训练与预测,并将该模型预测结果与其他预测模型进行精度比较.研究结果表明:通过合理划分HDFS中存储块的大小能有效提高集群对于大数据处理的效率,分布式梯度提升树算法在快速性与准确性上均有比较大的优势,能够满足电力负荷预测的要求. 相似文献
18.
SVM在小训练样本、高维情况下具有很好的泛化性能,但它不适用于多类分类.本文分析基本的SVM和多类SVM分类器,重点讨论了SVM决策树,提出了一种结点分类器类集合划分方案来构造SVM决策树.实验结果表明,以这种方法构造的SVM决策树分类器分类性能较好. 相似文献
19.
决策树优化研究 总被引:2,自引:0,他引:2
杨辉 《上海理工大学学报》1999,21(1):36-38
提出用新的极值点禁忌搜索算法构造分类问题的全局优化决策树,该算法呆用于不可微分的目标函数。全局树优化方法是非贪婪的,用于构造具有固定结构的多变量决策树,将多变量决策树表示成析取线性不等式集合,全局树优化就是使析取线性不等式中的分类误差最小化。 相似文献
20.
一种有效的C 4.5改进模型 总被引:7,自引:0,他引:7
介绍了一种有效的决策树改进模型:R-C 4.5及其简化版本,旨在构造一棵简单的树,同时提高决策树属性选择度量的可解释性,减少空枝和无意义分枝,以及过度拟合。该决策树模型基于著名的C 4.5决策树模型,但在属性的选取和分枝策略上进行了改进。在R-C 4.5中,通过合并分类效果差的分枝,有效避免了碎片等问题。实验表明,R-C 4.5决策树在保持模型预测准确率的同时,有效改进了树的健壮性。作为R-C 4.5的简化版本,R-C 4.5c和R-C 4.5s可生成更为简单的树,而且R-C 4.5s通过数据预处理阶段完成,易于实现。 相似文献