共查询到20条相似文献,搜索用时 0 毫秒
1.
本文为提高C4.5算法的准确率引进一个平衡度系数,其大小由决策者依靠先验知识或领域知识确定,在特定环境下人工协调了各属性信息增益率,用改进后的算法构造出的决策树进行分类更为准确、合理。并通过实例分析对改进前后的算法进行了比较,证明改进算法的有效性。 相似文献
2.
一种改进的决策树学习算法 总被引:3,自引:1,他引:2
为提高C4.5算法的准确率引进一个平衡度系数,其大小由决策者依靠先验知识或领域知识确定,在特定环境下人工协调了各属性信息增益率,用改进后的算法构造出的决策树进行分类更为准确、合理.并通过实例分析对改进前后的算法进行了比较,证明改进算法的有效性. 相似文献
3.
许俊 《河北理工学院学报》2007,29(2):71-74,80
决策树是分类数据挖掘的重要方法。C4.5算法延用了经典ID3算法的基本策略,增加了处理连续属性的方法。在C4.5算法的基础上,讨论了新的基于属性变换的连续属性处理方法。该方法基于统计概率信息,依据概率属性的最佳分裂对应分裂连续属性,增加了决策树的分类精度。 相似文献
4.
决策树算法的研究与改进 总被引:8,自引:0,他引:8
冯少荣 《厦门大学学报(自然科学版)》2007,46(4):496-500
决策树是数据挖掘中重要的分类方法,本文在研究和比较几种经典的决策树算法基础上,提出了一种改进的决策树算法:基于度量的决策树(MBDT).这种决策树实际上是把线性分类器和决策树结合在一起.实验证明,用该方法构造的决策树能有效地减少决策树的层数,从而提高决策树的分类效率.通过MBDT分类实验,验证了上面结论的正确性和有效性. 相似文献
5.
决策树算法是数据挖掘中非常活跃的研究领域.通过对数据挖掘中决策树的基本思想进行阐述,讨论了决策树经典算法(ID3算法)的计算复杂度问题,并针对这一问题提出了利用统计理论知识和条件概率的思想来改进构造决策树的算法.实验表明,这种构造决策树算法的计算复杂度明显优于传统的算法,其效率也有很大的提高. 相似文献
6.
决策树C4.5算法的改进及应用 总被引:12,自引:3,他引:9
根据C4.5算法中信息增益率计算原理的特点,利用数学上等价无穷小的性质提出一种新的改进的C4.5算法,减少了信息增益率的计算量,进而提高C4.5算法中信息增益率的计算效率.改进的C4.5算法与原C4.5算法相比,在构造决策树时具有相同的准确率和更高的计算速度,将改进后的C4.5算法应用到成绩分析中. 相似文献
7.
介绍了决策树算法的含义和构筑方法,对基于加权平均粗糙度构造决策树算法进行改进,通过实例说明了改进算法的优势。 相似文献
8.
为了改进不平衡数据的分类性能,提出一种可自动确定迭代参数trail值的集成C5.0决策树算法.首先,算法引入boosting集成框架到C5.0决策树算法中,从而生成新的集成分类器;其次,算法使用网格搜索法在一定范围内自动确定trail参数的值.实验结果表明,该算法在不平衡数据上的分类性能指标G-mean和MCC上具有优势. 相似文献
9.
决策树C4.5连续属性分割阈值算法改进及其应用 总被引:1,自引:0,他引:1
结合Fayyad边界点原理提出一种新的连续值属性最佳分割阈值的选择算法.根据Fayyad连续值属性的最佳分割点总在边界点处的原理,只在连续属性分界点处的少数几个分割点中选择最佳分割阈值.构造并训练了改进C4.5分类器,将其应用于视频序列中的人车目标识别.实验结果表明:改进C4.5算法的计算量减少近20%,大大提高了决策树的生成效率,分类准确率也略有提高. 相似文献
10.
本文分析与比较了两种既能处理离散数据又能处理连续数据的决策树经典算法C4.5与CART。首先论述了两种算法的思想,并通过实例解析了C4.5算法和CART的实现过程,最后基于WEKA平台对它们进行了对比实验,利用实验结果的各项评价指标对这两种算法进行了性能分析与比较。 相似文献
11.
决策树算法在智能断路器中的应用 总被引:1,自引:1,他引:0
由于现有断路器的开断策略过于复杂,算法设计者不能完全预测算法的执行结果,而将决策树算法应用到智能断路器中,利用C4.5算法对断路器采集的信息进行自动提取知识,根据获得的知识,以最大信息增益率来建立决策树,并进行了简化,能够满足对断路器实时性的要求。 相似文献
12.
岳丹丹 《黔西南民族师范高等专科学校学报》2012,(6)
ID3算法是数据挖掘中决策树方法的重要算法,它可以从海量数据中提取适应不同使用者需求的信息.以对学科成绩的挖掘为例,介绍为何使用、如何使用ID3算法,使之成为提高工作效率的有力工具. 相似文献
13.
电网调度中心报警信息中的大量噪声信息不仅加重了调度员的工作量,而且严重影响了事故异常处理的准确性和快速性。为了对报警信息进行噪声滤除,分析了决策树算法中C4.5算法的信息增益率的计算原理和特点,针对其计算量大的特点,对原C4.5算法进行改进,使其在相同准确率的情况下有更高的计算效率。将改进后的C4.5算法应用到报警信息噪声处理中。 相似文献
14.
吴碧霞 《成都大学学报(自然科学版)》2011,30(4):335-338
传统的ID3决策树算法存在诸多不足,如计算效率低、多值偏向等,对此,提出了属性值空缺、多值属性的选择以及属性选择标准方面的改进方案,并将加权熵和简化熵引入决策树算法以改进传统ID3算法.实验结果表明,改进后的算法在整体性能方面较目前广泛应用的ID3算法有更优秀的性能表现. 相似文献
15.
本文对经典的基于信息增益的决策树算法进行改进,提出一种基于决策树与属性相关性相结合的入侵检测算法。该算法同时结合综合策略的剪枝算法以避免过度拟合对检测结果的影响。实验结果证明,本算法不仅在面对已知攻击时能够做出良好的判断,而且在面对未知攻击时仍然具有一定的检测能力,具有良好的性能和可用性。 相似文献
16.
王文霞 《吉林大学学报(理学版)》2017,55(5):1274-1277
针对传统C4.5决策树分类算法需要进行多次扫描,导致运行效率低的缺陷,提出一种新的改进C4.5决策树分类算法.通过优化信息增益推导算法中相关的对数运算,以减少决策树分类算法的运行时间;将传统算法中连续属性的简单分裂属性改进为最优划分点分裂处理,以提高算法效率.实验结果表明,改进的C4.5决策树分类算法相比传统的C4.5决策树分类算法极大提高了执行效率,减小了需求空间. 相似文献
17.
介绍了决策树算法的基本原理,指出在决策树构建的过程中,ID3(Interative Dichotomic Version3)算法按照信息增益最大的原则选取属性,公式比较复杂,相应计算的复杂度也比较高,耗费较多的硬件资源.相对于ID3算法而言,条件概率决策树算法按照条件概率最大的原则选取属性,条件概率能够把属性和类别联系在一起,公式比较简单,有效地降低了计算的复杂性,并且决策树的建立提高了系统的精确度和检测速度. 相似文献
18.
许俊 《河北理工大学学报(自然科学版)》2007,29(2)
决策树是分类数据挖掘的重要方法.C4.5算法延用了经典ID3算法的基本策略,增加了处理连续属性的方法.在C4.5算法的基础上,讨论了新的基于属性变换的连续属性处理方法.该方法基于统计概率信息,依据概率属性的最佳分裂对应分裂连续属性,增加了决策树的分类精度. 相似文献
19.
在不平衡数据集中,多数类不一定是最优的,这一问题将会影响决策树的生成效果和分类预测的准确性,提出类置信度比例决策树算法,这种算法对类的大小不敏感.通过实验验证,这种算法比传统的决策树算法更具有优越性. 相似文献
20.
基于ID3算法决策树的研究与改进 总被引:1,自引:0,他引:1
《科技信息》2008,(23)
ID3算法是决策树学习的核心算法,本文主要论述了ID3算法的主要思想,并根据原有算法的不足之处,做了改进。 相似文献