首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 25 毫秒
1.
ID3算法是决策树学习归纳和数据挖掘中的核心方法。针对ID3算法存在的多值偏向问题,该文提出了一种新的方法对ID3算法加以改进。首先建立属性的关联矩阵,然后通过计算属性的类方差选择分裂属性,结合实例说明了改进算法的基本思想。实验结果表明,改进后的算法能够构造更合理的决策树并能在一定程度上克服多值偏向。  相似文献   

2.
数据挖掘之决策树方法概述   总被引:12,自引:0,他引:12  
数据挖掘在科研和商业应用中正发挥着越来越重要的作用。分类器是数据挖掘的一种基本方法,决策树是一种最重要的分类器。本文介绍了分类器中的决策树方法及其优点,决策树表示法,决策树构造思想,并比较了各种重要的决策树算法。介绍了决策树算法的实现工具,决策树与数据仓库的结合,决策树的适用范围及应用,最后探讨了决策树的发展趋势。  相似文献   

3.
分类是数据挖掘的一个重要研究方向,使用决策树进行分类是一种常用而且高效的分类方法。目前传统的算法有ID 3、C 4.5、CART等,这些算法都有如下的局限性:必须人工输入归类集合,划分属性,确定最优的分类集合。为了解决这些问题,本文做了如下工作:①提出信息增益排列GEP染色体头部的思想;②给出基于信息增益的GEP构造决策树属性约简算法(IG-GEPDTAR)并用实验进行验证;③实验表明该算法构造的决策树在具有100%准确性的同时,比使用GEP算法构造的决策树减少了冗余分支,其节点数比传统的ID 3算法和P ID算法构造的决策树的节点数分别减少了82.9%和31.2%。  相似文献   

4.
决策树算法的研究与改进   总被引:8,自引:0,他引:8  
决策树是数据挖掘中重要的分类方法,本文在研究和比较几种经典的决策树算法基础上,提出了一种改进的决策树算法:基于度量的决策树(MBDT).这种决策树实际上是把线性分类器和决策树结合在一起.实验证明,用该方法构造的决策树能有效地减少决策树的层数,从而提高决策树的分类效率.通过MBDT分类实验,验证了上面结论的正确性和有效性.  相似文献   

5.
ID3算法在计算机成绩分析中的应用   总被引:1,自引:0,他引:1  
通过介绍数据挖掘的概念和决策树分类方法,论述了ID3算法的基本思想和实现方法,并用该算法对学生计算机成绩进行分析,构造计算机成绩决策树并从中提取出一些重要规则,为教师教和学生学提供参考依据.  相似文献   

6.
ID3算法是决策树归纳分类算法的一种.通过对ID3算法的计算复杂度分析,提出了利用统计理论知识和条件概率的思想来改进算法,并把该算法应用于建立学生专升本考试成绩分析决策树中.  相似文献   

7.
数据挖掘中决策树分类方法研究   总被引:2,自引:0,他引:2  
分类知识的获取是数据挖掘所要实现的重要任务之一,其核心问题是解决分类模型的构造和分类算法实现问题.本文以决策树分类方法中有代表性的方法C4.5为例介绍数据挖掘中的一种分类模式:基于决策树方法的分类器的构建方法和算法.  相似文献   

8.
数据挖掘中决策树分类方法研究   总被引:1,自引:0,他引:1  
分类知识的获取是数据挖掘所要实现的重要任务之一 ,其核心问题是解决分类模型的构造和分类算法实现问题。本文以决策树分类方法中有代表性的方法 C4.5为例介绍数据挖掘中的一种分类模式 :基于决策树方法的分类器的构建方法和算法。  相似文献   

9.
增量决策树算法及复杂度分析   总被引:5,自引:1,他引:5  
介绍了增量决策树算法的基本原理,并从实例费用和信息熵费用两个角度出发,对增量决策树算法的复杂度进行分析.通过实例说明,增量决策树算法能够构造出与ID3算法形态基本相同的决策树.  相似文献   

10.
随着数据量的增长,根据数据分布寻找规律,要借助于相应的数据挖掘工具,这里主要采用决策树的方法.决策树算法是通过构造精度高、小规模的决策树采掘训练集中的分类知识.针对决策树存在的一些问题,提出了改进方法.  相似文献   

11.
PUBLIC在云南气象预报中的应用   总被引:2,自引:1,他引:1  
采用数据挖掘方法之一-分类规则挖掘法(构造决策树)对云南气象进行预报,主要依据PUBLIC构造决策树的算法思想,并在其上作了一定改进,基于1961年至1997年云南气象有关海温距平值、雨量、气温场等大量数据,对云南气象预报进行了深入研究和改进。  相似文献   

12.
介绍了决策树算法的基本原理,指出在决策树构建的过程中,ID3(Interative Dichotomic Version3)算法按照信息增益最大的原则选取属性,公式比较复杂,相应计算的复杂度也比较高,耗费较多的硬件资源.相对于ID3算法而言,条件概率决策树算法按照条件概率最大的原则选取属性,条件概率能够把属性和类别联系在一起,公式比较简单,有效地降低了计算的复杂性,并且决策树的建立提高了系统的精确度和检测速度.  相似文献   

13.
F:阐述数据挖掘的决策树算法,对ID3算法基本理论和原理进行介绍,运用该算法对教师教学质量测评数据进行分析,构造出质量测评数据决策树模型  相似文献   

14.
基于决策树构造算法ID3和C4.5,可衍生出诸多的算法变种.本据此提出了决策树构造系统设计过程中的“热点”问题,对“热点”问题的不同处理方式即为算法的变种.同时应用设计模式来逐一解决这些问题,这样.保证了所得的决策树构造系统具有良好的可扩展性和可复用性,可适应多种算法的变种.  相似文献   

15.
蔡星 《科技咨询导报》2014,(12):40-40,45
该文对传统的C 4.5决策树数据挖掘算法进行了改进,提出了一种双重熵平均决策树算法。传统的C 4.5决策树算法易出现无意义分枝,过度拟合等问题,针对该类问题,基于双重熵平均决策树算法,通过两次对样本子集熵平均值的计算、排序、合并处理,得到修正后的属性信息增益,并以此作为属性选择的依据,从而解决了传统C 4.5决策树算法可解释性差、易产生碎片等问题。  相似文献   

16.
决策树分类算法的分析和比较   总被引:2,自引:0,他引:2  
在数据挖掘中存在多种算法,决策树分类算法是应用比较多的一种。基于决策树分类算法的研究现状,对各种决策树分类算法的基本思想进行了阐述,并对不同的算法进行了分析和比较。  相似文献   

17.
顿毅杰  张永 《甘肃科技》2005,21(6):80-81
决策规则是关联规则、决策树和粗糙集等方法挖掘的主要对象。提出了一种基于属性值重要性的挖掘决策规则的新方法,该算法将属性值重要性看成是可以分辨的元组对数,从其构造的决策树中得到的规则与ID3算法产生的规则是等价的,但该方法计算复杂度低。  相似文献   

18.
将数据挖掘中的Gini Index决策树算法应用于人力资源管理,以人力资源绩效管理中的工作任务、工作质量、工作技能和工作态度作为决策属性构造决策树,通过实例说明Gini Index决策树算法在企业绩效评价中的具体构建流程,并验证了用Gini Index决策树方法作为绩效评价方法的可行性.  相似文献   

19.
关联规则的高效向量法数据挖掘   总被引:1,自引:0,他引:1  
对经典的向量挖掘算法和Apriori算法的思想及其复杂度进行分析后,提出了一种新的高效向量数据挖掘算法。新算法通过避免不必要的计算以达到提高算法的计算效率,通过避免不必要的存贮以达到减少算法的空间复杂度,与经典的向量挖掘算法相比有如下优点:(1)空间复杂度为o(n|L1|),比经典的挖掘算法的空间复杂度要小得多;(2)计算量比经典的挖掘算法要小。  相似文献   

20.
利用"基于决策类划分的新型多变量决策树算法"中的五大步骤,以"气象信息系统表"为实例构造多变量决策树,取得的结果与著名的单变量决策树(ID3)方法和粗糙集多变量决策树方法所获得的结果相同,证明本算法有效。其决策树构造过程简单,易于理解。通过时间复杂度的比较,证明本算法优于粗糙集算法速度更优和ID3算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号