首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
数据挖掘之决策树方法概述   总被引:12,自引:0,他引:12  
数据挖掘在科研和商业应用中正发挥着越来越重要的作用。分类器是数据挖掘的一种基本方法,决策树是一种最重要的分类器。本文介绍了分类器中的决策树方法及其优点,决策树表示法,决策树构造思想,并比较了各种重要的决策树算法。介绍了决策树算法的实现工具,决策树与数据仓库的结合,决策树的适用范围及应用,最后探讨了决策树的发展趋势。  相似文献   

2.
决策树算法的研究与改进   总被引:8,自引:0,他引:8  
决策树是数据挖掘中重要的分类方法,本文在研究和比较几种经典的决策树算法基础上,提出了一种改进的决策树算法:基于度量的决策树(MBDT).这种决策树实际上是把线性分类器和决策树结合在一起.实验证明,用该方法构造的决策树能有效地减少决策树的层数,从而提高决策树的分类效率.通过MBDT分类实验,验证了上面结论的正确性和有效性.  相似文献   

3.
介绍了决策树算法的含义和构筑方法,对基于加权平均粗糙度构造决策树算法进行改进,通过实例说明了改进算法的优势。  相似文献   

4.
赵德才 《科技信息》2010,(8):I0089-I0089
本文介绍了决策树方法的基本理论,详细介绍了决策树的经典算法ID3算法的使用条件,提出了在实际应用中的限制,并对该算法实际的应用提出了改进措施,使决策树方法能更好的为数据挖掘领域服务。  相似文献   

5.
在介绍数据挖掘、分类算法有关概念的基础上,介绍了决策树的具体生成算法.为了减少数据量,改进决策树算法实现时的数据结构,详细描述了基于SPRINT(scalable paraUehzable induction of decision trees)分类算法的实现,给出了SPRINT算法的性能评估。  相似文献   

6.
决策树分类算法研究   总被引:2,自引:0,他引:2  
决策树分类算法是数据挖掘研究中的一个以样本数据集为基础的归纳学习方法,它着眼于从一组无次序、无规则的样本数据集中推理出决策树表示形式的分类规则,提取描述样本数据集的数据模型。讨论了决策树分类算法的基本原理,给出了算法的特性并通过一个实例给出了具体的使用方法。  相似文献   

7.
文章提出了一种新的决策树构建算法,算法选择使生成的规则满足给定可信度阀值且支持度最大的属性作为结点,不仅简化了生成的决策树;且可以根据用户输入的可信度,得到相应的决策规则集,提高了决策树的泛化能力,有效地去除了噪音规则。应用实例分析,结果表明算法提取的决策规则简洁有效。  相似文献   

8.
基于决策树构造算法ID3和C4.5,可衍生出诸多的算法变种.本据此提出了决策树构造系统设计过程中的“热点”问题,对“热点”问题的不同处理方式即为算法的变种.同时应用设计模式来逐一解决这些问题,这样.保证了所得的决策树构造系统具有良好的可扩展性和可复用性,可适应多种算法的变种.  相似文献   

9.
决策树算法在医学图像数据挖掘中的应用   总被引:8,自引:1,他引:8  
目的研究决策树算法在医学图像数据挖掘中的应用。方法利用决策树算法对乳腺癌图像数据进行分类,提出了一个基于决策树算法的医学图像分类器。结果实现了ID3和C4.5算法对图像数据的分类,获得了分类的实验结果。结论该模型系统达到了较高的分类准确率,证明数据挖掘在辅助医疗诊断中有着广泛的应用前景。  相似文献   

10.
由于数据流的快速流动性以及计算机内存的限制,因此要设计好的数据流挖掘算法是很困难的事。近几年来,对数据流进行数据挖掘的算法相继被提出。本文主要阐述分类算法中基于决策树的各种数据流挖掘算法,包括传统的增量式的决策树分类、基于Hoeffding tree的VFDT、可调整的VFDT(即CVFDT)以及使用整合技术的决策树分类算法,通过分析比较,总结了各种算法的主要特征,为国内研究者提供借鉴。  相似文献   

11.
分析经典ID3型决策树挖掘算法中存在的问题,对其熵值计算过程进行改进,构建一种改进的ID3型决策树挖掘算法.重新设计决策树构建中的熵值计算过程,以获得具有全局最优的挖掘结果,并针对UCI数据集中的6类数据集展开挖掘实验.结果表明:改进后的挖掘算法在决策树构建的简洁程度和挖掘精度上,都明显优于ID3型决策树挖掘算法.  相似文献   

12.
针对传统C4.5决策树分类算法需要进行多次扫描,导致运行效率低的缺陷,提出一种新的改进C4.5决策树分类算法.通过优化信息增益推导算法中相关的对数运算,以减少决策树分类算法的运行时间;将传统算法中连续属性的简单分裂属性改进为最优划分点分裂处理,以提高算法效率.实验结果表明,改进的C4.5决策树分类算法相比传统的C4.5决策树分类算法极大提高了执行效率,减小了需求空间.  相似文献   

13.
决策树简化是决策树学习算法中的一个重要分支。文章以 ID3算法构造的决策树为基础 ,提出了一种高效的简化决策树的算法。算法先序遍历由 ID3构造出来的决策树的各个节点并对其子树进行比较 ,如果各子树的属性都相同而且存在某些相应的分支对于各子树完全相同 ,则改变决策树中相应属性的层次关系并把相同的分支分别合并起来。算法减少了决策树的深度、宽度与叶子数目 ,降低了决策树的规模。尤其对于逻辑表达式的归纳学习 ,简化之后的决策树要明显优于原决策树。  相似文献   

14.
针对ID3算法构造的决策树结构复杂、对噪声数据比较敏感等局限性,提出一种新的面向噪声数据的决策树构造算法。算法借鉴变精度粗糙集和尺度函数概念,采用不同尺度下近似分类精度选择测试属性构造决策树,在算法形成过程中利用决策规则的可信度对决策树进行修剪,避免了生成的决策树过于庞大。结果表明,该方法是有效的,能够克服部分噪声数据对决策树的影响,且能满足不同用户对决策精度的要求。  相似文献   

15.
决策树技术及其在药物治疗中的应用   总被引:2,自引:0,他引:2  
介绍了决策树技术及其算法,采用决策树中的C5.0算法,结合Clernentine工具对所给数据进行了分类。实现了其在药物治疗上的应用。  相似文献   

16.
基于变精度粗糙集模型,对文献[3]提出的生成决策树方法进行改进,把变精度加权平均粗糙度作为属性选择标准,提出一种构造决策树新算法.新算法用变精度近似精度来代替近似精度,能有效地克服噪声数据在构造决策树过程中对刻画精度的影响,使生成的决策树复杂性降低,泛化能力更强.  相似文献   

17.
陈燕  张振中 《科技信息》2007,(10):20-21
本文介绍了数据挖掘决策树算法的基本原理。并将决策树技术应用于肝癌病人预后的影响中。提出了一种预后影响的预测方法。通过20个样本数据,详细的介绍了建立决策树的步骤和方法。  相似文献   

18.
决策树分类算法的分析和比较   总被引:2,自引:0,他引:2  
在数据挖掘中存在多种算法,决策树分类算法是应用比较多的一种。基于决策树分类算法的研究现状,对各种决策树分类算法的基本思想进行了阐述,并对不同的算法进行了分析和比较。  相似文献   

19.
一种改进的决策树算法   总被引:1,自引:0,他引:1  
为解决决策树算法ID3的多值偏向的缺点,利用属性相似度偏向少值属性的特点,提出一种将属性相似度作为信息熵的系数的属性选择标准,从而提出相应的决策树生成算法.实验结果表明,新算法既避免了以信息熵作为属性选择标准的决策树算法的多值偏向,也避免了以属性相似度作为属性选择标准的决策树算法的少值偏向.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号