首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
决策树归纳法ID3是人工智能机器学习中发展较快的一种归纳学习算法,而目前的ID3及其改进算法亦因各种问题限制了其在工程中的应用。基于决策树归纳学习算法示例学习最优化的理论,用在多概念学习条件下对多特征属性值进行分组聚类实现优化的方法,导出了定义在多概念窨上的决策树归纳学习算法NMID。这种新算法对工程技术领域普遍存在的多概念学习问题,有较好的应用价值。  相似文献   

2.
决策树学习是以实例为基础的归纳学习[1].该类方法从一类无序,无规则的事物(概念)中推理出决策树表示的分类规则.该方法的起源最早来源于Hunt,Marin和Stone于1966年研制的CLS(ConceptLearning System概念学习系统).1979年,J.R.Quin-lan给出了ID3(Interative D icrem iser Versi  相似文献   

3.
决策树简化是决策树学习算法中的一个重要分支。文章以 ID3算法构造的决策树为基础 ,提出了一种高效的简化决策树的算法。算法先序遍历由 ID3构造出来的决策树的各个节点并对其子树进行比较 ,如果各子树的属性都相同而且存在某些相应的分支对于各子树完全相同 ,则改变决策树中相应属性的层次关系并把相同的分支分别合并起来。算法减少了决策树的深度、宽度与叶子数目 ,降低了决策树的规模。尤其对于逻辑表达式的归纳学习 ,简化之后的决策树要明显优于原决策树。  相似文献   

4.
李晋  顾宏斌  潘湑 《科技信息》2010,(28):270-271
决策树学习策略广泛应用于模式识别和机器学习等领域,用来解决与分类相关的问题。决策树剪枝的作用是简化决策树,提高决策树的泛化能力,避免对训练集的过适应,是决策树学习中的重要研究内容。本文详细介绍了数据挖掘算法中的C4.5算法的基本思想,并且对REP剪枝技术进行分析,以此对C4.5算法进行剪枝。实验表明改进的C4.5算法与原C4.5算法相比能很好地处理训练集的非平衡性,并降低决策树的规模,效率得到提高。  相似文献   

5.
机器学习技术在现代各种数据分析中是备受关注的有效方法之一,目前已在众多领域得到广泛应用。文章以目前较为流行的决策树学习为重点,介绍了决策树学习的几个较为成熟的算法,并将相应算法应用到机械波图像分析中,提出了5点、7点与11点上下文决策树学习算法。通过实验验证该处理方法是有效的。  相似文献   

6.
王中辉  鲁来凤 《甘肃科技》2006,22(3):125-126,106
决策树是用来解决分类问题的重要方法之一。ID3是决策树学习的核心算法,为此,本文给出了决策树构造思想和ID3决策树学习算法,并将其应用于教学评价之中,这样可以提高教学评价技术水平,提高教学评价的科学性、客观性和公正性,使之更好地为教学服务。  相似文献   

7.
WEKA中的Id3决策树算法   总被引:1,自引:0,他引:1  
ID3算法是决策树学习归纳和数据挖掘中的核心方法。本文对ID3算法及其在WEKA中的实现进行了阐述,给出了使用剪枝阈值对决策树进行先剪枝的方法,最后通过实例对该方法的有效性进行了验证。  相似文献   

8.
基于决策树的神经网络规则抽取方法   总被引:2,自引:0,他引:2  
将从神经网络中抽取一个可理解的模型视为一个归纳学习任务 ,其中 ,目标概念就是神经网络表达的功能 ,所生成的可理解模型是一个能很好近似神经网络的决策树 .在这个过程中 ,应用了决策树归纳学习的优化原则 ,使得生成的决策树能最简洁、准确地描述神经网络学到的知识 .实验证明 ,生成的决策树可以很好地近似神经网络 ,且比用传统方法生成的决策树具有更好的分类精度 ,同时NNtoDT算法也保持了具有较好的通用性和可扩充性的特性 .  相似文献   

9.
决策树采取的是一种急切式学习算法,是迄今为止在实践中应用最为广泛的一种分类方法。决策树分类器在训练阶段根据训练实例集合建立了一棵整体上最优的树,这棵树被用来在测试阶段给未分类的实例指派最适合的类标。决策树具有良好的可解释性,分类速度快,但是它的剪枝过程非常繁琐,分类精确度也不是非常高.把懒惰式思想引入决策树,学习过程被推迟到给定一个测试实例时才进行。它从概念上为每一个测试实例建立一棵最优决策树。实验数据显示此法显著提高了分类器性能,但分类速度较慢。  相似文献   

10.
Fayyad连续值属性决策树学习算法使用信息熵的下降速度作为选取扩展属性标准的启发式,本文针对其易选取重复的条件属性等不足之处,引入属性间的交互信息,提出了一种改进算法--基于交互信息的连续值属性决策树学习算法,它的核心是使用信息熵和交互信息的下降速度作为选取扩展属性标准的启发式.实验结果表明,与Fayyad决策树学习算法相比,该算法降低了决策树中同一扩展属性的重复选取率,实现了信息熵的真正减少,提高了训练精度和测试精度,能构造出更优的决策树.  相似文献   

11.
决策树是一种类似于流程图的属性结构。决策树算法主要用于分类和预测,是以样本为基础的归纳学习方法。决策树技术中的算法有很多,常用的是Quinlan于1979年提出的ID3算法。ID3算法相对于其它数据挖掘分类技术中的算法而言,有着自己的优势,但在实际应用中也有一些不足,需要进行改进。  相似文献   

12.
决策树各类算法,各有特点,其中J.R.Quinlan提出的ID3算法最具代表性,在国际上的影响也最大,C4.5算法就是在ID3算法基础上进行改进得到的.通过对两种算法详细描述,阐明了决策树算法步骤及其主要思想.  相似文献   

13.
设计是一个复杂的问题求解和逐步求精的过程,学习可以有效地利用经验知识改进设计者及计算系统的能力,提出了一种面向对象的设计模型,并介绍了基于该模型的设计知识表示方法及用决策树进行分类的方法,然后,介绍了多Agent设计概念学习系统DCLS(Design Concept Leaming System)的结构及学习过程。  相似文献   

14.
决策树学习算法是数据挖掘中一类经典的分类算法。传统的决策树学习算法把数据集合中的实例同等对待,而忽略了实例之间存在的可疑性和影响度差异,导致错误实例扭曲了学习结果,严重影响学习质量。在此提出基于可疑实例影响度分析改进的C4.5 rules算法,在给定一个噪音集合后,首先把可疑实例与原集合划分开,并对可疑实例的影响度进行分析和度量,然后依据分类规则对可疑实例的覆盖情况进行重新排序和分类预测。算法在对分类规则重排序后将错误实例对学习结果的影响最小化,得出尽可能接近正确数据的学习结果。将此算法与经典的C4.5 rules算法进行实验比较,结果表明该算法有着良好的性能。  相似文献   

15.
焦树军  安志江 《科技信息》2011,(25):I0086-I0087
决策树归纳是归纳学习的一种。由于NP困难,寻找最优的决策树是不现实的,从而探索各种启发式算法去产生一个高精度的决策树变成了这类研究的焦点。考虑到支持向量机(SVM)的分类间隔与泛化能力的关系,可以使用SVM的最大间隔作为生成决策树的启发式信息,使得决策树有较强的泛化能力。本文针对实值型数据,提出了一种基于最大间隔的决策树归纳算法。实验结果表明了本文算法的有效性。  相似文献   

16.
【目的】为提高决策树集成的泛化能力和效率,解决集成全部决策树的情况下有时并不显著提高精度、反而导致额外存储和计算开销的问题,提出一种基于粗糙集的决策树集成学习算法。【方法】该算法基于粗糙集理论,从训练的全部决策树中选择一部分进行集成。【结果】与目前流行的集成学习算法Bagging和Boosting相比,本文提出的算法有效地减小了集成规模,并获得更好的泛化能力。【结论】该算法提高了决策树集成的泛化能力和效率。  相似文献   

17.
决策树分类算法的分析和比较   总被引:2,自引:0,他引:2  
在数据挖掘中存在多种算法,决策树分类算法是应用比较多的一种。基于决策树分类算法的研究现状,对各种决策树分类算法的基本思想进行了阐述,并对不同的算法进行了分析和比较。  相似文献   

18.
为提高E-learning(数字化学习)中学生自主学习以及教师管理学习的效率,提出将决策树C4.5算法应用于数字化学习平台中的决策分析,设计了基于决策树的E-learning教学辅助系统,根据学生的在线学习行为预测其学习效果,以尽早发现问题。基于Fayyad边界点判定原理和数学的等价无穷小理论,对传统C4.5算法作出两点改进,在E-learning系统中,运用改进的算法先训练出在线学习行为与学习效果间的决策树模型,导出分类规则,而后进行学习效果预测。实验结果表明,改进后的算法具有比较高的预测准确率,能够为学习者和教学者提供决策支持。  相似文献   

19.
粗糙集在决策树生成中的应用   总被引:20,自引:0,他引:20  
决策树是归纳学习的重要形式,建造高质量的决策树的关键是选择合适的属性,本文针对ID3算法对属性间的相依性强调不够等问题,利用粗糙集理论,提出了一种新的启发式函数-分辩率构造决策树。  相似文献   

20.
AdaBoost算法是一种将多个基学习器通过合理策略结合生成强学习器的集成算法,其性能取决于基学习器的准确率和多样性。但弱学习器分类精度不高往往也导致了最终强分类器性能较差,因此进一步为了提高算法的分类精确率,本文提出一种MDTAda模型,首先利用基尼指数迭代构造一棵不完全决策树,然后在决策树的非纯伪叶结点上添加简单分类器,生成MDT(模型决策树),将MDT作为AdaBoost算法的基分类器,加权平均生成强分类器。在标准数据集上的实验表明,相比传统的AdaBoost算法,本文提出的算法拥有更好的泛化性能和更优的间隔分布,且在与AdaBoost算法达到相同精度时所需迭代次数更少。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号