首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 187 毫秒
1.
粗糙集在决策树生成中的应用   总被引:20,自引:0,他引:20  
决策树是归纳学习的重要形式,建造高质量的决策树的关键是选择合适的属性,本文针对ID3算法对属性间的相依性强调不够等问题,利用粗糙集理论,提出了一种新的启发式函数-分辩率构造决策树。  相似文献   

2.
决策树学习是机器学习中应用最广的归纳推理算法之一,是一种逼近离散值函数的方法,且与一般的概念学习算法相比,能够学习析取表达式。在各种决策树学习算法当中,最有影响力的是Quinlan于1979年在Hunt的概念学习系统CLS(Concept Learning System)的基础上发展提出来的以信息增益的下降速度作为选择测试属性的标准的ID3算法。本文对决策树创建的两个步骤进行了探究,并给出对该算法的综合性评价。  相似文献   

3.
决策树是一种类似于流程图的属性结构。决策树算法主要用于分类和预测,是以样本为基础的归纳学习方法。决策树技术中的算法有很多,常用的是Quinlan于1979年提出的ID3算法。ID3算法相对于其它数据挖掘分类技术中的算法而言,有着自己的优势,但在实际应用中也有一些不足,需要进行改进。  相似文献   

4.
通过对决策树算法的研究,特别是分析了ID3的基本算法过程,指出其应用中的多种缺陷,提出了用模糊概念来解决传统决策树中过分匹配,从而提高决策树用于知识获取性能的思想.结合树的深度优先算法、模糊包含度函数和模糊不确定函数,提出了具体实现模糊决策树(FDT)算法,并在注塑模浇口设计中加以应用.该算法具有如下优点:在相同精度条件下,大量压缩知识,在将来知识推理中极大地避免了组合爆炸的可能性;随着应用的不断深入,FDT获取的知识会逐渐集中在领域中常用的和重要的知识上.  相似文献   

5.
决策树分类算法的分析和比较   总被引:2,自引:0,他引:2  
在数据挖掘中存在多种算法,决策树分类算法是应用比较多的一种。基于决策树分类算法的研究现状,对各种决策树分类算法的基本思想进行了阐述,并对不同的算法进行了分析和比较。  相似文献   

6.
ID3算法是决策树学习归纳和数据挖掘中的核心方法。针对ID3算法存在的多值偏向问题,该文提出了一种新的方法对ID3算法加以改进。首先建立属性的关联矩阵,然后通过计算属性的类方差选择分裂属性,结合实例说明了改进算法的基本思想。实验结果表明,改进后的算法能够构造更合理的决策树并能在一定程度上克服多值偏向。  相似文献   

7.
决策树学习是以实例为基础的归纳学习[1].该类方法从一类无序,无规则的事物(概念)中推理出决策树表示的分类规则.该方法的起源最早来源于Hunt,Marin和Stone于1966年研制的CLS(ConceptLearning System概念学习系统).1979年,J.R.Quin-lan给出了ID3(Interative D icrem iser Versi  相似文献   

8.
ID3算法是决策树归纳分类算法的一种.通过对ID3算法的计算复杂度分析,提出了利用统计理论知识和条件概率的思想来改进算法,并把该算法应用于建立学生专升本考试成绩分析决策树中.  相似文献   

9.
决策树分类学习算法是使用广泛、实用性很强的归纳推理方法之一,在机器学习、数据挖掘等人工智能领域有相当重要的理论意义与实用价值。在详细阐述决策树技术的几种典型算法以及它的一些常见问题后,介绍了它在工程上的实际应用,最后提出了它的研究方向以及它所面临的问题和挑战。  相似文献   

10.
改进决策树方法及其用于故障诊断知识获取   总被引:2,自引:0,他引:2  
对大型旋转机械设备的故障诊断知识获取问题进行了研究,分析了ID3决策树方法及其存在的问题。提出了能够适应于连续型属性的知识获取方法,在产生决策树的过程中,提出了一些控制策略,对产生的决策树和决策规则提出了评价准则,并用实例进行了故障诊断知识获取的说明。  相似文献   

11.
决策树简化是决策树学习算法中的一个重要分支。文章以 ID3算法构造的决策树为基础 ,提出了一种高效的简化决策树的算法。算法先序遍历由 ID3构造出来的决策树的各个节点并对其子树进行比较 ,如果各子树的属性都相同而且存在某些相应的分支对于各子树完全相同 ,则改变决策树中相应属性的层次关系并把相同的分支分别合并起来。算法减少了决策树的深度、宽度与叶子数目 ,降低了决策树的规模。尤其对于逻辑表达式的归纳学习 ,简化之后的决策树要明显优于原决策树。  相似文献   

12.
基于粗集论中属性依赖度的ID3改进算法   总被引:3,自引:0,他引:3  
决策树算法是一种重要的数据挖掘方法,ID3算法是最具影响的一种决策树生成算法。介绍了粗集理论的相关概念和传统的ID3算法基本原理,提出了一种以粗集论中的属性依赖度为基础的ID3改进算法,克服了传统ID3算法对取值较多属性的依赖,并通过实例验证该算法的高效性和精确性。改进算法对不同领域中分类预测方向上的数据挖掘均具有一定的参考价值。  相似文献   

13.
特征选择方法中的信号分析方法研究   总被引:4,自引:1,他引:3  
特征选择是模式识别领域中最重要的环节,也是最根本的论题。论文从随机信号的傅立叶分析中自相关函数与谱密度函数之间的对应关系出发,提出了一种基于自相关函数的特征选择方法,并以实验方式进行了有效性验证。其研究意义还在于将这一特征选择方法与人工智能中的归纳学习方法相结合,其归纳性能比传统的熵最小化准则更为优越。  相似文献   

14.
模糊决策树推理是机器学习领域中的一种解决分类问题的有效算法,模糊推理方法的选择在很大程度上影响推理的性能和效果.对Min-Ambiguity,Fuzzy ID3和加权模糊决策树3种推理机制进行了对比研究,选择了推理过程中4种常用的算子(∨,∧)、(∨,×)、(+,∧)和(+,×)进行了对比分析,并在理论分析和实验验证的基础上提出了优先选择乘法算子(+,×)和(∨,×)的建议.  相似文献   

15.
基于决策树的神经网络规则抽取方法   总被引:2,自引:0,他引:2  
将从神经网络中抽取一个可理解的模型视为一个归纳学习任务 ,其中 ,目标概念就是神经网络表达的功能 ,所生成的可理解模型是一个能很好近似神经网络的决策树 .在这个过程中 ,应用了决策树归纳学习的优化原则 ,使得生成的决策树能最简洁、准确地描述神经网络学到的知识 .实验证明 ,生成的决策树可以很好地近似神经网络 ,且比用传统方法生成的决策树具有更好的分类精度 ,同时NNtoDT算法也保持了具有较好的通用性和可扩充性的特性 .  相似文献   

16.
分类与预测是数据挖掘技术中的一个重要研究领域.而决策树算法又是分类与预测的核心技术算法之一.描述ID3的主要算法,介绍信息增益、系统总熵和信息熵的概念及其计算公式;然后对ID3算法进行了深入地研究与分析;最后把决策树中的ID3算法运用在学生综合测评中.ID3算法最大的缺点是运算复杂,而且要花费较多的时间.  相似文献   

17.
分析经典ID3型决策树挖掘算法中存在的问题,对其熵值计算过程进行改进,构建一种改进的ID3型决策树挖掘算法.重新设计决策树构建中的熵值计算过程,以获得具有全局最优的挖掘结果,并针对UCI数据集中的6类数据集展开挖掘实验.结果表明:改进后的挖掘算法在决策树构建的简洁程度和挖掘精度上,都明显优于ID3型决策树挖掘算法.  相似文献   

18.
基于粗集的混合变量决策树构造算法研究   总被引:2,自引:1,他引:1  
文章提出混合变量决策树结构,并在此基础上提出基于粗集理论的混合变量决策树构造算法RSH2,算法在每个结点选择尽可能少的属性明确划分尽可能多的实例,减小了决策树规模,且易于理解。将RSH2算法与ID3算法及基于粗集的单变量决策树算法HACRs进行实验比较,结果表明该算法有良好性能。  相似文献   

19.
ID3算法的改进和简化   总被引:2,自引:0,他引:2  
针对ID3算法倾向于选择取值较多的属性的缺点,引进属性重要性来改进ID3算法,并根据改进的ID3算法中信息增益的计算特点,利用凸函数的性质来简化该算法.实验表明,优化的ID3算法与原ID3算法相比,在构造决策树时具有较高的准确率和更快的计算速度,并且构造的决策树还具有较少的平均叶子数.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号