首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
针对ID3算法构造的决策树结构复杂、对噪声数据比较敏感等局限性,提出一种新的面向噪声数据的决策树构造算法。算法借鉴变精度粗糙集和尺度函数概念,采用不同尺度下近似分类精度选择测试属性构造决策树,在算法形成过程中利用决策规则的可信度对决策树进行修剪,避免了生成的决策树过于庞大。结果表明,该方法是有效的,能够克服部分噪声数据对决策树的影响,且能满足不同用户对决策精度的要求。  相似文献   

2.
提出一种基于粗糙集理论的决策树分类算法.首先,将核属性集中的核属性进行合取后加入析取变换,实现属性约简;其次,在决策树构造阶段,对各条件属性分别求其上下近似集,进而得到各属性的近似精度.选择近似精度最大的属性作为决策树的根结点,以此方法递归应用到各子树上来选择决策树的结点并实现决策树的剪枝.实例分析表明,改进的算法提高了决策树方法的效率.  相似文献   

3.
现有基于变精度粗糙集模型的决策树生成算法具有如下不足:有些叶子结点上覆盖的实例数太少,导致这些叶子结点的泛化能力太小而没有意义;不能很好地处理不一致的实例集.为解决上述问题,引入属性是否具有决策类这一概念,较好地避免了决策树的过剩生长,使得生成的决策树有较好的泛化能力.给出新的终止条件,即时地终止不一致实例集的生长.在此基础上,给出新的终止条,提出了一种新的基于变精度粗糙集的决策树生成算法.用一实例说明了新算法的效率得到提高.  相似文献   

4.
在变精度粗糙集模型的基础上,通过定义近似分类质量来对条件属性进行选择,在ID3算法的基础上生成决策树,实现了对ID3算法的改进,使分类速度加快,并且有效地解决了含噪数据的分类问题。  相似文献   

5.
基于决策树的神经网络规则抽取方法   总被引:2,自引:0,他引:2  
将从神经网络中抽取一个可理解的模型视为一个归纳学习任务 ,其中 ,目标概念就是神经网络表达的功能 ,所生成的可理解模型是一个能很好近似神经网络的决策树 .在这个过程中 ,应用了决策树归纳学习的优化原则 ,使得生成的决策树能最简洁、准确地描述神经网络学到的知识 .实验证明 ,生成的决策树可以很好地近似神经网络 ,且比用传统方法生成的决策树具有更好的分类精度 ,同时NNtoDT算法也保持了具有较好的通用性和可扩充性的特性 .  相似文献   

6.
为了构建程度近似算子与变精度近似算子的新运算,探讨其计算算法,提出了程度上近似算子与变精度下近似算子的差运算,提出了宏观算法和微观算法,进行了算法分析与比较,得到了微观算法具有算法空间优势的结论。最后用医疗实例对宏观算法和微观算法进行了分析与说明。该研究对程度粗糙集模型与变精度粗糙集模型的结合与应用具有意义。  相似文献   

7.
传统的决策树方法在实际应用中存在很多不足,如生成树规模过大,抗噪性较差等,因此,提出了将变精度粗糙集和混合变量集算法应用于决策树分类中,通过变精度和混合属性集分类减小树的规模和过度拟合问题,降低了噪声数据对属性选择的影响,并通过实验证明该算法与传统的算法相比具有较大的优越性。  相似文献   

8.
一种基于粗糙集的决策树构造方法   总被引:2,自引:1,他引:2  
决策树是一种有效的数据分类方法。传统的决策树方法是通过信息熵的计算去生成决策树的节点,计算量大。基于粗糙集理论,利用近似精度的概念来进行属性选择,构造决策树,有效地提高了效率并降低了决策树的复杂度。  相似文献   

9.
改进的决策树生成算法及条件决策表的创建   总被引:2,自引:0,他引:2  
针对传统的决策树生成算法的不足,提出了两种改进算法.实例说明,改进算法具有更好的优化效果,且证明了传统算法是改进算法2 的特例.把不确定信息以条件概率的形式引入决策表,提出了条件决策表的概念及条件决策树的构造算法,拓宽了决策表的应用范围,使用决策表作知识库、决策树生成算法作推理机,可构造测试诊断专家系统  相似文献   

10.
AdaBoost算法是一种将多个基学习器通过合理策略结合生成强学习器的集成算法,其性能取决于基学习器的准确率和多样性。但弱学习器分类精度不高往往也导致了最终强分类器性能较差,因此进一步为了提高算法的分类精确率,本文提出一种MDTAda模型,首先利用基尼指数迭代构造一棵不完全决策树,然后在决策树的非纯伪叶结点上添加简单分类器,生成MDT(模型决策树),将MDT作为AdaBoost算法的基分类器,加权平均生成强分类器。在标准数据集上的实验表明,相比传统的AdaBoost算法,本文提出的算法拥有更好的泛化性能和更优的间隔分布,且在与AdaBoost算法达到相同精度时所需迭代次数更少。  相似文献   

11.
决策树简化是决策树学习算法中的一个重要分支。文章以 ID3算法构造的决策树为基础 ,提出了一种高效的简化决策树的算法。算法先序遍历由 ID3构造出来的决策树的各个节点并对其子树进行比较 ,如果各子树的属性都相同而且存在某些相应的分支对于各子树完全相同 ,则改变决策树中相应属性的层次关系并把相同的分支分别合并起来。算法减少了决策树的深度、宽度与叶子数目 ,降低了决策树的规模。尤其对于逻辑表达式的归纳学习 ,简化之后的决策树要明显优于原决策树。  相似文献   

12.
一种新的模糊决策树模型及其应用   总被引:1,自引:0,他引:1  
模糊决策树是决策树在模糊环境下的一种推广,虽然其表示形式更符合人类的思维,但在构造时会增加预处理的工作量和创建树时的开销。基于这种情况,提出了一种混合算法,算法保留了较少属性值的Shannon熵,计算多属性和连续属性值模糊化后的模糊熵。将该算法应用于滑坡数据的挖掘中,得到了更易于理解的决策树和有效的规则,与传统算法的性能比较也证明了该算法的有效性。  相似文献   

13.
针对传统C4.5决策树分类算法需要进行多次扫描,导致运行效率低的缺陷,提出一种新的改进C4.5决策树分类算法.通过优化信息增益推导算法中相关的对数运算,以减少决策树分类算法的运行时间;将传统算法中连续属性的简单分裂属性改进为最优划分点分裂处理,以提高算法效率.实验结果表明,改进的C4.5决策树分类算法相比传统的C4.5决策树分类算法极大提高了执行效率,减小了需求空间.  相似文献   

14.
一种改进的决策树算法   总被引:1,自引:0,他引:1  
为解决决策树算法ID3的多值偏向的缺点,利用属性相似度偏向少值属性的特点,提出一种将属性相似度作为信息熵的系数的属性选择标准,从而提出相应的决策树生成算法.实验结果表明,新算法既避免了以信息熵作为属性选择标准的决策树算法的多值偏向,也避免了以属性相似度作为属性选择标准的决策树算法的少值偏向.  相似文献   

15.
陈燕  张振中 《科技信息》2007,(10):20-21
本文介绍了数据挖掘决策树算法的基本原理。并将决策树技术应用于肝癌病人预后的影响中。提出了一种预后影响的预测方法。通过20个样本数据,详细的介绍了建立决策树的步骤和方法。  相似文献   

16.
自动生成决策树的通用算法模板   总被引:4,自引:0,他引:4  
目的 提供自动生成决策树的通用算法模板,从而使算法的设计能够快速验证为解决特定决策问题而设计的新算法。方法 提供智能编辑器供算法设计定义自己的公式,并利用该公式或内置算示来初始化通用算法模板,从而实现连续属性的离散化、采用基于概率分布的方法处理未知属性和噪声数据,利用预剪枝和后剪枝算法进行剪枝。结果与结论 用户能够利用该模板,在系统提供的交互式图形环境中,针对不同的决策问题测试决策树生成算法。  相似文献   

17.
文章提出了一种新的决策树构建算法,算法选择使生成的规则满足给定可信度阀值且支持度最大的属性作为结点,不仅简化了生成的决策树;且可以根据用户输入的可信度,得到相应的决策规则集,提高了决策树的泛化能力,有效地去除了噪音规则。应用实例分析,结果表明算法提取的决策规则简洁有效。  相似文献   

18.
改进决策树算法在企业资源计划系统中的应用   总被引:2,自引:0,他引:2  
为改进企业资源计划(ERP)的数据挖掘技术和提高利用效率,改善ERP系统的预测功能和决策支持,通过运用改进的混合决策树算法ID3,对企业ERP系统中某些决策判定的依据进行学习,根据学习结果对ERP系统中的新问题进行预测. 给出了相关的算法流程和实现步骤. 实验结果验证了改进决策树算法在决策预测支持中的有效性和可行性.  相似文献   

19.
决策树归纳法ID3是人工智能机器学习中发展较快的一种归纳学习算法,而目前的ID3及其改进算法亦因各种问题限制了其在工程中的应用。基于决策树归纳学习算法示例学习最优化的理论,用在多概念学习条件下对多特征属性值进行分组聚类实现优化的方法,导出了定义在多概念窨上的决策树归纳学习算法NMID。这种新算法对工程技术领域普遍存在的多概念学习问题,有较好的应用价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号