首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 93 毫秒
1.
刘春梅  孙改平 《科技信息》2010,(26):102-104
决策树算法是数据挖掘中重要的分类算法,而ID3算法在决策树算法中最为著名。本文首先阐述了数据挖掘中决策树的基本思想。然后针对ID3算法运算复杂的缺点和倾向于取值较多的属性的缺点,对ID3算法予以改进,提出了ID3简化算法和ID3简化算法的二叉树存储算法;并通过实验对改进前后的算法进行了比较,实验表明改进后的算法是有效的。  相似文献   

2.
ID3算法是决策树分类方法的核心算法,文章论述了ID3算法的基本思想和实现方法,并对ID3算法的性能进行分析,发现该算法存在不足之处.针对ID3算法倾向于多属性值的缺点,引入了权值对算法进行改进,并通过试验对改进前后的算法进行比较,结果表明改进后的算法是有效的.  相似文献   

3.
首先介绍了决策树算法的基本理论和建模过程及传统的决策属性的选取标准。然后介绍了传统的ID3决策树算法,并对常用决策树算法的优缺点进行了总结。以经典的决策树ID3模型为基础,对已有决策属性挑选策略进行了分析和总结,对决策属性挑选策略进行了改进,提出了基于"相关信息增益度"的决策属性挑选策略。该方法基于信息增益的计算标准,并通过引入属性间相关性关系对传统ID3算法"多值偏向性"的缺陷进行补偿。最后,将该方法应用于UCI数据中心的标准数据集合中,从分类精确度方面对改进的ID3算法和传统ID3算法进行比较和分析。通过实验分析,改进的E-ID3算法在分类精确度方面有更优秀的性能表现。  相似文献   

4.
基于粗集论中属性依赖度的ID3改进算法   总被引:3,自引:0,他引:3  
决策树算法是一种重要的数据挖掘方法,ID3算法是最具影响的一种决策树生成算法。介绍了粗集理论的相关概念和传统的ID3算法基本原理,提出了一种以粗集论中的属性依赖度为基础的ID3改进算法,克服了传统ID3算法对取值较多属性的依赖,并通过实例验证该算法的高效性和精确性。改进算法对不同领域中分类预测方向上的数据挖掘均具有一定的参考价值。  相似文献   

5.
介绍脱机手写体汉字识别的基本流程,以传统决策树ID3模型为基础,对决策属性挑选策略进行改进.该方法基于信息增益的计算标准,通过引入属性间相关性关系对传统ID3算法“多值偏向性”的缺陷进行补偿,提出节点协调度的预剪枝策略.从分类精确度方面对改进的ID3算法和传统D3算法进行比较和分析.将改进的ID3算法应用于手写体汉字识...  相似文献   

6.
分析经典ID3型决策树挖掘算法中存在的问题,对其熵值计算过程进行改进,构建一种改进的ID3型决策树挖掘算法.重新设计决策树构建中的熵值计算过程,以获得具有全局最优的挖掘结果,并针对UCI数据集中的6类数据集展开挖掘实验.结果表明:改进后的挖掘算法在决策树构建的简洁程度和挖掘精度上,都明显优于ID3型决策树挖掘算法.  相似文献   

7.
一种基于离散度的决策树改进算法   总被引:3,自引:0,他引:3  
在数据挖掘中,决策树方法是一个重点研究方向.很多学者从不同角度对ID3算法进行改进和优化,提高了分类的效率和速度.本文从离散度的角度,对ID3算法进行改进.实验表明,利用改进后的算法挖掘分类规则,不仅提高了分类的正确率,而且非常高效.  相似文献   

8.
针对ID3算法倾向于选择取值较多的属性的缺点,首先引入属性重要性进行改进,然后根据ID3算法中信息增益的计算特点,利用凸函数的性质进行简化,减少了信息增益的计算量,提高ID3算法中信息增益的计算效率.实验证明,优化ID3算法与传统ID3算法相比,在构造决策树时具有较高的准确率和更快的计算速度,并且构造的决策树还具有较少的平均叶子数.  相似文献   

9.
ID3算法的改进和简化   总被引:2,自引:0,他引:2  
针对ID3算法倾向于选择取值较多的属性的缺点,引进属性重要性来改进ID3算法,并根据改进的ID3算法中信息增益的计算特点,利用凸函数的性质来简化该算法.实验表明,优化的ID3算法与原ID3算法相比,在构造决策树时具有较高的准确率和更快的计算速度,并且构造的决策树还具有较少的平均叶子数.  相似文献   

10.
ID3算法沿用的是机器学习算法,与数据库集成性差。提出一种基于SQL语句的ID3改进算法。通过SQL语句直接对保存在数据库中的数据表进行分组查询,计算测试属性的条件熵,并给出深度优先和广度优先生成子树的递归算法。实验证明,改进的ID3算法充分利用了SQL的高效性和C++语言的灵活性,降低了算法实现难度,高效实现大量数据的分类。  相似文献   

11.
阐述了ID3决策树算法原理,分析了汽车评测数据,提出了应用决策树来处理汽车评测问题的方法,该方法利用训练数据的信息增益来构建评测模型,并通过对评测模型的查找来完成其它数据的分类预测.实验结果表明:利用决策树来处理汽车评测问题具有良好的预测准确率.  相似文献   

12.
医疗数据中知识发现的研究   总被引:1,自引:0,他引:1  
介绍了ID3决策树算法建立决策树的基本原理和改进方法,利用改进的决策树算法对心脏病医疗诊断数据进行数据挖掘·采用VisualC++6 0进行编程建树,得到了一些有实际参考价值的诊断规则,获得了较高的分类准确率,证明了决策树算法在智能医疗诊断数据挖掘领域有着广泛的应用前景·  相似文献   

13.
增量决策树算法及复杂度分析   总被引:5,自引:1,他引:5  
介绍了增量决策树算法的基本原理,并从实例费用和信息熵费用两个角度出发,对增量决策树算法的复杂度进行分析.通过实例说明,增量决策树算法能够构造出与ID3算法形态基本相同的决策树.  相似文献   

14.
传统的ID3决策树算法存在诸多不足,如计算效率低、多值偏向等,对此,提出了属性值空缺、多值属性的选择以及属性选择标准方面的改进方案,并将加权熵和简化熵引入决策树算法以改进传统ID3算法.实验结果表明,改进后的算法在整体性能方面较目前广泛应用的ID3算法有更优秀的性能表现.  相似文献   

15.
分类与预测是数据挖掘技术中的一个重要研究领域.而决策树算法又是分类与预测的核心技术算法之一.描述ID3的主要算法,介绍信息增益、系统总熵和信息熵的概念及其计算公式;然后对ID3算法进行了深入地研究与分析;最后把决策树中的ID3算法运用在学生综合测评中.ID3算法最大的缺点是运算复杂,而且要花费较多的时间.  相似文献   

16.
决策树算法在医学图像数据挖掘中的应用   总被引:8,自引:1,他引:8  
目的研究决策树算法在医学图像数据挖掘中的应用。方法利用决策树算法对乳腺癌图像数据进行分类,提出了一个基于决策树算法的医学图像分类器。结果实现了ID3和C4.5算法对图像数据的分类,获得了分类的实验结果。结论该模型系统达到了较高的分类准确率,证明数据挖掘在辅助医疗诊断中有着广泛的应用前景。  相似文献   

17.
以ID3算法为基础,提出了改进决策树ID3算法的一种新方法,而该方法建立的决策树与ID3建立的决策树在结点属性选择上具有一致性,因而建立的决策树是相同的,但效率是高的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号