首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
分类与预测是数据挖掘技术中的一个重要研究领域.而决策树算法又是分类与预测的核心技术算法之一.描述ID3的主要算法,介绍信息增益、系统总熵和信息熵的概念及其计算公式;然后对ID3算法进行了深入地研究与分析;最后把决策树中的ID3算法运用在学生综合测评中.ID3算法最大的缺点是运算复杂,而且要花费较多的时间.  相似文献   

2.
决策树各类算法,各有特点,其中J.R.Quinlan提出的ID3算法最具代表性,在国际上的影响也最大,C4.5算法就是在ID3算法基础上进行改进得到的.通过对两种算法详细描述,阐明了决策树算法步骤及其主要思想.  相似文献   

3.
刘春梅  孙改平 《科技信息》2010,(26):102-104
决策树算法是数据挖掘中重要的分类算法,而ID3算法在决策树算法中最为著名。本文首先阐述了数据挖掘中决策树的基本思想。然后针对ID3算法运算复杂的缺点和倾向于取值较多的属性的缺点,对ID3算法予以改进,提出了ID3简化算法和ID3简化算法的二叉树存储算法;并通过实验对改进前后的算法进行了比较,实验表明改进后的算法是有效的。  相似文献   

4.
ID3算法是决策树分类方法的核心算法,文章论述了ID3算法的基本思想和实现方法,并对ID3算法的性能进行分析,发现该算法存在不足之处.针对ID3算法倾向于多属性值的缺点,引入了权值对算法进行改进,并通过试验对改进前后的算法进行比较,结果表明改进后的算法是有效的.  相似文献   

5.
针对ID3算法偏向于选择取值较多的属性作为测试属性的缺点,引入OneR算法选择属性的相关子集进行分类,降低无关属性和重复属性对分类的影响。实验结果表明,与ID3算法相比优化后的方案提高了ID3算法的分类准确率,降低了分类时间,同时克服了ID3算法的取值偏置问题,优化了分类结果。  相似文献   

6.
ID3算法的改进和简化   总被引:2,自引:0,他引:2  
针对ID3算法倾向于选择取值较多的属性的缺点,引进属性重要性来改进ID3算法,并根据改进的ID3算法中信息增益的计算特点,利用凸函数的性质来简化该算法.实验表明,优化的ID3算法与原ID3算法相比,在构造决策树时具有较高的准确率和更快的计算速度,并且构造的决策树还具有较少的平均叶子数.  相似文献   

7.
基于粗集论中属性依赖度的ID3改进算法   总被引:3,自引:0,他引:3  
决策树算法是一种重要的数据挖掘方法,ID3算法是最具影响的一种决策树生成算法。介绍了粗集理论的相关概念和传统的ID3算法基本原理,提出了一种以粗集论中的属性依赖度为基础的ID3改进算法,克服了传统ID3算法对取值较多属性的依赖,并通过实例验证该算法的高效性和精确性。改进算法对不同领域中分类预测方向上的数据挖掘均具有一定的参考价值。  相似文献   

8.
改进的ID3算法在高校就业系统中的应用分析   总被引:2,自引:0,他引:2  
为有效利用高校就业管理工作中多年来积累的大量数据,通过对数据挖掘中常用的决策树ID3算法进行研究,结合就业信息的特点对ID3算法进行了改进,并对改进的ID3算法进行了分析,指出了决策属性对就业的影响。  相似文献   

9.
本文在ID3算法的基础上引入属性重要度因子和均衡化函数,对ID3算法进行优化,改进了经典ID3算法要求每个属性对类别属性的贡献一样的缺点,可以适用于不同属性对类别属性的贡献不同的情况,同时也弥补ID3算法偏向多值属性的不足。最后给出具体一个实例说明其构造决策树的过程,并将优化算法与经典ID3算法构造的决策树进行了比较,从而得出优化后的算法具有更大的适应范围,且更符合用户实际情况的需要。  相似文献   

10.
针对ID3算法倾向于选择取值较多的属性的缺点,首先引入属性重要性进行改进,然后根据ID3算法中信息增益的计算特点,利用凸函数的性质进行简化,减少了信息增益的计算量,提高ID3算法中信息增益的计算效率.实验证明,优化ID3算法与传统ID3算法相比,在构造决策树时具有较高的准确率和更快的计算速度,并且构造的决策树还具有较少的平均叶子数.  相似文献   

11.
基于决策树方法的银行客户信用评估   总被引:1,自引:0,他引:1  
分析了传统银行客户信用评估方法存在的问题,针对ID3算法存在的不足,提出了一种改进的ID3算法.实验结果表明,改进后的ID3算法分类正确率有所提高,所生成的决策树较为健壮、简洁,可以减少计算代价,提高计算效率.  相似文献   

12.
引入ID3算法的大学生体育训练决策支持系统可以根据学生的特征对其分类。而传统的决策树ID3算法存在多值倾向的问题,选择分裂属性不符合客观事实。本文运用了一种基于灰色关联度的修正因子属性选择方法予以改进,克服了传统ID3算法的不足,改进的ID3算法可使分类更加精确,更好的为大学生体育训练提供决策支持。  相似文献   

13.
为了解决ID3算法运算复杂及效率低的问题,引入高等数学中的泰勒公式,在ID3算法的基础上提出了ID3简化算法,使运算变得简洁,提高算法生成的效率.最后通过使用同一训练集的实例进行具体计算,分别得到其对应的决策树,并运用在学生综合测评中.  相似文献   

14.
以ID3算法为基础,提出了改进决策树ID3算法的一种新方法,而该方法建立的决策树与ID3建立的决策树在结点属性选择上具有一致性,因而建立的决策树是相同的,但效率是高的.  相似文献   

15.
ID3算法沿用的是机器学习算法,与数据库集成性差。提出一种基于SQL语句的ID3改进算法。通过SQL语句直接对保存在数据库中的数据表进行分组查询,计算测试属性的条件熵,并给出深度优先和广度优先生成子树的递归算法。实验证明,改进的ID3算法充分利用了SQL的高效性和C++语言的灵活性,降低了算法实现难度,高效实现大量数据的分类。  相似文献   

16.
ID3算法是决策树归纳分类算法的一种.通过对ID3算法的计算复杂度分析,提出了利用统计理论知识和条件概率的思想来改进算法,并把该算法应用于建立学生专升本考试成绩分析决策树中.  相似文献   

17.
传统的ID3决策树算法存在诸多不足,如计算效率低、多值偏向等,对此,提出了属性值空缺、多值属性的选择以及属性选择标准方面的改进方案,并将加权熵和简化熵引入决策树算法以改进传统ID3算法.实验结果表明,改进后的算法在整体性能方面较目前广泛应用的ID3算法有更优秀的性能表现.  相似文献   

18.
首先介绍了决策树算法的基本理论和建模过程及传统的决策属性的选取标准。然后介绍了传统的ID3决策树算法,并对常用决策树算法的优缺点进行了总结。以经典的决策树ID3模型为基础,对已有决策属性挑选策略进行了分析和总结,对决策属性挑选策略进行了改进,提出了基于"相关信息增益度"的决策属性挑选策略。该方法基于信息增益的计算标准,并通过引入属性间相关性关系对传统ID3算法"多值偏向性"的缺陷进行补偿。最后,将该方法应用于UCI数据中心的标准数据集合中,从分类精确度方面对改进的ID3算法和传统ID3算法进行比较和分析。通过实验分析,改进的E-ID3算法在分类精确度方面有更优秀的性能表现。  相似文献   

19.
基于属性间交互信息的模糊ID3算法的扩展   总被引:4,自引:0,他引:4  
模糊ID3算法是模糊决策树归纳中比较普遍和有效的启发式算法.以模糊ID3算法为例,分析了属性之间的冗余信息对构建模糊决策树的影响,并提出一个扩展算法,要求所选择的测试属性不仅和类的交互信息较大,而且和祖先节点上用过的属性之间的交互信息较小.实验结果表明:扩展算法优于模糊ID3算法  相似文献   

20.
分析了传统银行客户信用评估方法存在的问题,针对ID3算法存在的不足,提出了一种改进的ID3算法.实验结果表明,改进后的ID3算法分类正确率有所提高,所生成的决策树较为健壮、简洁,可以减少计算代价,提高计算效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号