共查询到16条相似文献,搜索用时 109 毫秒
1.
分析经典ID3型决策树挖掘算法中存在的问题,对其熵值计算过程进行改进,构建一种改进的ID3型决策树挖掘算法.重新设计决策树构建中的熵值计算过程,以获得具有全局最优的挖掘结果,并针对UCI数据集中的6类数据集展开挖掘实验.结果表明:改进后的挖掘算法在决策树构建的简洁程度和挖掘精度上,都明显优于ID3型决策树挖掘算法. 相似文献
2.
以ID3算法为基础,提出了改进决策树ID3算法的一种新方法,而该方法建立的决策树与ID3建立的决策树在结点属性选择上具有一致性,因而建立的决策树是相同的,但效率是高的. 相似文献
3.
ID3算法的改进和简化 总被引:2,自引:0,他引:2
朱颢东 《上海交通大学学报》2010,44(7):883-0886
针对ID3算法倾向于选择取值较多的属性的缺点,引进属性重要性来改进ID3算法,并根据改进的ID3算法中信息增益的计算特点,利用凸函数的性质来简化该算法.实验表明,优化的ID3算法与原ID3算法相比,在构造决策树时具有较高的准确率和更快的计算速度,并且构造的决策树还具有较少的平均叶子数. 相似文献
4.
增量决策树算法及复杂度分析 总被引:5,自引:1,他引:5
介绍了增量决策树算法的基本原理,并从实例费用和信息熵费用两个角度出发,对增量决策树算法的复杂度进行分析.通过实例说明,增量决策树算法能够构造出与ID3算法形态基本相同的决策树. 相似文献
5.
黄文 《达县师范高等专科学校学报》2007,17(5):16-18
决策树各类算法,各有特点,其中J.R.Quinlan提出的ID3算法最具代表性,在国际上的影响也最大,C4.5算法就是在ID3算法基础上进行改进得到的.通过对两种算法详细描述,阐明了决策树算法步骤及其主要思想. 相似文献
6.
决策树抵抗噪声的能力是启发式算法设计中的关键因素.对ID3和DoI 2种启发式算法在抵抗噪声的能力上做了对比研究.通过实验比较得出由DoI算法构建出的决策树在抵抗噪声的干扰方面与根据ID3算法构建出的决策树相比具有一定优势. 相似文献
7.
ID3算法是决策树分类方法的核心算法,文章论述了ID3算法的基本思想和实现方法,并对ID3算法的性能进行分析,发现该算法存在不足之处.针对ID3算法倾向于多属性值的缺点,引入了权值对算法进行改进,并通过试验对改进前后的算法进行比较,结果表明改进后的算法是有效的. 相似文献
8.
决策树算法是数据挖掘中重要的分类算法,而ID3算法在决策树算法中最为著名。本文首先阐述了数据挖掘中决策树的基本思想。然后针对ID3算法运算复杂的缺点和倾向于取值较多的属性的缺点,对ID3算法予以改进,提出了ID3简化算法和ID3简化算法的二叉树存储算法;并通过实验对改进前后的算法进行了比较,实验表明改进后的算法是有效的。 相似文献
9.
《华中科技大学学报(自然科学版)》2010,(5)
针对ID3算法倾向于选择取值较多的属性的缺点,首先引入属性重要性进行改进,然后根据ID3算法中信息增益的计算特点,利用凸函数的性质进行简化,减少了信息增益的计算量,提高ID3算法中信息增益的计算效率.实验证明,优化ID3算法与传统ID3算法相比,在构造决策树时具有较高的准确率和更快的计算速度,并且构造的决策树还具有较少的平均叶子数. 相似文献
10.
基于决策树方法的银行客户信用评估 总被引:1,自引:0,他引:1
分析了传统银行客户信用评估方法存在的问题,针对ID3算法存在的不足,提出了一种改进的ID3算法.实验结果表明,改进后的ID3算法分类正确率有所提高,所生成的决策树较为健壮、简洁,可以减少计算代价,提高计算效率. 相似文献
11.
ID3分类算法无法处理连续性数据并且在选择分裂属性时明显倾向于取值多的属性,无法产生准确的规则。基于信息熵的连续数据离散化预处理技术有效地拓展了ID3算法的应用领域,并提出了基于信息增益率的分裂属性选择方法,样例数据测试结果分析表明:该分类算法改正了在选择分裂属性时明显倾向于取值多的属性的缺陷,提高了分类的精度。 相似文献
12.
基于粗集论中属性依赖度的ID3改进算法 总被引:3,自引:0,他引:3
决策树算法是一种重要的数据挖掘方法,ID3算法是最具影响的一种决策树生成算法。介绍了粗集理论的相关概念和传统的ID3算法基本原理,提出了一种以粗集论中的属性依赖度为基础的ID3改进算法,克服了传统ID3算法对取值较多属性的依赖,并通过实例验证该算法的高效性和精确性。改进算法对不同领域中分类预测方向上的数据挖掘均具有一定的参考价值。 相似文献
13.
吴碧霞 《成都大学学报(自然科学版)》2011,30(4):335-338
传统的ID3决策树算法存在诸多不足,如计算效率低、多值偏向等,对此,提出了属性值空缺、多值属性的选择以及属性选择标准方面的改进方案,并将加权熵和简化熵引入决策树算法以改进传统ID3算法.实验结果表明,改进后的算法在整体性能方面较目前广泛应用的ID3算法有更优秀的性能表现. 相似文献
14.
改进的ID3算法在高校就业系统中的应用分析 总被引:2,自引:0,他引:2
为有效利用高校就业管理工作中多年来积累的大量数据,通过对数据挖掘中常用的决策树ID3算法进行研究,结合就业信息的特点对ID3算法进行了改进,并对改进的ID3算法进行了分析,指出了决策属性对就业的影响。 相似文献
15.
周凌云 《中南民族大学学报(自然科学版)》2012,(3):97-100
阐述了ID3决策树算法原理,分析了汽车评测数据,提出了应用决策树来处理汽车评测问题的方法,该方法利用训练数据的信息增益来构建评测模型,并通过对评测模型的查找来完成其它数据的分类预测.实验结果表明:利用决策树来处理汽车评测问题具有良好的预测准确率. 相似文献
16.
周桂如 《南京工程学院学报(自然科学版)》2013,(3):58-61
分类与预测是数据挖掘技术中的一个重要研究领域.而决策树算法又是分类与预测的核心技术算法之一.描述ID3的主要算法,介绍信息增益、系统总熵和信息熵的概念及其计算公式;然后对ID3算法进行了深入地研究与分析;最后把决策树中的ID3算法运用在学生综合测评中.ID3算法最大的缺点是运算复杂,而且要花费较多的时间. 相似文献