首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 593 毫秒
1.
云技术、数据挖掘、互联网+等概念已经渗透到各个行业领域。高校每年招生产生的大量数据也逐渐被学校重视起来重新考量。本研究使用数据挖掘技术决策树ID3算法和其改进算法C4.5,探究这些数据运用在招生宣传决策中的可行性和有效性,并寻找录取新生的信息之间的关联规则。提出了把数据挖掘技术应用于高校招生工作和高校管理工作的新思想,并建立了高校招生的数据挖掘模型。  相似文献   

2.
介绍了决策树算法的含义和构筑方法,对基于加权平均粗糙度构造决策树算法进行改进,通过实例说明了改进算法的优势。  相似文献   

3.
改进的ID3算法在高校就业系统中的应用分析   总被引:2,自引:0,他引:2  
为有效利用高校就业管理工作中多年来积累的大量数据,通过对数据挖掘中常用的决策树ID3算法进行研究,结合就业信息的特点对ID3算法进行了改进,并对改进的ID3算法进行了分析,指出了决策属性对就业的影响。  相似文献   

4.
首先介绍了决策树算法的基本理论和建模过程及传统的决策属性的选取标准。然后介绍了传统的ID3决策树算法,并对常用决策树算法的优缺点进行了总结。以经典的决策树ID3模型为基础,对已有决策属性挑选策略进行了分析和总结,对决策属性挑选策略进行了改进,提出了基于"相关信息增益度"的决策属性挑选策略。该方法基于信息增益的计算标准,并通过引入属性间相关性关系对传统ID3算法"多值偏向性"的缺陷进行补偿。最后,将该方法应用于UCI数据中心的标准数据集合中,从分类精确度方面对改进的ID3算法和传统ID3算法进行比较和分析。通过实验分析,改进的E-ID3算法在分类精确度方面有更优秀的性能表现。  相似文献   

5.
分析经典ID3型决策树挖掘算法中存在的问题,对其熵值计算过程进行改进,构建一种改进的ID3型决策树挖掘算法.重新设计决策树构建中的熵值计算过程,以获得具有全局最优的挖掘结果,并针对UCI数据集中的6类数据集展开挖掘实验.结果表明:改进后的挖掘算法在决策树构建的简洁程度和挖掘精度上,都明显优于ID3型决策树挖掘算法.  相似文献   

6.
为解决目前常用于就业数据分析的C4.5算法、基于粗糙集等的决策树生成算法均无法很好地处理决策精度需求不同和噪声适应能力的问题,运用基于多尺度粗糙集模型的决策树算法于于高校就业数据分析,并以某高校2012年就业数据为例进行分析,同时将分析结果与C4.5算法和基于粗糙集的决策树生成算法的分析结果进行比较.结果表明:基于多尺度粗糙集模型的决策树算法生成的决策树树形结构简单、产生的规则简洁、不存在不可分的数据集、运算速度快.  相似文献   

7.
医疗数据中知识发现的研究   总被引:1,自引:0,他引:1  
介绍了ID3决策树算法建立决策树的基本原理和改进方法,利用改进的决策树算法对心脏病医疗诊断数据进行数据挖掘·采用VisualC++6 0进行编程建树,得到了一些有实际参考价值的诊断规则,获得了较高的分类准确率,证明了决策树算法在智能医疗诊断数据挖掘领域有着广泛的应用前景·  相似文献   

8.
本文使用多决策树合并方法对单一决策树算法进行改进,在DARPA提供的入侵检测数据上进行的实验结果表明使用多决策树算法能明显提高检测率并降低误检率。  相似文献   

9.
ID3算法是决策树分类方法的核心算法,文章论述了ID3算法的基本思想和实现方法,并对ID3算法的性能进行分析,发现该算法存在不足之处.针对ID3算法倾向于多属性值的缺点,引入了权值对算法进行改进,并通过试验对改进前后的算法进行比较,结果表明改进后的算法是有效的.  相似文献   

10.
李晋  顾宏斌  潘湑 《科技信息》2010,(28):270-271
决策树学习策略广泛应用于模式识别和机器学习等领域,用来解决与分类相关的问题。决策树剪枝的作用是简化决策树,提高决策树的泛化能力,避免对训练集的过适应,是决策树学习中的重要研究内容。本文详细介绍了数据挖掘算法中的C4.5算法的基本思想,并且对REP剪枝技术进行分析,以此对C4.5算法进行剪枝。实验表明改进的C4.5算法与原C4.5算法相比能很好地处理训练集的非平衡性,并降低决策树的规模,效率得到提高。  相似文献   

11.
针对传统C4.5决策树分类算法需要进行多次扫描,导致运行效率低的缺陷,提出一种新的改进C4.5决策树分类算法.通过优化信息增益推导算法中相关的对数运算,以减少决策树分类算法的运行时间;将传统算法中连续属性的简单分裂属性改进为最优划分点分裂处理,以提高算法效率.实验结果表明,改进的C4.5决策树分类算法相比传统的C4.5决策树分类算法极大提高了执行效率,减小了需求空间.  相似文献   

12.
以往的数据挖掘技术的应用大多是在金融领域,而在其他领域里面应用不是很多,如在高校招生中的应用更是如此。在数据挖掘中,决策树提供了一种展示类似在什么条件下会得到什么值这类规则的方法,是用二叉树形图来表示处理逻辑的一种技术。特别适合于判断因素比较少、逻辑组合关系不复杂的情况。它可以直观、清晰地表达加工的逻辑要求,满足用户需求,为管理决策者提供相应的决策支持。以某高校招生数据作为基础信息为依据,对高校招生中生源地与报到情况等进行CART(Classification and Regression Tree)分析,将对决策树分析的应用做进一步的阐述。  相似文献   

13.
蔡贺  张睿 《甘肃科技》2011,(14):31-33,8
从分析ID3决策树算法及解析入手,引入属性样本结构相似度概念,构建了样本结构相似度模型,并以该模型和属性的信息增益共同作为决策树内部结点的选择标准。改进SS_ID3决策树算法,着眼于决策树非叶结点的选择标准的优化,继承了原始ID3决策树算法的优点,并在多值偏向性的修正、决策树的大小控制及分类预测性能等方面取得了积极的改进。  相似文献   

14.
随着高等学校的招生规模扩大,大学生就业难度不断加大,就业形势严峻.从学生的实际就业信息出发,结合贝叶斯模型,提出一种改进的决策树C4.5算法,对学生就业相关的数据进行挖掘,为就业指导提供决策依据,促进大学生就业.  相似文献   

15.
金伟健 《科技资讯》2009,(14):239-239
分析了应用决策树算法对CRM系统中客户进行分类的一般过程,对分类的过程中的几个方面进行了优化,给出了一个改进了的基于决策树分类算法的客户分类模型。  相似文献   

16.
刘春梅  孙改平 《科技信息》2010,(26):102-104
决策树算法是数据挖掘中重要的分类算法,而ID3算法在决策树算法中最为著名。本文首先阐述了数据挖掘中决策树的基本思想。然后针对ID3算法运算复杂的缺点和倾向于取值较多的属性的缺点,对ID3算法予以改进,提出了ID3简化算法和ID3简化算法的二叉树存储算法;并通过实验对改进前后的算法进行了比较,实验表明改进后的算法是有效的。  相似文献   

17.
ID3算法是决策树归纳分类算法的一种.通过对ID3算法的计算复杂度分析,提出了利用统计理论知识和条件概率的思想来改进算法,并把该算法应用于建立学生专升本考试成绩分析决策树中.  相似文献   

18.
风力发电机叶片开裂直接影响风力发电机运行,采用梯度提升决策树算法与基于lightGBM框架改进的梯度提升决策树算法对风力发电机叶片开裂进行预测。对比分析了预测准确度与可行性。基于lightGBM改进的梯度提升决策树算法分析的风力发电机运行数据得出的预测结果优于梯度提升决策树算法,且对于风力发电机叶片开裂预测准确度较高,并具有实用价值。同时该算法能够大幅降低样本中的无效数据,减少计算量。其独立特征合并能够使得划分点特征数量降低,提高风力发电机叶片开裂预测的准确性。最后,风力发电机叶片开裂预测实验结果表明,基于lightGBM改进的梯度提升决策树算法取得了更好的预测结果,计算量更小且能够准确预测风力发电机叶片开裂故障。  相似文献   

19.
决策树算法是数据挖掘中非常活跃的研究领域.通过对数据挖掘中决策树的基本思想进行阐述,讨论了决策树经典算法(ID3算法)的计算复杂度问题,并针对这一问题提出了利用统计理论知识和条件概率的思想来改进构造决策树的算法.实验表明,这种构造决策树算法的计算复杂度明显优于传统的算法,其效率也有很大的提高.  相似文献   

20.
决策树是一种类似于流程图的属性结构。决策树算法主要用于分类和预测,是以样本为基础的归纳学习方法。决策树技术中的算法有很多,常用的是Quinlan于1979年提出的ID3算法。ID3算法相对于其它数据挖掘分类技术中的算法而言,有着自己的优势,但在实际应用中也有一些不足,需要进行改进。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号