首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 140 毫秒
1.
决策树C4.5算法在森林资源二类调查中的应用   总被引:3,自引:0,他引:3  
C4.5算法是基于信息熵理论进行数据分类分析的经典决策树数据挖掘算法.它主要包括数据预处理、决策树生成、决策树修剪、决策树规则提取等步骤.笔者将C4.5算法应用于森林资源二类调查的数据分析中,通过对调查数据挖掘分析表明,数据挖掘在森林资源调查数据分析中具有广泛的应用前景.  相似文献   

2.
针对高职院校专业对口就业率不高的典型问题,进行了毕业生跟踪回访及问卷调查,并以大学期间有无明确的职业规划、是否参加过专业兴趣小组、专注做事及自身性别作为观测点来分析其影响学生专业对口就业情况;构建高职学生对口就业因素分析数据仓库并对数据进行清洗与转换,应用决策树C4.5算法对预处理后的数据进行分析,建立高职学生专业对口就业因素分析的决策树模型,从中抽取出影响高职学生对口就业因素的潜在规则并对其做了验证分析;挖掘出的规则为加强高职学生日常行为引导、专业对口就业提供了有益参考。  相似文献   

3.
随着医疗水平的不断提高,借助机器学习方法对大量的医疗诊断数据进行分析成为近年来热点研究方向之一.在介绍C4.5决策树算法的相关理论及建树流程基础上,以竞赛项目中的乳腺癌数据集为基础,对数据集进行预处理,建立决策树分类模型,以可视化形式展示分类结果.实验结果表明,该分类模型可达到较高的准确率,证明决策树算法有助于医疗数据分析应用.  相似文献   

4.
C4.5算法是进行数据分类分析的经典决策树数据挖掘算法,应用广泛。介绍了决策树及其常用算法ID3,指出了它存在的缺点。分析了C4.5算法,通过其在高校教学决策中的应用实例,说明数据分类并实现预测的过程。最后指出了C4.5算法的不足及未来的研究方向。  相似文献   

5.
针对传统C4.5决策树分类算法需要进行多次扫描,导致运行效率低的缺陷,提出一种新的改进C4.5决策树分类算法.通过优化信息增益推导算法中相关的对数运算,以减少决策树分类算法的运行时间;将传统算法中连续属性的简单分裂属性改进为最优划分点分裂处理,以提高算法效率.实验结果表明,改进的C4.5决策树分类算法相比传统的C4.5决策树分类算法极大提高了执行效率,减小了需求空间.  相似文献   

6.
李晋  顾宏斌  潘湑 《科技信息》2010,(28):270-271
决策树学习策略广泛应用于模式识别和机器学习等领域,用来解决与分类相关的问题。决策树剪枝的作用是简化决策树,提高决策树的泛化能力,避免对训练集的过适应,是决策树学习中的重要研究内容。本文详细介绍了数据挖掘算法中的C4.5算法的基本思想,并且对REP剪枝技术进行分析,以此对C4.5算法进行剪枝。实验表明改进的C4.5算法与原C4.5算法相比能很好地处理训练集的非平衡性,并降低决策树的规模,效率得到提高。  相似文献   

7.
邱燕玲 《科技资讯》2007,(7):131-132
目前,数据挖掘多应用于零售业、制造业、财务金融保险、通讯及医疗服务等领域,而在教育领域中较少。本文把数据挖掘技术引入到教学测评中,从而提高教学测评技术水平,以进一步提高教育教学水平。  相似文献   

8.
陈衡  刘磊 《科技信息》2013,(19):140-141
利用数据挖掘的关联规则对淮北职业技术学院教务系统中的学生信息进行分析,采用Apriori算法完成学生数据间的关联挖掘,生成关联规则。发现影响学生综合测评的因素,为教学管理部门提供参考。  相似文献   

9.
决策树分类算法及其应用   总被引:2,自引:0,他引:2  
分类算法是数据挖掘中的最重要的技术之一.本文对决策树数据挖掘方法进行分析和比较;并应用分类方法挖掘枣树嫁接成活率与各种外在因素之间的关系,证明了决策树算法在果树研究领域有着广阔的应用前景.  相似文献   

10.
李文静 《甘肃科技纵横》2007,36(3):14-14,43
分类是数据挖掘中一个重要的研究领域。常用的技术有决策树分类、贝叶斯分类、神经网络分类等。通过对当前具有代表性的分类算法原理进行分析、比较,总结出每种算法的性能特征。  相似文献   

11.
一种改进的C4.5算法   总被引:1,自引:0,他引:1  
为了提高C4.5算法的有效性,提出了一种改进的MB-C4.5算法.该算法主要改进了C4.5算法的分枝策略和属性选取的标准.把分类效果较差的分枝合并到分类效果较好的分枝中.引进一个平衡度系数,系数大小由决策者依靠先验知识或领域知识确定.MB-C4.5算法在提高重要属性的选择、减少无意义分枝、过度拟合等方面有一定提高.用该算法构造出的决策树进行分类更为准确、合理.对改进前后的算法用实例进行分析,说明MB-C4.5算法的有效性.  相似文献   

12.
决策树C4.5算法的改进及应用   总被引:12,自引:3,他引:9  
根据C4.5算法中信息增益率计算原理的特点,利用数学上等价无穷小的性质提出一种新的改进的C4.5算法,减少了信息增益率的计算量,进而提高C4.5算法中信息增益率的计算效率.改进的C4.5算法与原C4.5算法相比,在构造决策树时具有相同的准确率和更高的计算速度,将改进后的C4.5算法应用到成绩分析中.  相似文献   

13.
空气质量评价是确定空气污染程度的一种手段,采用先进的人工智能技术对空气环境进行智能评价和预测, 成为一个新兴交叉研究领域。本文采用C4.5决策树算法构建空气质量评价系统,挖掘空气污染物和空气等级关系的历史数据,建立空气污染物-空气等级智能评价模型。通过实验仿真发现,C4.5决策树算法取得了较为理想的分类预测效果。  相似文献   

14.
决策树各类算法,各有特点,其中J.R.Quinlan提出的ID3算法最具代表性,在国际上的影响也最大,C4.5算法就是在ID3算法基础上进行改进得到的.通过对两种算法详细描述,阐明了决策树算法步骤及其主要思想.  相似文献   

15.
一种有效的C 4.5改进模型   总被引:7,自引:0,他引:7  
介绍了一种有效的决策树改进模型:R-C 4.5及其简化版本,旨在构造一棵简单的树,同时提高决策树属性选择度量的可解释性,减少空枝和无意义分枝,以及过度拟合。该决策树模型基于著名的C 4.5决策树模型,但在属性的选取和分枝策略上进行了改进。在R-C 4.5中,通过合并分类效果差的分枝,有效避免了碎片等问题。实验表明,R-C 4.5决策树在保持模型预测准确率的同时,有效改进了树的健壮性。作为R-C 4.5的简化版本,R-C 4.5c和R-C 4.5s可生成更为简单的树,而且R-C 4.5s通过数据预处理阶段完成,易于实现。  相似文献   

16.
基于C4.5算法的敏感图像检测方法   总被引:1,自引:0,他引:1  
提出一种基于2次C4.5分类的敏感图像检测方法.该方法利用Daubechies小波和灰度共生矩阵提取图片的纹理信息,在HSI空间和YCbCr空间提取颜色特征,进行第1次基于C4.5算法的训练和分类;对分类生成的0,1二值空间进行特征提取,将所有特征分量融合进行基于C4.5算法和2次训练和分类.基于2次训练生成的规则进行敏感图片的检测.实验结果表明,该方法对于敏感图片分类正确率达93.3%以上,与基于颜色和纹理特征的直接检测方法相比,进一步提高了正确识别率.  相似文献   

17.
信息增益率倾向于取值数较少的属性和产生不平衡的划分,GINI指数偏向于取值数较多的属性且区间趋于平衡的划分.基于此,该文提出融合GINI指数的C4.5改进算法,首先计算候选属性的信息增益率和GINI指数,其次计算信息增益率和GINI指数的比值,最后筛选出比值最大的属性作为划分结点,改进了C4.5算法的不足.以10次10折交叉验证准确率和运行时间为评价指标,通过5组UCI数据测试改进算法性能,并与ID3、C4.5和CART算法对比实验.实验结果表明:融合GINI指数的C4.5算法减轻了属性取值多少对划分结点选择的影响,并且缓和了划分区间的不平衡,提高了分类准确率和运行效率,算法更加稳定,可行有效.  相似文献   

18.
部分民族地区高校毕业生就业是个难点问题。本文介绍了ID3、C4.5和CART三种决策树算法,并选取河池学院毕业生追踪调查数据,分别建立ID3、C4.5和CART分类器进行预测比较。结果表明,C4.5预测分类器具有最小计算量和最高准确率。通过测试,C4.5分类器预测分类准确度和精度与实测数据相符,能够较好地满足应用要求。C 4.5分类器分类规则表明,道德素养、专业素质和实践能力是用人单位录用毕业生的主要标准。预测结果同时也为学校创新人才培养模式,提高毕业生就业能力提供一定的决策支持。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号