共查询到16条相似文献,搜索用时 250 毫秒
1.
决策树C4.5算法在森林资源二类调查中的应用 总被引:3,自引:0,他引:3
C4.5算法是基于信息熵理论进行数据分类分析的经典决策树数据挖掘算法.它主要包括数据预处理、决策树生成、决策树修剪、决策树规则提取等步骤.笔者将C4.5算法应用于森林资源二类调查的数据分析中,通过对调查数据挖掘分析表明,数据挖掘在森林资源调查数据分析中具有广泛的应用前景. 相似文献
2.
刘耀南 《东莞理工学院学报》2012,19(5):47-52
C4.5算法是进行数据分类分析的经典决策树数据挖掘算法,应用广泛。介绍了决策树及其常用算法ID3,指出了它存在的缺点。分析了C4.5算法,通过其在高校教学决策中的应用实例,说明数据分类并实现预测的过程。最后指出了C4.5算法的不足及未来的研究方向。 相似文献
3.
决策树算法在医学图像数据挖掘中的应用 总被引:8,自引:1,他引:8
目的研究决策树算法在医学图像数据挖掘中的应用。方法利用决策树算法对乳腺癌图像数据进行分类,提出了一个基于决策树算法的医学图像分类器。结果实现了ID3和C4.5算法对图像数据的分类,获得了分类的实验结果。结论该模型系统达到了较高的分类准确率,证明数据挖掘在辅助医疗诊断中有着广泛的应用前景。 相似文献
4.
决策树分类算法及其应用 总被引:2,自引:0,他引:2
分类算法是数据挖掘中的最重要的技术之一.本文对决策树数据挖掘方法进行分析和比较;并应用分类方法挖掘枣树嫁接成活率与各种外在因素之间的关系,证明了决策树算法在果树研究领域有着广阔的应用前景. 相似文献
5.
6.
决策树分类算法是智能指导系统实现"智能"的一种有效工具。通过对数据的分析和挖掘,能够实现对数据的精确分类。另外,对于决策树和产生式规则集的计算相对简单而且高效。提出了智能指导系统,并介绍了该系统的主要功能模块。在比较了ID3算法和C4.5算法后,结合个性化教学的需求,提出了新的基于规则属性相关的C4.5r算法。同时,给出了系统的计算评估模块。实验结果表明,新的C4.5r算法在运算时间、产生式规则集的规模及计算产生式规则的开销方面明显优于传统的C4.5算法。 相似文献
7.
《郑州大学学报(理学版)》2016,(1)
提出了一种基于决策树C4.5的多示例学习算法C4.5-MI,通过拓展C4.5的熵函数和信息增益比来适应多示例学习框架.应用梯度提升方法对C4.5-MI算法进行优化,得到效果更优的GDBT-MI算法.与同类决策树算法在benchmark数据集上进行比较,结果表明,C4.5-MI和GDBT-MI算法具有更好的多示例分类效果. 相似文献
8.
数据挖掘技术的研究和应用 总被引:4,自引:0,他引:4
唐笑林 《华东理工大学学报(自然科学版)》2008,34(2):290-295
论述了数据挖掘的概念、算法、实际的挖掘过程,分析了C4.5决策树算法,调查了安徽职业技术学院学生英语学习的各种情况,找出其中潜在的规则,为学校教学决策提供一定的支持. 相似文献
9.
决策树学习算法是数据挖掘中一类经典的分类算法。传统的决策树学习算法把数据集合中的实例同等对待,而忽略了实例之间存在的可疑性和影响度差异,导致错误实例扭曲了学习结果,严重影响学习质量。在此提出基于可疑实例影响度分析改进的C4.5 rules算法,在给定一个噪音集合后,首先把可疑实例与原集合划分开,并对可疑实例的影响度进行分析和度量,然后依据分类规则对可疑实例的覆盖情况进行重新排序和分类预测。算法在对分类规则重排序后将错误实例对学习结果的影响最小化,得出尽可能接近正确数据的学习结果。将此算法与经典的C4.5 rules算法进行实验比较,结果表明该算法有着良好的性能。 相似文献
10.
决策树分类算法的分析和比较 总被引:2,自引:0,他引:2
刘莺迎 《科技情报开发与经济》2008,18(2):65-67
在数据挖掘中存在多种算法,决策树分类算法是应用比较多的一种。基于决策树分类算法的研究现状,对各种决策树分类算法的基本思想进行了阐述,并对不同的算法进行了分析和比较。 相似文献
11.
C4.5算法在客户关系管理中的应用研究 总被引:1,自引:0,他引:1
通过数据挖掘技术可以挖掘出隐藏在大量数据背后的信息,企业才能对客户进行细分,预测客户行为和做出正确的决策.文章在数据挖掘常用技术的基础上,提出了其在CRM中的应用模型,并基于C4.5算法,对数据挖掘在客户获取中的应用进行了实证分析. 相似文献
12.
分析了全断面掘进机复杂的故障机理和运行参数,研究了将粗糙集和决策树应用到数据挖掘中的方法.以全断面掘进机刀盘的一些实时数据为例,采用MATLAB 7.0对数据进行离散化处理,结合粗糙集属性约简的算法对故障样本进行冗余属性的约简;然后,利用决策树算法对约简后的故障样本集进行规则提取,利用数据挖掘工具Clementine实现了C4.5算法和改进的C4.5算法,对其结果进行了对比分析;最后,运用VB编程对全断面掘进机采集的部分数据进行测试,结果表明该融合算法是一种快速、有效、可靠的故障检测与诊断的新途径. 相似文献
13.
潜在流失客户的发掘模型探讨 总被引:2,自引:0,他引:2
提出了一个基于数据挖掘技术的解决方案,首先运用C4.5决策树算法识别客户的客观指标集合,然后对这些客观指标进行偏差分析,建立时间序列模型预测流失客户。 相似文献
14.
数据挖掘领域中的聚类方法 总被引:4,自引:0,他引:4
王美华 《南华大学学报(自然科学版)》2004,18(1):58-62
聚类算法是数据挖掘中的核心技术,随着对聚类算法广泛深入的研究,产生了许多不同的适用于数据挖掘的聚类算法;文章从算法的角度论述了如何在数据挖掘中进行聚类分析,并通过基于评价聚类算法好坏的8个标准,对数据挖掘中近几年提出的常用聚类方法作了比较分析,以利于人们更容易、更快速的找到一种适用于特定问题的聚类算法. 相似文献
15.
为提高分类挖掘的准确度,在分析ID3,C4.5和进化算法(EC)的基础上,设计了两个共同进化的种群分别表示选择的属性子集和分类规则子集,提出基于共同进化计算的分类规则算法(CRCEC),并构建CRCEC算法的适应度评价函数.用4个加利福尼亚大学Irvine分校的数据集对CRCEC,ID3,C4.5和EC算法进行测试比较,结果表明CRCEC算法分类准确度高,可以得到简洁的、可理解性强的规则.最后给出了CRCEC算法在公路车辆征费分类预测系统中的一个应用实例. 相似文献
16.
研究了数据挖掘技术的概念、过程、方法和技术等内容,详细地介绍了决策树技术在学生心理问题数据挖掘中的全过程,采用C4.5算法生成了学生心理问题的决策树模型,并由此产生了分类规则,为高校心理咨询工作提供了一些有用的参考依据。实验’结果表明,该方法对高校构建预防型大学生心理健康教育模式具有一定的实用价值。 相似文献