首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 140 毫秒
1.
针对传统C4.5决策树分类算法需要进行多次扫描,导致运行效率低的缺陷,提出一种新的改进C4.5决策树分类算法.通过优化信息增益推导算法中相关的对数运算,以减少决策树分类算法的运行时间;将传统算法中连续属性的简单分裂属性改进为最优划分点分裂处理,以提高算法效率.实验结果表明,改进的C4.5决策树分类算法相比传统的C4.5决策树分类算法极大提高了执行效率,减小了需求空间.  相似文献   

2.
信息增益率倾向于取值数较少的属性和产生不平衡的划分,GINI指数偏向于取值数较多的属性且区间趋于平衡的划分.基于此,该文提出融合GINI指数的C4.5改进算法,首先计算候选属性的信息增益率和GINI指数,其次计算信息增益率和GINI指数的比值,最后筛选出比值最大的属性作为划分结点,改进了C4.5算法的不足.以10次10折交叉验证准确率和运行时间为评价指标,通过5组UCI数据测试改进算法性能,并与ID3、C4.5和CART算法对比实验.实验结果表明:融合GINI指数的C4.5算法减轻了属性取值多少对划分结点选择的影响,并且缓和了划分区间的不平衡,提高了分类准确率和运行效率,算法更加稳定,可行有效.  相似文献   

3.
蔡星 《科技咨询导报》2014,(12):40-40,45
该文对传统的C 4.5决策树数据挖掘算法进行了改进,提出了一种双重熵平均决策树算法。传统的C 4.5决策树算法易出现无意义分枝,过度拟合等问题,针对该类问题,基于双重熵平均决策树算法,通过两次对样本子集熵平均值的计算、排序、合并处理,得到修正后的属性信息增益,并以此作为属性选择的依据,从而解决了传统C 4.5决策树算法可解释性差、易产生碎片等问题。  相似文献   

4.
决策树C4.5算法的改进及应用   总被引:12,自引:3,他引:9  
根据C4.5算法中信息增益率计算原理的特点,利用数学上等价无穷小的性质提出一种新的改进的C4.5算法,减少了信息增益率的计算量,进而提高C4.5算法中信息增益率的计算效率.改进的C4.5算法与原C4.5算法相比,在构造决策树时具有相同的准确率和更高的计算速度,将改进后的C4.5算法应用到成绩分析中.  相似文献   

5.
决策树方法是一种非常有效的分类方法,这种方法能够用来改善农场管理中的薄弱点。决策树计算基于C4.5算法,这种算法构造决策树采用自顶向下递归策略,把信息增益率的高低作为属性选择的度量标准。  相似文献   

6.
决策树算法广泛应用于数据挖掘领域之中.属性选择是决策树方法挖掘效率的关键,但ID3方法和C4.5方法在选择属性时,都会产生一定程度的选择偏差.据此,该文对信息增益模型进行了改进,将多次对数运算的信息熵求取过程简化为多值求和,从而规避了属性选择出现偏差的可能性,也加快了决策树构建的执行速度.依托学生情况数据展开的实验研究表明,与经典的ID3方法相比,该文方法构建的决策树更加简洁.同时,随着数据样本数量的增大,该文方法的执行时间大为降低.  相似文献   

7.
决策树算法广泛应用于数据挖掘领域之中.属性选择是决策树方法挖掘效率的关键,但ID3方法和C4.5方法在选择属性时,都会产生一定程度的选择偏差.据此,该文对信息增益模型进行了改进,将多次对数运算的信息熵求取过程简化为多值求和,从而规避了属性选择出现偏差的可能性,也加快了决策树构建的执行速度.依托学生情况数据展开的实验研究表明,与经典的ID3方法相比,该文方法构建的决策树更加简洁.同时,随着数据样本数量的增大,该文方法的执行时间大为降低.  相似文献   

8.
分类是数据挖掘的一个重要研究方向,使用决策树进行分类是一种常用而且高效的分类方法。目前传统的算法有ID 3、C 4.5、CART等,这些算法都有如下的局限性:必须人工输入归类集合,划分属性,确定最优的分类集合。为了解决这些问题,本文做了如下工作:①提出信息增益排列GEP染色体头部的思想;②给出基于信息增益的GEP构造决策树属性约简算法(IG-GEPDTAR)并用实验进行验证;③实验表明该算法构造的决策树在具有100%准确性的同时,比使用GEP算法构造的决策树减少了冗余分支,其节点数比传统的ID 3算法和P ID算法构造的决策树的节点数分别减少了82.9%和31.2%。  相似文献   

9.
针对现有无监督属性约简方法只单一使用子空间学习或属性选择的方法,并且忽略数据之间的内在相关性,本文提出一种新的属性选择方法。首先提出一个属性自表达损失函数加上一个稀疏正则化(l2,1-范数)实现无监督学习与属性选择。然后嵌入子空间学习方法,并使用低秩约束和图正则化项考虑数据的全局结构和局部结构。经聚类实验验证,该算法较对比算法能取得更好的效果。  相似文献   

10.
一种基于属性贡献度的决策树学习算法   总被引:3,自引:1,他引:2  
文章提出一种基于属性贡献度的决策树算法ICD,该算法利用信息熵理论构建基于样本类别信息分布确定的属性贡献度函数模型,从属性选优上消除了多值属性选择的偏向,将ICD算法与ID3、C4.5算法进行实验对比,数据结果表明该算法具有良好的性能.  相似文献   

11.
基于遗传算法的多用户OFDM比特加载   总被引:1,自引:0,他引:1  
根据最小发送功率准则,针对多用户OFDM系统,提出了基于遗传算法的自适应比特加载解决方案.采用的矩阵编码方法直观、简单,具有并行性运算特性.通过交叉和变异让搜索跳离局部极值的陷阱,搜索到全局最优解.仿真结果表明,在给定的误比特率下,遗传算法与等比特分配方案相比可节省功率5~6 dB,与multiuser adaptive OFDM(MAO)方法相比仅相差1 dB,同时遗传算法的并行性使得节省了运算时间,提高了运算效率.  相似文献   

12.
介绍了求解均衡问题的几类算法,并针对收敛性证明需要Lipschitz连续性条件的问题,提出了一种加速投影算法.该算法首先由辅助问题原理和Armijo型线搜索得到一个预估点并以此构造一个超平面,进一步通过选择适当步长和减小投影域使得算法产生的序列快速收敛,从而实现加速投影的目的.最后,在双重函数f伪单调且不需要Lipschitz连续的条件下,证明了该算法产生的迭代序列全局收敛到伪单调均衡问题的解.  相似文献   

13.
三维水平井井眼轨迹设计最优控制模型及算法   总被引:1,自引:1,他引:1  
针对三维水平井井眼轨迹优化设计问题,首次建立了以非线性状态方程为主要约束条件的目标控制模型,依该模型的特点,构造了改进的Hooke-Jeeves优化算法,为获得全局最优解,采用均匀设计方法选取初始点,计算结果证明了模型、算法及研制软件的正确性与有效性,而且具有计算时间短,结果精度高等特点。  相似文献   

14.
提出了一种基于模糊C均值算法和生物地理学优化算法的混合聚类算法(BBO-FCM).该算法结合了生物地理学优化算法的全局搜索和FCM算法快速局部搜索的特点,利用生物地理中的迁移算子来进行各解之间的信息共享,从而有效地克服了FCM对初始值敏感、易陷入局部最优等问题.将BBO-FCM算法用于图像分割,实验表明,新算法的聚类效果评价指数更好,聚类效果明显优于原始的FCM算法.  相似文献   

15.
萤火虫算法存在着对于初始解分布的依赖性、后期收敛速度慢、易于停滞、早熟和求解精度低等缺陷。本研究在萤火虫算法引入蝙蝠种群在全局最优附近进行更加详细的局部搜索,以协助萤火虫种群进行寻优;并在寻优过程中加强蝙蝠种群与萤火虫种群的信息交互,协调寻优;最后对全局最优个体进行高斯扰动以增加种群的多样性,从而避免种群陷入局部最优解。通过使用6个常见的基准测试函数对该算法进行测试,并与其他3种算法(标准粒子群算法、蝙蝠算法、萤火虫算法)进行对比实验,结果表明该混合算法的总体性能优于其他3种算法。引入蝙蝠种群对萤火虫性能有较大提升,改善切实有效。  相似文献   

16.
具有全局聚类的多属性离散化算法   总被引:1,自引:1,他引:0  
为了减少连续属性离散化后有用信息的丢失和信息系统总的断点数量,提出了一种具有全局聚类效果的多属性离散化算法.算法根据各属性预插入断点对信息系统近似分类质量的影响,来确定要插入断点的属性,从全局属性范围选择最佳断点.根据Ameva统计量来判断属性中最佳断点的位置,并以保证决策表的近似分类质量作为算法的终止条件.实验采用多...  相似文献   

17.
Immune Algorithm for Selecting Optimum Services in Web Services Composition   总被引:2,自引:0,他引:2  
0 IntroductionInha rveec eenmte yregaerds a,sa t ghreo Iwnitnegrn neut mdbeverel oofps W aetb a S fearsvtic reast e( .W TSshe)Webis nowevolving into a distributed device of computationfroma collection of information resources[1]. But individualWeb services usually cannot satisfy some customers’require-ments ,so we always needtointegrate existingservices to cre-ate newvalue-added composed services .The process model underlying a composite identifies thefunctionalities required by the servic…  相似文献   

18.
传统粒子群算法运行机理是通过粒子群全局最优和自身经验最优来搜索最优位置,不断迭代进化,以此趋近最优解,但该算法共享信息的局限性使其容易陷入局部最优.针对传统粒子群算法的不足,提出了共享历史最优搜索信息的粒子群算法.该粒子群体在搜索过程中,共享算法本次运行的种群个体历史最优信息、当前全局最优信息,及前几次运行过程中的种群个体历史最佳信息.通过5个经典函数的仿真实验测试,验证了该算法具有较强的全局搜索能力和收敛性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号