首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
基于粗糙集理论的决策树构造算法   总被引:3,自引:0,他引:3  
应用粗糙集理论,提出了一种利用新的启发式函数构造决策树的方法。该方法以属性重要性评价指标作为信息熵函数,对务件属性进行选择,充分考虑了属性间的依赖性和冗余性,弥补了ID3算法对属性间依赖性强调不够的缺点,解决了决策树中子树的重复和有些属性在同一决策树上被多次选择的问题,该方法还能对不相容决策表进行正确分类。实例表明该方法是正确有效的,而且明显优于传统的决策树构造方法。  相似文献   

2.
为获得影响未成年人犯罪程度的重要因素,在论证基于属性约简的决策树分类算法适于处理多属性大容量数据表的基础上,将该算法应用于未成年人犯罪行为的分析。分析过程首先从公安业务数据库中提取未成年人犯罪行为的相关信息并建立决策表,同时利用条件属性相对于决策属性的依赖关系进行属性约简,最终针对约简结果生成决策树获取规则,运行结果表...  相似文献   

3.
基于粗糙集和决策树的数据挖掘方法   总被引:10,自引:1,他引:9  
从粗糙集和决策树两种方法具有的优势互补性出发,提出了一种基于粗糙集和决策树相结合的数据挖掘新方法·以胶合板缺陷检测数据分析为应用对象,利用粗糙集理论对胶合板数据库中的特征信息进行缺陷识别·利用谱系聚类重心距离法对数据进行离散化处理,采用粗糙集进行属性约简,得到低维样本数据,最后用决策树方法产生决策规则·实验证明,这种数据挖掘方法保留了原始数据的内部特点,加快了获取知识的进程,提高了模型的分类准确率,增强了规则的可解释性,取得了满意的研究结果·  相似文献   

4.
一种基于关联性度量的决策树分类方法   总被引:7,自引:2,他引:7  
在介绍了一些典型的决策树分类算法的基础上,论述了所开发的面向先进制造企业的综合数据挖掘系统ScopeMiner中的决策树分类算法,该算法集中了ID3、C45和MedGen等典型算法的思想,并进行了改进·在建立决策树过程中采用关联性度量的计算来确定划分条件属性的顺序,通过阈值设定和处理简化了决策树的剪枝和优化过程,准确性高,分类速度快·系统已在某大型企业质量控制中得到了应用,取得了一定的经济和社会效益·文章详述了算法的执行过程、应用于冶金企业中的实例以及正确性证明和时间复杂性分析·  相似文献   

5.
使用粗糙集理论对训练集进行属性约简,再使用决策树算法得到决策树规则;然后,根据规则信息量及规则可信度的概念提出两条规则筛选准则,并将两条准则应用于极小极大规则学习方法,形成有判定的极小极大规则学习.将该算法应用于决策树规则的简化,缩小了简化的范围,并能保证规则覆盖的一致性,且可减少规则的总数量.  相似文献   

6.
采用一种改进后的决策树归纳聚类算法和交互式CLTree(Clustering based on decision Trees)剪枝,对商业数据的某些问题实现了聚类挖掘。对交易数据的实际酸类分新表明,该方法不仅可以处理数值型属性,还可以处理枚举型属性。实验结果表明,该方法在处理很合类型数据时具有良好的挖掘效果。对商业数据聚类分新,可以得到合理的市场分段,预测顾客的购买行为。  相似文献   

7.
关联规则应用最频繁的是在零售部门,尤其是超市。以某超市一天中的商品销售记录为例来说明关联规则的应用,从中发现客户的购买模式和消费习惯。决策树分类方法的应用中,对于汽车销售公司的客户定位进行了分析,区分了男性和女性的偏好。销售公司可以据此对客户进行具体定位,促进销售。  相似文献   

8.
针对常用决策树生成方法中存在的缺点,通过引用属性关联度和代价敏感学习,利用粗糙集理论对条件属性进行约减。在构建决策树过程中,把属性的关联程度和性价比作为选择分裂结点的依据,利用改进的信息增益构建代价敏感决策树。试验结果表明,该方法在分类准确度和生成决策的结点总量上比常用决策树生成方法优越。  相似文献   

9.
基于相似依赖度的属性加权决策树算法   总被引:1,自引:1,他引:1  
粗糙集分析方法利用数据本身提供的信息,不需要任何先验知识即可对已有的知识进行处理,在保留关键信息的前提下,对数据进行简化并求得属性组合。在此基础上提出了一种基于相似依赖度的属性选择算法,从约简出的属性组合中选择与决策属性最为相似的核集,根据属性的相似依赖度作为决策树的加权值,从而建立决策树。通过对影响学生成绩因素的数据进行分析表明,所提出的算法是易于实施的,而且形成的决策树的准确率也有了一定的提高。  相似文献   

10.
一种改进的决策树算法   总被引:1,自引:0,他引:1  
为解决决策树算法ID3的多值偏向的缺点,利用属性相似度偏向少值属性的特点,提出一种将属性相似度作为信息熵的系数的属性选择标准,从而提出相应的决策树生成算法.实验结果表明,新算法既避免了以信息熵作为属性选择标准的决策树算法的多值偏向,也避免了以属性相似度作为属性选择标准的决策树算法的少值偏向.  相似文献   

11.
Rough集理论提供了一种新的处理不精确、不完全与不相容知识的数学方法,在决策表中快速、有效地挖掘出缺省规则。本文将Rough集属性约简应用到判定树归纳分类方法中,明显优化判定树,简化数据挖掘的过程。  相似文献   

12.
文章提出一种基于属性重要度的随机决策树构造算法ASRDT,该算法利用粗糙集理论计算每个属性的属性重要度,提升重要属性的影响因子,使得建树过程中随机选择属性时,不同属性之间的区分度得以体现,从而显著提高了算法的抗干扰能力,使ASRST在保持原有RDT算法优点的基础上,更具有良好的分类准确率及稳定性。  相似文献   

13.
为寻找最优决策树,对决策树生成方法进行了研究,提出了属性相似度的计算方法,引入了属性相似度,对测试属性进行约简.在此基础上,提出了以属性相似度为启发规则的决策树生成算法.该方法预测精度高,计算简便.  相似文献   

14.
基于决策树方法的水库跨流域引水调度规则研究   总被引:1,自引:0,他引:1  
目前跨流域引水调度属于常规引水规划调度方式,没有考虑实时信息.利用数据挖掘技术中的决策树方法将水库当前的气象预报信息和下垫面蓄水状态、水库多年的实际运行情况等资料与水库管理者的实际调度经验相结合,提出跨流域引水水库的实时调度规则.研究分三步,即首先选取旬初库水位、GFS预报与实际降雨量,旬前土壤含水状态,以及跨流域引水量等资料构成水库调度数据集;然后利用数据挖掘技术从中提取跨流域引水调度决策树;最后对调度决策树进行检验获取跨流域引水水库实时调度规则.实例计算结果表明,采用决策树跨流域引水调度规则进行水库引水调度,可提高水资源利用效率,增加水库综合效益.研究成果对跨流域引水水库实时调度的深入研究与应用有参考价值.  相似文献   

15.
一种新的模糊决策树模型及其应用   总被引:1,自引:0,他引:1  
模糊决策树是决策树在模糊环境下的一种推广,虽然其表示形式更符合人类的思维,但在构造时会增加预处理的工作量和创建树时的开销。基于这种情况,提出了一种混合算法,算法保留了较少属性值的Shannon熵,计算多属性和连续属性值模糊化后的模糊熵。将该算法应用于滑坡数据的挖掘中,得到了更易于理解的决策树和有效的规则,与传统算法的性能比较也证明了该算法的有效性。  相似文献   

16.
不完备信息系统也有很多有用信息,可以得出支持决策的确定规则。基于决策树的完备信息系统规则提取方法很多,如比较有影响的ID3算法等,但是在不完备信息系统中应用决策树进行规则提取的方法还不是很多。本文提出用多变量决策树方法对不完备信息系统进行规则提取的方法,可以得出部分确定信息,方法简单易行。  相似文献   

17.
数据挖掘之决策树方法概述   总被引:12,自引:0,他引:12  
数据挖掘在科研和商业应用中正发挥着越来越重要的作用。分类器是数据挖掘的一种基本方法,决策树是一种最重要的分类器。本文介绍了分类器中的决策树方法及其优点,决策树表示法,决策树构造思想,并比较了各种重要的决策树算法。介绍了决策树算法的实现工具,决策树与数据仓库的结合,决策树的适用范围及应用,最后探讨了决策树的发展趋势。  相似文献   

18.
随着数据量的急剧增长,根据数据分布寻找规律,并据此进行分析决策,往往需要借助相应的数据挖掘工具,通过训练样例对其参数进行调整和逼近,以达到较好的预测及分析效果,为决策提供支持.利用机器学习中决策树的方法对一组网上民众调查数据进行了学习和预测,并对决策树进行了改进和效果分析.  相似文献   

19.
居民出行调查是城市交通规划、建设、管理的基础和依据,运用数据挖掘技术中的决策树,对居民出行数据进行了分类规则挖掘,得出了福州市居民的个人情况与其出行方式选择的相关性,并对福州市的交通发展提出了相应对策。  相似文献   

20.
为了提高入侵检测的准确度和速度,针对入侵规则属性相关性的特点,将属性与类间的互信息与属性间的互信息结合,提出了一种新的混合互信息的决策树分类算法.在对此算法进行了算法设计和分析的基础上,将由此算法构造的决策树分类方法对入侵规则进行组织,改变了传统的入侵规则逐条串行检测,以增加预处理时间为代价,提高了数据包的过滤速度和准确度.实验分析表明,应用该算法的入侵检测系统比使用传统方法具有更高的准确率和速度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号