首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
顿毅杰  张永 《甘肃科技》2005,21(6):80-81
决策规则是关联规则、决策树和粗糙集等方法挖掘的主要对象。提出了一种基于属性值重要性的挖掘决策规则的新方法,该算法将属性值重要性看成是可以分辨的元组对数,从其构造的决策树中得到的规则与ID3算法产生的规则是等价的,但该方法计算复杂度低。  相似文献   

2.
基于决策树的智能信息安全风险评估方法   总被引:1,自引:0,他引:1  
为了解决信息安全风险评估方法主观性大、建模时间长、分类正确率低的问题,提出了基于决策树的智能信息安全风险评估方法。该方法利用层次分析法对信息安全风险评估因素进行层次分解,利用机器学习中的决策树分类算法对数据进行分类。实例分析表明:与基于支持向量机的信息安全风险评估方法相比,在处理央企、银行、政府等单位风险评估过程中得到...  相似文献   

3.
决策树归纳法ID3是人工智能机器学习中发展较快的一种归纳学习算法,而目前的ID3及其改进算法亦因各种问题限制了其在工程中的应用。基于决策树归纳学习算法示例学习最优化的理论,用在多概念学习条件下对多特征属性值进行分组聚类实现优化的方法,导出了定义在多概念窨上的决策树归纳学习算法NMID。这种新算法对工程技术领域普遍存在的多概念学习问题,有较好的应用价值。  相似文献   

4.
针对缺失属性值数据分类算法中模型分类精度和泛化能力低的问题, 提出一种基于模糊规则的缺失属性值数据分类算法, 即“循环 接收”模型. 该算法不需要对缺失属性值数据进行插补运算, 可直接对该数据集进行分类. 对UCI公开数据集进行模拟仿真实验, 实验结果表明, “循环 接收”模型与其他算法相比具有更高的分类精度和泛化能力.  相似文献   

5.
一种新的模糊决策树模型及其应用   总被引:1,自引:0,他引:1  
模糊决策树是决策树在模糊环境下的一种推广,虽然其表示形式更符合人类的思维,但在构造时会增加预处理的工作量和创建树时的开销。基于这种情况,提出了一种混合算法,算法保留了较少属性值的Shannon熵,计算多属性和连续属性值模糊化后的模糊熵。将该算法应用于滑坡数据的挖掘中,得到了更易于理解的决策树和有效的规则,与传统算法的性能比较也证明了该算法的有效性。  相似文献   

6.
针对绝大部分多变量决策树只能联合数值型属性,而不能直接为带有分类型属性数据集进行分类的问题,提出一种可联合多种类型属性的多变量决策树算法(CMDT).该算法通过统计各个分类型属性的属性值在各个类别或各个簇中的频率分布,来定义样本集合在分类型属性上的中心,以及样本到中心的距离.然后,使用加权k-means算法划分决策树中的非终端结点.使用这种结点划分方法构建的决策树可用于数值型数据、分类型数据以及混合型数据.实验结果表明,该算法建立的分类模型在各种类型的数据集上均获得比经典决策树算法更好的泛化正确率和更简洁的树结构.  相似文献   

7.
目前决策树中很多分类算法例如ID3/C4.5/C5.0等都依赖于离散的属性值,并且希望将它们的值域划分到一个有限区间。利用统计学法则,提出一种新的连续属性值的划分方法;该方法通过统计学法则来发现精准的合并区间。另外在此基础上,为提高决策树算法分类学习性能,提出一种启发式的划分算法来获得理想的划分结果.在UCI真实数据集上进行仿真实验.结果表明获得了一个比较高的分类学习精度、与常见的划分算法比较起来有很好的分类学习能力。  相似文献   

8.
针对ZPW-2000A无绝缘轨道电路故障逻辑机理模糊的问题,本文采用了基于决策树的轨道电路专家系统知识表示方法.该方法首先将轨道电路故障影响较大的特征向量样本建立故障决策表,然后运用最小信息熵算法对属性值离散化,根据决策树算法快速学习及分类的特点对离散后的数据样本进行训练学习,生成故障决策树后进行知识规则的获取,在专家系统的知识库中以产生规则存储.通过对ZPW-2000A无绝缘轨道电路的实例分析验证了该方法在轨道电路专家系统知识表示与获取中的有效性和实用性.  相似文献   

9.
模糊决策树归纳算法及应用   总被引:3,自引:0,他引:3  
使用分类信息熵极小化启发式,对分类问题中属性值为模糊集时,提出了直接用隶属度作为连续值变元来产生决策树的算法,将该算法应用于大型旋转机械振动故障诊断的规则提取上,经实践检验,所提学习算法合理。  相似文献   

10.
传统的ID3决策树算法存在诸多不足,如计算效率低、多值偏向等,对此,提出了属性值空缺、多值属性的选择以及属性选择标准方面的改进方案,并将加权熵和简化熵引入决策树算法以改进传统ID3算法.实验结果表明,改进后的算法在整体性能方面较目前广泛应用的ID3算法有更优秀的性能表现.  相似文献   

11.
ID3算法是决策树分类方法的核心算法,文章论述了ID3算法的基本思想和实现方法,并对ID3算法的性能进行分析,发现该算法存在不足之处.针对ID3算法倾向于多属性值的缺点,引入了权值对算法进行改进,并通过试验对改进前后的算法进行比较,结果表明改进后的算法是有效的.  相似文献   

12.
基于灰色关联决策算法的信息安全风险评估方法   总被引:1,自引:0,他引:1  
针对信息安全风险评估中参数评估值的不确定性问题,提出了一种基于灰色关联决策算法的信息安全风险评估方法.该方法首先分析了参数评估值的不确定性,将其分为灰色参数值和缺失参数值两类.其中,根据实际情况和历史统计数据,缺失参数评估值可能满足3种分布: 均匀分布、指数分布和正态分布.然后根据相应的先验估计对缺失参数评估值进行填充.填充后使用灰色关联决策算法对信息系统进行安全风险评估.最后通过算例证明了该方法的有效性.结果表明:该方法不仅可以较好地处理评估过程中参数值的不确定性问题,减少评估过程中的主观性,还可以方便地对不同信息系统的安全性进行比较,为信息安全风险评估给出了一种新的思路.  相似文献   

13.
随着数据量的增长,根据数据分布寻找规律,要借助于相应的数据挖掘工具,这里主要采用决策树的方法.决策树算法是通过构造精度高、小规模的决策树采掘训练集中的分类知识.针对决策树存在的一些问题,提出了改进方法.  相似文献   

14.
利用决策树发掘分类规则的算法研究   总被引:19,自引:4,他引:15  
主要介绍决策树方法,回顾利用决策树发掘分类规则的各种方法,并对算法进行评价,最后提出了一个利用决策树分类技术进行月降雨预报的算法。  相似文献   

15.
应急辅助决策中案例表示与检索方法研究   总被引:1,自引:0,他引:1  
针对突发事件发生后如何进行应急决策的问题,基于应急案例的层次结构提出了应急案例的XML表示方法,解决了异构应急案例的统一表示问题.在案例检索算法中,设计了一种基于结构相似度和属性相似度的双重案例检索算法,有效克服了传统最近邻算法中由于案例属性值缺失而无法进行案例相似性计算的缺陷.台风领域案例检索算法应用过程的实例说明了...  相似文献   

16.
为了提高基于大规模数据的决策树训练效率,提出了一种基于Spark平台的并行决策树算法(SPDT).首先,采用数据按列分区的方法,把单个属性列完整地保留在一个分区内,使缓存该分区数据的数据节点能独立完成信息熵的计算,以减少数据节点之间的信息交流造成的网络资源的占用.然后,数据在按列分区后以稠密向量的形式缓存于内存中,SPDT对数据进行压缩,以减少对内存的占用.最后,SPDT采用基于边界点类别判定的连续属性离散化方法来处理连续属性,减少决策树训练过程中信息熵计算的频次,并提出使用信息增益比划分训练数据集的方法,以减少信息增益计算对多属性值属性的依赖.实验结果表明,在树的训练效率方面,SPDT在保持分类精度的情况下,比Apache Spark-MLlib决策树算法(MLDT)以及基于Spark平台的垂直划分决策树算法(Yggdrasil)有明显的提升.  相似文献   

17.
在决策树算法中,即使存在两个"最好"属性,也只是随机选择一个作为根或节点属性.因此,决策树算法产生的分类规则较少.此外,决策树算法采用全匹配测试实例,测试实例最多匹配一条分类规则甚至没有匹配,进而影响分类准确率.针对该问题,提出了基于双属性节点部分匹配的决策树改进算法(DAID3):首先,如果存在两个信息熵相等或相近的"最好"属性,DAID3算法选择两个属性构建节点,它们的属性值及组合作为分枝.因此,每个训练实例可能被多条分类规则覆盖.其次,判断新实例时,在分枝节点上可能匹配到多条路径,为了选择最好路径,为每个分枝节点设置了节点强度.最后,如果不存在一条从根节点到叶子节点的路径全匹配测试实例,则找出部分匹配该实例的路径,返回该路径的终节点强度最大的类标值.为了便于部分匹配时返回强度最大的类标值,为每一个分枝节点设置节点类标值.实验结果表明,与决策树算法相比,DAID3算法具有分类规则多且有更高的分类准确率.  相似文献   

18.
农村商业银行控制运营成本、提升经济效益的重要手段是信贷风险管理,但是银行每天都需要处理大量的信贷业务。本文针对农村商业银行信贷业务中风险较高等问题,设计了一种基于决策树算法的信贷风险评估模型。该模型具有较高的准确率,为银行信贷风险评估提供重要决策依据。  相似文献   

19.
蔡星 《科技咨询导报》2014,(12):40-40,45
该文对传统的C 4.5决策树数据挖掘算法进行了改进,提出了一种双重熵平均决策树算法。传统的C 4.5决策树算法易出现无意义分枝,过度拟合等问题,针对该类问题,基于双重熵平均决策树算法,通过两次对样本子集熵平均值的计算、排序、合并处理,得到修正后的属性信息增益,并以此作为属性选择的依据,从而解决了传统C 4.5决策树算法可解释性差、易产生碎片等问题。  相似文献   

20.
王中辉  鲁来凤 《甘肃科技》2006,22(3):125-126,106
决策树是用来解决分类问题的重要方法之一。ID3是决策树学习的核心算法,为此,本文给出了决策树构造思想和ID3决策树学习算法,并将其应用于教学评价之中,这样可以提高教学评价技术水平,提高教学评价的科学性、客观性和公正性,使之更好地为教学服务。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号