首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 607 毫秒
1.
一种基于信息增益的分类规则挖掘算法   总被引:2,自引:0,他引:2  
提出了一种基于信息增益的分类规则挖掘算法.该算法主要包括决策树的构造、分类规则的提取、规则兴趣度度量3步.结合一个具体的例子,解释了使用该算法来挖掘分类规则的基本过程.  相似文献   

2.
一种新型决策树属性选择标准   总被引:7,自引:0,他引:7  
讨论传统决策树算法中三种常用的基于熵的属性选择标准,提出一种基于属性重要性排序的建立决策树的新方法。该方法在决策树的每个内结点首先依据属性重要性将属性进行排序,然后选择最重要的属性作为分类属性生成决策树,并抽取出规则。与传统的决策树数据分类方法相比,此方法可有效地选择出对于分类最重要的分类属性,增强决策树的抗干扰能力,并提高规则的预测精度。  相似文献   

3.
基于网络包分类算法在时间和空间复杂度上的限制,启发式策略一般具有较快的速度,同时在应用上具有较好的前景,提出了一种基于统计决策树的启发式包分类算法.该算法把规则头部中的每一位看作一个特征属性,因为不同位有不同的区分效果,根据对规则的统计把最具有区分意义的几位提取出来作为决策树的决策属性,使规则在子集中分布比较均匀,在子集中也做同样的处理,递归形成树形的数据结构;匹配时在树的每一层根据区分位判断其所属的子集,直到找到相匹配的规则.算法测试表明能实现高效的分类.  相似文献   

4.
一种新的模糊决策树模型及其应用   总被引:1,自引:0,他引:1  
模糊决策树是决策树在模糊环境下的一种推广,虽然其表示形式更符合人类的思维,但在构造时会增加预处理的工作量和创建树时的开销。基于这种情况,提出了一种混合算法,算法保留了较少属性值的Shannon熵,计算多属性和连续属性值模糊化后的模糊熵。将该算法应用于滑坡数据的挖掘中,得到了更易于理解的决策树和有效的规则,与传统算法的性能比较也证明了该算法的有效性。  相似文献   

5.
针对电能质量扰动的检测和分类问题,提出了一种新的基于广义S变换和决策树的电能质量扰动分类方法.首先提出基于FFT的自适应调整调节因子取值的方法,再利用广义S变换对常见的几种电能质量扰动信号进行时频分析,并提取特征形成判决规则,最后生成用于对电能质量扰动进行分类的决策树分类算法.仿真实验结果表明,该算法能够实现电能质量扰动的自动分类,且分类正确率很高.  相似文献   

6.
决策树分类方法是实现数据挖掘中分类任务的一种有效方法,但在大规模测试数据集上运行时其实现性能受到严重影响.本文设计和实现一种基于MapReduce架构的并行决策树分类算法.实验结果表明:基于MapReduce的决策树分类算法比同类算法在其他并行编程模型下的实现在计算节点较多的情况下能得到更优的性能.  相似文献   

7.
为了将传统的决策树无法管理的、由各种分类算法所发现的大量的有意义的规则进行有效的存储、剪裁和使用 ,提出了广义决策树结构。它将传统决策树的结构进行扩展 ,能够以较少的存储代价管理所发现的所有分类规则 ,且易于表达规则之间的关系。提出了有效的优化策略。以此树为基础 ,将决策树分类算法与基于关联规则的分类算法进行了概括统一 ,并提出了相应的算法。实验结果证明 ,广义决策树克服了传统决策树的缺点 ,并且适宜于维护、剪裁以及快速搜索大量的分类规则  相似文献   

8.
利用决策树发掘分类规则的算法研究   总被引:15,自引:4,他引:15  
主要介绍决策树方法,回顾利用决策树发掘分类规则的各种方法,并对算法进行评价,最后提出了一个利用决策树分类技术进行月降雨预报的算法。  相似文献   

9.
论文以决策树分类算法为主要研究对象,应用分类技术对高校人力资源数据源中的信息进行分析,给出了一种新的定量的人才识别方法,开发了分类与决策树算法人才识别系统模块,利用过去已有的引进人才的经验数据分析提取规则,为以后的人才识别提供合理的、科学的决策支持。  相似文献   

10.
决策树分类算法在数据挖掘领域是一种高效且应用普遍的分类算法。传统的决策树算法难以处理数据中存在的模糊性等不确定性信息,模糊决策树作为经典决策树在模糊集理论上的扩展,可有效克服这一缺陷。然而,现有的模糊决策树算法在处理具有层次结构的标签数据时,一般选取层次结构的某一层标签去分类数据,导致当分类准确率高时,标签不具体;标签具体时,分类准确率低,无法有效做到在分类准确率尽可能高的情况下,层次标签也尽可能具体。提出了一种基于层次标签数据的模糊决策树构造算法来解决以上问题,结合模糊ID3算法和层次信息增益思想对数据进行分类,并在构建过程中充分考虑了标签的层次。最后通过实验与传统模糊决策树算法对比,说明了所提算法的有效性。  相似文献   

11.
一种基于粗糙集的决策树构造方法   总被引:2,自引:1,他引:2  
决策树是一种有效的数据分类方法。传统的决策树方法是通过信息熵的计算去生成决策树的节点,计算量大。基于粗糙集理论,利用近似精度的概念来进行属性选择,构造决策树,有效地提高了效率并降低了决策树的复杂度。  相似文献   

12.
决策树是分类的常用方法.文章针对一个局域网上模拟的入侵检测问题,描述了对利用决策树方法学习的一种优化实现.并且对怎样处理缺失数据、连续属性的离散化、怎样剪枝以及分类法的准确率评估及提高等关键技术进行了研究.实验证明,该方法可为入侵检测系统生成有效的决策树.  相似文献   

13.
分类是把数据项映射到其中一个事先定义的类中的这样一个学习函数的过程.文章介绍分类数据挖掘的定义、分类的过程以及算法的分类,论述数据分类的常用技术,对分类的应用和分类算法的发展方向进行了展望.  相似文献   

14.
决策树在数据挖掘中的应用研究   总被引:5,自引:1,他引:5  
本文介绍了基于决策树的分类方法、基于决策树的知识发现的一般概念及决策树在数据挖掘中的应用。重点介绍了基于ID3算法的决策树生成方法,分析其用于数据分类和知识发现的过程及特点。  相似文献   

15.
CRUISE 2D决策树分类算法作为一种数据挖掘和知识发现的监督分类方法,综合了FACT,CART,QUEST决策树分类的思想.通过单因子和双因子交互检验和引导校正,快速有效地降低分割变量选择时产生的偏差,提高树的可读性,建立简单、高效、准确的决策树模型.基于CRUISE 2D决策树方法,以藏南地区为研究区,综合利用TM影像6个波段、NDVI,NDWI,SBI,GVI等波段信息,基于相同的训练样本和检验样本,利用判别规则建立决策树对影像进行分类;并将其与传统的监督分类方法 QUEST,SVM相比较,CRUISE 2D决策树分类方法总精度94.09%,比QUEST,SVM分类分别高10.86%,10.24%;Kappa系数0.931 0,比QUEST,SVM分类分别高出0.126 8,0.119 6.结果表明:CRUISE 2D能有效的改善传统监督分类中的错分漏分现象,在遥感分类上具有很高的稳健性和鲁棒性.  相似文献   

16.
利用新用户使用音乐时的上下文环境信息来解决冷启动问题.当用户播放音乐时,提取用户当时场景的时间、天气、状态等信息,利用这些信息构建决策树分类模型.当新用户使用音乐推荐系统时,提取当前情景的上下文信息,根据决策树分支和上下文信息判断新用户的兴趣,向新用户推荐音乐.实验结果表明,当采用上下文相关音乐推荐算法,推荐数目不超过6项时,新用户对推荐结果的满意度超过TopN算法.  相似文献   

17.
以东莞市2008年的ALOS影像为数据源,通过目视判读选取8类目标地物,并采用最大似然法进行土地利用分类,发现分类精度不高(80%).其主要原因是ALOS数据的有效波段较少,且研究区植被、水体密布,多类目标地物难以区分.针对该问题,结合东莞市的地形地貌特点,引入植被指数NDVI、水体指数NDWI和DEM数据,利用决策树方法进行土地利用分类,使分类精度有较大提高(90%),可有效地解决了因ALOS数据有效波段数较少而产生的分类精度低的问题.本研究表明,在我国南方亚热带地区基于植被指数、水体指数和DEM的改进型决策树分类是一种非常好的ALOS数据土地利用分类方法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号