首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
在介绍数据挖掘、分类算法有关概念的基础上,介绍了决策树的具体生成算法.为了减少数据量,改进决策树算法实现时的数据结构,详细描述了基于SPRINT(scalable paraUehzable induction of decision trees)分类算法的实现,给出了SPRINT算法的性能评估。  相似文献   

2.
决策树分类是有指导的学习分类过程,首先建立一个模型,其次是利用模型进行分类,即利用生成的决策树对输入数据进行分类。决策树是通过计算信息熵选择分裂属性的,而信息熵正是该属性重要性的度量标量。  相似文献   

3.
在数据挖掘中分类是一个重要的研究方向,SPRINT算法是分类算法中很著名的算法。分析了SPRINT算法存在的不足和可以改进的地方。提出一种提高SPRINT算法建树速度的新方法。  相似文献   

4.
利用决策树发掘分类规则的算法研究   总被引:15,自引:4,他引:15  
主要介绍决策树方法,回顾利用决策树发掘分类规则的各种方法,并对算法进行评价,最后提出了一个利用决策树分类技术进行月降雨预报的算法。  相似文献   

5.
决策树分类算法及其应用   总被引:2,自引:0,他引:2  
分类算法是数据挖掘中的最重要的技术之一.本文对决策树数据挖掘方法进行分析和比较;并应用分类方法挖掘枣树嫁接成活率与各种外在因素之间的关系,证明了决策树算法在果树研究领域有着广阔的应用前景.  相似文献   

6.
李文静 《甘肃科技纵横》2007,36(3):14-14,43
分类是数据挖掘中一个重要的研究领域。常用的技术有决策树分类、贝叶斯分类、神经网络分类等。通过对当前具有代表性的分类算法原理进行分析、比较,总结出每种算法的性能特征。  相似文献   

7.
基于多关系的空间分类算法研究   总被引:1,自引:0,他引:1  
空间数据挖掘的应用领域很广,空间分类是空间数据挖掘中一项重要的任务,现有的空间分类算法都是基于传统的方法,在单表上进行的.本文提出了一种新的空间分类算法,基于多关系的方法创建决策树,并验证了算法的正确性及有效性.  相似文献   

8.
决策树方法是数据挖掘中一种重要的分类方法,决策树是一个类似流程图的树型结构,其中树的每个内部结点代表对一个属性的测试,其分支代表测试的结果,而树的每个叶结点代表一个类别。通过决策树模型对一条记录进行分类,就是通过按照模型中属性测试结果从根到叶找到一条路径,最后叶节点的属性值就是该记录的分类结果。  相似文献   

9.
一种基于概念层次的分类规则挖掘算法研究   总被引:6,自引:1,他引:6  
从概念层次的角度,提出了一种新的基本概念层次的分类规则挖掘算法,并阐述了相关概念及属性归纳技术与相关性分析方法,以城市人口与收入信息数据库和测试数据,给出了该算法的试验结果,研究结果表明,本算法生成的决策树大小适合,具有高的分类规则挖掘效率。  相似文献   

10.
分类是数据挖掘中重要的研究课题.决策树方法是一种常用的分类算法,所建立的树型结构模型很直观,易于理解.传统的分类方法在处理海量数据时会出现性能下降或精度降低的问题,经过改进的ID3算法,基于SPRINT,消除了内存的限制,运算速度快,具有可伸缩性,性能较好.  相似文献   

11.
关联规则应用最频繁的是在零售部门,尤其是超市。以某超市一天中的商品销售记录为例来说明关联规则的应用,从中发现客户的购买模式和消费习惯。决策树分类方法的应用中,对于汽车销售公司的客户定位进行了分析,区分了男性和女性的偏好。销售公司可以据此对客户进行具体定位,促进销售。  相似文献   

12.
陈燕  张振中 《科技信息》2007,(10):20-21
本文介绍了数据挖掘决策树算法的基本原理。并将决策树技术应用于肝癌病人预后的影响中。提出了一种预后影响的预测方法。通过20个样本数据,详细的介绍了建立决策树的步骤和方法。  相似文献   

13.
文章主要介绍在对公共事业管理绩效评价过程中,利用数据挖掘技术中的决策树方法从海量数据中抽象出概念数据,提高评价的信度和效度,节省评价时间的计量分析方法.  相似文献   

14.
给出了智能决策支持系统的概念,讨论了目前决策支持系统的不足,对数据仓库技术、联机分析处理技术及数据挖掘技术做了扼要论述,提出了一种基于数据仓库技术的智能决策支持系统结构,阐述了各部分的功能及关系.  相似文献   

15.
数据挖掘技术是人工智能领域研究的一个重要课题,已有很多成熟的方法。根据分类方法的基本思想,提出了一种最佳工艺探索算法。  相似文献   

16.
针对垃圾邮件文本数据高维、稀疏及词条相关等特点,提出Elastic Net-Decision Tree(EN-DT)两步分类算法。第一步,利用Elastic Net提取邮件文本特征变量,将高维文本数据降至低维。第二步,将所提取的低维特征变量输入到Decision Tree中进行邮件分类。根据分类评价指标对分类结果进行评价。利用Mark Hopkins等人收集的Spam邮件文本数据进行仿真,实验结果表明相比于PLS、PCA和Lasso等算法EN-DT分类性能更佳。  相似文献   

17.
基于.NET架构和数据仓库技术开发经理人决策支持平台,使用多层关联规则算法挖掘购物小票的频繁项集,发现顾客的购物模式,为超市货架陈列优化提供帮助。文章分析了决策支持平台的体系设计,多层关联规则挖掘模型的设计,最后进行频繁项集和规则的挖掘示例,并给出超市货架陈列的优化建议。  相似文献   

18.
本文首先介绍文本挖掘的定义及一般处理过程,重点探讨了文本分类与分类聚类等文本挖掘的关健技术。  相似文献   

19.
数据挖掘方法分析与评价   总被引:4,自引:1,他引:4  
文章首先介绍了数据挖掘的概念及其产生的背景;数据挖掘的基本方法的原理、特点、优缺点以及应用范围;并且概述了几种常用的数据挖掘方法,即分类和聚类分析。其次,列举了几种复杂类型数据挖掘方法,如空间数据库、多媒体数据库等,以及一些与社会生活息息相关密切相关的数据挖掘。最后,介绍了数据挖掘的发展趋势。  相似文献   

20.
本文提出了一种新的基于EP的分类算法,即基于基本显现模式的懒惰式贝叶斯分类算法(Lazy Bayesian Classification based on essential Emerging Patterns,LBCeEP),该算法使用懒惰式学习技术进行训练数据集的约简,并使用了一种特殊形式的更能有效地反映类标属性的EP,同时采用贝叶斯方法应用这种EP来进行分类.在UCI机器学习库中的14个数据集上的实验表明,本文所提出的算法具有更好的分类效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号