首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
分类是数据挖掘中重要的研究课题.决策树方法是一种常用的分类算法,所建立的树型结构模型很直观,易于理解.传统的分类方法在处理海量数据时会出现性能下降或精度降低的问题,经过改进的ID3算法,基于SPRINT,消除了内存的限制,运算速度快,具有可伸缩性,性能较好.  相似文献   

2.
根据数据属性间存在的线性相关和非线性相关影响决策树性能的特点,提出了一种用拟合回归建立决策树的算法,并利用这种相关性来提高分类能力.该算法选择了一个较优的属性子集,对此子集中的属性进行加权组合,用于构造决策树的节点,采用二次多项式来拟合两个属性间可能存在的相关性,从而构造出分类能力更强的决策树.研究中用UCI标准数据集对各种算法进行测试及比较,实验结果及分析表明此决策树算法具有良好性能.  相似文献   

3.
利用决策树发掘分类规则的算法研究   总被引:15,自引:4,他引:15  
主要介绍决策树方法,回顾利用决策树发掘分类规则的各种方法,并对算法进行评价,最后提出了一个利用决策树分类技术进行月降雨预报的算法。  相似文献   

4.
采用递归方法设计算法具有较高的开发效率和良好的可读性,但递归层次多到一定程度将耗尽系统内存资源,因此递归算法的实用性较差。通过分析递归算法的特性和实现机制,简要介绍了实现递归消解的几种方法,重点研究了搜索二叉树中最长路径的递归算法,给出C语言编写的利用堆栈结构和循环结构实现的非递归模拟算法,并给出递归消解前后算法的时间效率对比。  相似文献   

5.
针对绝大部分多变量决策树只能联合数值型属性,而不能直接为带有分类型属性数据集进行分类的问题,提出一种可联合多种类型属性的多变量决策树算法(CMDT).该算法通过统计各个分类型属性的属性值在各个类别或各个簇中的频率分布,来定义样本集合在分类型属性上的中心,以及样本到中心的距离.然后,使用加权k-means算法划分决策树中的非终端结点.使用这种结点划分方法构建的决策树可用于数值型数据、分类型数据以及混合型数据.实验结果表明,该算法建立的分类模型在各种类型的数据集上均获得比经典决策树算法更好的泛化正确率和更简洁的树结构.  相似文献   

6.
内存数据库查询优化   总被引:1,自引:0,他引:1  
基于一种广泛接受的内存数据库系统基本概念及内存数据库中的SB-树索引结构,提出了更方便关系代数操作的SB^*-树.在此基础上,提出了优化的关系代数操作的实现算法.根据这些算法和关系代数等价定理,给出了对关系代数查询树进行逻辑优化的规则,并证明了逻辑优化的正确性.最后给出了代价评估模型,实验表明提出的内存数据库查询优化算法相对于传统的优化算法具有更好的时间及空间性能.  相似文献   

7.
数据挖掘之决策树方法概述   总被引:12,自引:0,他引:12  
数据挖掘在科研和商业应用中正发挥着越来越重要的作用。分类器是数据挖掘的一种基本方法,决策树是一种最重要的分类器。本文介绍了分类器中的决策树方法及其优点,决策树表示法,决策树构造思想,并比较了各种重要的决策树算法。介绍了决策树算法的实现工具,决策树与数据仓库的结合,决策树的适用范围及应用,最后探讨了决策树的发展趋势。  相似文献   

8.
一种基于关联规则的缺省规则挖掘算法   总被引:2,自引:1,他引:2  
传统的基于Rough集的缺省规则挖掘算法须计算差别矩阵并生成大量的条件属性类,挖掘效率低.为此,本文引入相容关联规则和决策关联规则的概念,提出基于关联规则的缺省规则挖掘算法——DRMBAR,该算法借助FP-tree存储结构挖掘出决策关联规则,并用相容关联规则性质对决策关联规则进行有效修剪后生成相应的缺省规则,DRMBAR可有效地过滤噪声、提高缺省规则挖掘效率,且克服了传统算法依赖于主存的限制,为缺省规则的挖掘提供了一种新的框架。实验结果表明该算法是有效且可行的。  相似文献   

9.
在介绍了一些典型决策树分类算法的基础上,研究了一种基于相关性分析的决策树分类器。其主要思想是通过属性相关性来压缩训练集的大小并在建立决策树过程中采用此度量值来确定划分条件属性的顺序,通过阈值设定和处理简化了决策树的剪枝和优化过程,提高了处理的效率和规模。文章详细描述了算法的执行过程以及正确性证明和时间复杂性分析。  相似文献   

10.
集成学习通过将若干弱分类器集成以取得比单个弱分类器更好的性能,是机器学习的重要研究方向。针对常用城市地理模拟系统中元胞自动机转换规则获取算法的局限性,本文提出基于集成学习算法的元胞自动机,并将其应用于城市建设用地的动态模拟。以决策树作为弱分类器,应用集成学习算法和元胞自动机,对东莞市2001年到2005年的建设用地时空格局进行了模拟,取得了较好的模拟效果。精度评估结果表明,经集成学习后的决策树比单个决策树对城市建设用地动态的模拟精度更高,算法泛化能力更好。  相似文献   

11.
本文给出了一类树问题的快速并行算法.这些问题包括:求树中任意两顶点之间的路径和路径长度、求所有顶点的深度等.以这些基本算法为基础,给出了求树中任意两个顶点的最小公共祖先问题、边修改动态最小生成树问题和树同构问题的并行算法.本文使用的模型是单指令流多数据流共享存贮器并行计算机,允许多个处理机同时读存贮器的一个单元的内容但不允许同时写,称这种模型为CREW PRAM.对n个顶点的树,以上算法均使用O(n)个处理机,时间复杂度为O(logn).按Cook的定义,证明了以上问题都属于NC类.  相似文献   

12.
为了将传统的决策树无法管理的、由各种分类算法所发现的大量的有意义的规则进行有效的存储、剪裁和使用 ,提出了广义决策树结构。它将传统决策树的结构进行扩展 ,能够以较少的存储代价管理所发现的所有分类规则 ,且易于表达规则之间的关系。提出了有效的优化策略。以此树为基础 ,将决策树分类算法与基于关联规则的分类算法进行了概括统一 ,并提出了相应的算法。实验结果证明 ,广义决策树克服了传统决策树的缺点 ,并且适宜于维护、剪裁以及快速搜索大量的分类规则  相似文献   

13.
中序遍历二叉树的算法实现   总被引:2,自引:0,他引:2  
马相芬 《科技信息》2008,(12):227-227
本文对二叉树的遍历过程进行了深入的分析,并给出了中序遍历二叉树的递归算法和非递归算法。对递归算法中的工作栈的执行过程做了分析;对非递归算法中的重点和难点做了深刻探讨。  相似文献   

14.
二叉树先序遍历的非递归算法讨论   总被引:3,自引:0,他引:3  
在传统的二叉树递归算法的基础上,讨论了两种非递归算法,一种是较常见的算法,但这种算法有重复的操作,因而笔者做了修改,形成了第二种算法,并在时间复杂度和空间复杂度方面对这两种算法的优劣进行了探讨。  相似文献   

15.
数据集中对象之间的顺序与对象属性的顺序之间相关性往往是隐含的,分析挖掘这种潜在相关性进而用规则(序规则)表示是十分重要的.该文介绍了一个序规则挖掘系统的设计与实现,主要介绍了系统的数据预处理部分,序规则挖掘与生成算法部分特别是有序决策树(ODT)算法.  相似文献   

16.
Introduction In a band-limited digital communication system such as for satellite communications, the transmitted digital symbols will be distorted by the equivalent base-band linear finite impulse response channel, which intro- duces intersymbol interfer…  相似文献   

17.
信息理论框架下的神经网络构建   总被引:1,自引:0,他引:1  
神经网络模型的构建方法是神经网络研究的重点和难点,传统的构建方法建立在实验和重复学习的基础上,本文提出了一种信息理论框架下的神经网络构建方法基于熵的神经网络(EBNN).EBNN借助于前馈网络与决策树的等价性,采用熵做为神经网络构造的准则,利用决策树的构造思想和方法,建立了一种系统的神经网络构造方法.实验表明EBNN方法学习速度比传统BP网络快,但又不降低神经网络性能.  相似文献   

18.
后序遍历二叉树的递归和非递归算法   总被引:4,自引:1,他引:3  
本文论述了后序遍历二叉树的递归算法和非递归算法。对递归算法中的工作栈的执行过程做了分析;对非递归算法中的重点和难点做了深刻探讨,并给出了相应算法。  相似文献   

19.
<正>In many decision making tasks,the features and decision are ordinal.Several ordinal classification learning algorithms have been developed in recent years,it is shown that these algorithms are sensitive to noisy samples and do not work in real-world applications.In this work,we propose a new measure of feature quality, called rank mutual information.Then,we design an ordinal decision tree(REOT) construction technique based on rank mutual information.The theoretic and experimental analysis shows that the proposed algorithm is effective.  相似文献   

20.
为弥补路面施工过程中传统沥青混合料油石比检测方法耗时长、预测精度低、对环境及人身健康有危害等缺陷,利用CT扫描及图像处理技术得到的沥青混合料内部截面空隙与集料特征,提出了一种基于随机森林算法的沥青混合料油石比检测模型,并与多元线性回归算法、决策树算法、梯度提升树算法的预测结果进行对比。研究结果表明:CT扫描和图像处理技术对沥青混合料空隙和集料的识别效果良好;通过比较分析不同算法的平均绝对误差、均方根误差、平均绝对百分比误差和负相关系数,证明采用随机森林算法的沥青混合料油石比检测模型的准确性能够满足工程应用要求,且优于其他3类算法模型,相比于传统检测方法更加简便、快捷。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号