首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 235 毫秒
1.
基于粗集的混合变量决策树构造算法研究   总被引:2,自引:1,他引:1  
文章提出混合变量决策树结构,并在此基础上提出基于粗集理论的混合变量决策树构造算法RSH2,算法在每个结点选择尽可能少的属性明确划分尽可能多的实例,减小了决策树规模,且易于理解。将RSH2算法与ID3算法及基于粗集的单变量决策树算法HACRs进行实验比较,结果表明该算法有良好性能。  相似文献   

2.
传统的决策树方法在实际应用中存在很多不足,如生成树规模过大,抗噪性较差等,因此,提出了将变精度粗糙集和混合变量集算法应用于决策树分类中,通过变精度和混合属性集分类减小树的规模和过度拟合问题,降低了噪声数据对属性选择的影响,并通过实验证明该算法与传统的算法相比具有较大的优越性。  相似文献   

3.
基于粗集论中属性依赖度的ID3改进算法   总被引:3,自引:0,他引:3  
决策树算法是一种重要的数据挖掘方法,ID3算法是最具影响的一种决策树生成算法。介绍了粗集理论的相关概念和传统的ID3算法基本原理,提出了一种以粗集论中的属性依赖度为基础的ID3改进算法,克服了传统ID3算法对取值较多属性的依赖,并通过实例验证该算法的高效性和精确性。改进算法对不同领域中分类预测方向上的数据挖掘均具有一定的参考价值。  相似文献   

4.
测试属性的选取即属性选择标准是构建决策树的关键及核心,对于同样的数据集,不同的属性选取标准构建的决策树有可能差别很大。对于不知采用何种属性选择标准或者没有一种标准适合所处理的数据集,本文提出了一种解决的方法,即多种属性选取标准多数表决优化决策树算法,该算法利用"专家会诊"的思想,构建决策树,具有更广的适应性和更可能高的准确率。  相似文献   

5.
提出一种基于粗糙集理论的决策树分类算法.首先,将核属性集中的核属性进行合取后加入析取变换,实现属性约简;其次,在决策树构造阶段,对各条件属性分别求其上下近似集,进而得到各属性的近似精度.选择近似精度最大的属性作为决策树的根结点,以此方法递归应用到各子树上来选择决策树的结点并实现决策树的剪枝.实例分析表明,改进的算法提高了决策树方法的效率.  相似文献   

6.
粗糙集数据分析的计算方法   总被引:4,自引:3,他引:4  
粗糙集理论是用来分析模糊或不确定性数据集的较新的数学工具 ,根据粗集理论的基本概念 ,系统地给出了一套计算方法 ,并根据属性的重要性为求解属性的最小或次小相对约简设计了一种新的启发式算法 ,文章还给出了任意属性集的全部约简个数的最大值 ,为简化求解全部约简过程提供了帮助。  相似文献   

7.
应用分类贡献函数的决策树构造方法   总被引:1,自引:0,他引:1  
在构造决策树的过程中,分类属性选择的标准直接影响分类的效果。本文基于粗糙集的理论,提出了在核中应用分类贡献函数来选择分类属性的新方法。利用UCI提供的数据集对该算法和基于信息熵的算法C4.5,以及基于加权平均粗糙度的决策树生成算法相比较。实验证明:用该方法构造的决策树与传统的基于信息熵方法构造的决策树相比较,复杂性低,且能有效提高分类效果。  相似文献   

8.
针对绝大部分多变量决策树只能联合数值型属性,而不能直接为带有分类型属性数据集进行分类的问题,提出一种可联合多种类型属性的多变量决策树算法(CMDT).该算法通过统计各个分类型属性的属性值在各个类别或各个簇中的频率分布,来定义样本集合在分类型属性上的中心,以及样本到中心的距离.然后,使用加权k-means算法划分决策树中的非终端结点.使用这种结点划分方法构建的决策树可用于数值型数据、分类型数据以及混合型数据.实验结果表明,该算法建立的分类模型在各种类型的数据集上均获得比经典决策树算法更好的泛化正确率和更简洁的树结构.  相似文献   

9.
决策树分类是数据挖掘中的一种重要方法。探讨了决策树算法的基本思想和常用算法,并将决策树挖掘技术应用于大学生心理健康数据,分析挖掘影响大学生心理健康的因素。文章选择C5.0算法,通过Clementine12.0进行决策树挖掘模型的构建,建立数据流,通过不断测试分析,发现影响大学生心理健康主要症状是强迫症。以强迫症为分类目标查看模型,可以了解到焦虑症和人际关系也起到很大的影响作用。将目标属性分别设置为焦虑_程度和人际关系_程度,输出变量设为剩余的9个因子变量,执行数据流挖掘出导致强迫症的主要原因,为指导心理健康的工作人员提供参考。  相似文献   

10.
文章提出了一种基于属性重要度的多变量决策树的构造算法。基本思想是将等价关系相对泛化的概念用于多变量检验的构造,在单变量结点的构造时,算法倾向选择属性重要度最大的条件属性作为检验属性。实验表明,该算法具有良好的性能,不仅有效降低了树的高度,而且还兼顾了分类的可读性,是效率较高的决策树生成方法。  相似文献   

11.
基于粗糙集理论的决策树构造算法   总被引:3,自引:0,他引:3  
应用粗糙集理论,提出了一种利用新的启发式函数构造决策树的方法。该方法以属性重要性评价指标作为信息熵函数,对务件属性进行选择,充分考虑了属性间的依赖性和冗余性,弥补了ID3算法对属性间依赖性强调不够的缺点,解决了决策树中子树的重复和有些属性在同一决策树上被多次选择的问题,该方法还能对不相容决策表进行正确分类。实例表明该方法是正确有效的,而且明显优于传统的决策树构造方法。  相似文献   

12.
基于知识粗糙度的多变量决策树的构建   总被引:5,自引:0,他引:5       下载免费PDF全文
提出了一种基于粗糙集中知识粗糙度的构建多变量决策树的算法.基本思想是,在选择了核属性作为决策树的根节点后,将选择知识粗糙度最小的那个条件属性作为下一个分枝结点的检验属性.  相似文献   

13.
在粗糙集理论与神经网络结合的故障诊断方法中,当故障诊断系统中条件属性的个数较多时,可采用一种先分块建立决策表再约简的方法。笔者对该方法的可行性和算法的时间复杂度进行了分析,结果证明,分块建立决策表是可行的,可以降低约简的复杂度,从而缩短约简工作的时间。  相似文献   

14.
基于粗糙集的RDT决策树生成算法的研究及应用   总被引:1,自引:0,他引:1  
介绍了一种基于粗糙集理论的决策树生成算法--RDT(Rought Set Decision Tree).该方法运用了粗糙集理论中条件属性相对于决策属性的核,引入启发式条件计算并选择条件属性作为决策树的根结点或子结点.通过一个例子,与运用信息熵概念建立决策树的算法进行比较,结果表明采用RDT方法得到的决策树优于采用信息熵方法得到的决策树.还讨论了RDT与ID3算法对决策树精度和规模的影响,分析数据分类和知识发现的过程及特点.  相似文献   

15.
针对原始信息系统往往存在大量重复样本和冗余属性,从而影响实际故障诊断的精度和速度这一问题,介绍了一种基于粗糙集和决策树C4.5算法相融合的故障诊断模型,用于设备的精确和快速故障诊断.利用粗糙集具有较强的处理不确定和不完备信息的能力,对原始样本集进行离散化及约简处理;同时,利用决策树C4.5算法对约简后的决策表进行快速学习并形成树状故障分类器.以实例介绍了利用该模型进行故障诊断的完整过程.  相似文献   

16.
一种基于粗糙集的决策树构造方法   总被引:2,自引:1,他引:2  
决策树是一种有效的数据分类方法。传统的决策树方法是通过信息熵的计算去生成决策树的节点,计算量大。基于粗糙集理论,利用近似精度的概念来进行属性选择,构造决策树,有效地提高了效率并降低了决策树的复杂度。  相似文献   

17.
基于知识的层次分析法及其应用   总被引:4,自引:1,他引:3  
将层次分析模型中下层因素与支配它的上层因素分别视为条件属性和决策属性,借助粗糙集的约简和属性重要性理论,研究了融合粗糙集的层次分析法的指标体系的完善、指标权重的确定、判断矩阵的构造等问题,实现了层次分析法对领域知识的利用及粗糙集对层次结构问题的决策支持。将该方法应用于武器系统效能智能评价实践中,证明了该方法的可行性和有效性。  相似文献   

18.
介绍了粗糙集理论实现数据分类和规则推理的基本原理,并利用粗糙集理论中核及决策类覆盖的概念,提出了一个在数据集中发现没有冗余属性的最小归纳依赖关系,并简化带有不相容规则的决策系统的多层次数据挖掘算法,应用一实际的例子说明如何在数据库中发现分类规则.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号