首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 106 毫秒
1.
模糊ID3算法处理的对象是具有模糊条件属性和模糊决策属性的模糊决策表,它利用平均模糊分类熵作为启发式选择扩展属性,利用模糊置信度作为叶子结点的终止条件.当用模糊ID3算法处理连续值和离散值决策表时,需要对连续值或离散值条件属性进行模糊化.模糊化的关键是模糊测度的确定,但确定合适的模糊测度非常困难,而且模糊化会损失有用的信息.针对这些问题,基于粗糙模糊集技术,提出了一种模糊决策树归纳算法,称为粗糙模糊决策树(RFDT:Rough Fuzzy Decision Tree).RFDT可直接处理离散值模糊决策表,归纳模糊决策树,不需要模糊化的过程.和模糊ID3算法类似,RFDT也分为三步:(1)利用粗糙模糊依赖度作为启发式选择扩展属性;(2)用选择的扩展属性划分样例集合;(3)如果划分的样例集合满足终止条件,则算法终止;否则递归地重复步骤(1)和(2).提出的算法用Kosko模糊熵作为叶子结点的终止条件,并通过一个例子说明了模糊决策树的归纳过程.  相似文献   

2.
模糊决策树归纳算法及应用   总被引:3,自引:0,他引:3  
使用分类信息熵极小化启发式,对分类问题中属性值为模糊集时,提出了直接用隶属度作为连续值变元来产生决策树的算法,将该算法应用于大型旋转机械振动故障诊断的规则提取上,经实践检验,所提学习算法合理。  相似文献   

3.
焦树军  安志江 《科技信息》2011,(25):I0086-I0087
决策树归纳是归纳学习的一种。由于NP困难,寻找最优的决策树是不现实的,从而探索各种启发式算法去产生一个高精度的决策树变成了这类研究的焦点。考虑到支持向量机(SVM)的分类间隔与泛化能力的关系,可以使用SVM的最大间隔作为生成决策树的启发式信息,使得决策树有较强的泛化能力。本文针对实值型数据,提出了一种基于最大间隔的决策树归纳算法。实验结果表明了本文算法的有效性。  相似文献   

4.
在处理不确定问题中,生成模糊决策树是一种常用的方法.其算法主要包含2个步骤,一个是树的生成条件,主要是确定扩展属性的选择标准,并以此为核心得到生成模糊决策树的启发式算法.另一个则是树的终止条件,否则会造成树的过度拟合的情况.目前,典型的算法中通常利用粗糙模糊依赖度作为选择扩展属性的依据,但是这个依赖函数不具备单调性,从而导致算法有不收敛的可能,基于这个问题,给出了模糊度的定义,重新定义了模糊依赖度和模糊粗糙度,选择模糊依赖度最大的条件属性作为根结点;然后,使用模糊粗糙度作为叶子结点的终止条件;最后,通过实例说明了整个模糊决策树的归纳过程.  相似文献   

5.
决策树分类算法在数据挖掘领域是一种高效且应用普遍的分类算法。传统的决策树算法难以处理数据中存在的模糊性等不确定性信息,模糊决策树作为经典决策树在模糊集理论上的扩展,可有效克服这一缺陷。然而,现有的模糊决策树算法在处理具有层次结构的标签数据时,一般选取层次结构的某一层标签去分类数据,导致当分类准确率高时,标签不具体;标签具体时,分类准确率低,无法有效做到在分类准确率尽可能高的情况下,层次标签也尽可能具体。提出了一种基于层次标签数据的模糊决策树构造算法来解决以上问题,结合模糊ID3算法和层次信息增益思想对数据进行分类,并在构建过程中充分考虑了标签的层次。最后通过实验与传统模糊决策树算法对比,说明了所提算法的有效性。  相似文献   

6.
传统的模糊决策树虽然可以从模糊数据中抽取模糊分类规则,但只能获取节点的隶属度信息,无法得出样本数据对于节点的非隶属度和犹豫度信息,导致数据分类的准确率不高。针对此,基于毕达哥拉斯模糊集理论,提出了一种新的加权毕达哥拉斯模糊决策树算法(Weighted Pythagorean Fuzzy Decision Tree,WPFDT)。首先,通过改进的K-means聚类算法得到连续属性数据的聚类中心,并结合三角模糊数对连续数据进行模糊处理;其次,定义并计算每一个属性的加权毕达哥拉斯模糊熵,选择加权毕达哥拉斯模糊熵最小的属性作为决策树根节点,在根节点下递归选择模糊熵最小的属性作为分裂节点,同时通过阈值控制树的规模,得到从根节点到叶子节点路径的模糊规则以及模糊规则的隶属度、非隶属度以及犹豫度,并完成预测分类,直至生成WPFDT模型;最后,选取UCI上的3个医学数据集(Haberman、Breast Cancer、Parkinson)进行实验,在分类准确率和得出模糊规则的数量与3种传统决策树算法(模糊ID3算法、C4.5算法、CART算法)比较,实验结果表明:WPFDT在分类精度和树大小上都优于其他传统决策树算法,并且有较高的召回率和精确率。  相似文献   

7.
针对连续型决策表,利用模糊相容关系对样例聚类产生模糊决策表,运用宽松下近似概念定义属性重要度,利用函数弹性概念定义决策属性关于条件属性的敏感度,将其作为属性重要度的权重得到加权重要度,并以此为启发式信息提出了一种连续型决策表的属性约简方法.  相似文献   

8.
采用一种改进后的决策树归纳聚类算法和交互式CLTree(Clustering based on decision Trees)剪枝,对商业数据的某些问题实现了聚类挖掘。对交易数据的实际酸类分新表明,该方法不仅可以处理数值型属性,还可以处理枚举型属性。实验结果表明,该方法在处理很合类型数据时具有良好的挖掘效果。对商业数据聚类分新,可以得到合理的市场分段,预测顾客的购买行为。  相似文献   

9.
决策树与模糊决策树的比较   总被引:4,自引:0,他引:4  
对决策树与模糊决策树的异同进行了比较分析.模糊决策树是决策树在模糊环境下的一种推广 ,它作为一种知识表示形式更符合人类的思维.  相似文献   

10.
基于模糊聚类的决策树算法在教学质量评价中的应用   总被引:1,自引:0,他引:1  
以目前的高等学校教育为平台,就如何将数据挖掘技术与教学质量评价相结合的问题进行了研究.通过教学质量评价指标体系的有效挖掘,运用模糊聚类的决策树技术来解决目前教学质量评价中的不合理性,提出基于模糊聚类的决策树法的教学质量评价方法,使教学质量评价公平、公正、合理、高效.  相似文献   

11.
通过定义单边三角形模糊数空间上的一种全序关系,提出了属性取值为单边三角形模糊数的决策树学习算法.作为ID3算法在单边三角形模糊数意义下的推广,算法通过一种分割信息熵的极小化来选取扩展属性.通过非平稳割点的分析,减少了分割信息的计算次数,使算法的效率得到了提高.  相似文献   

12.
主体构建和学习环境(ABLE)是IBM开发的用于支持主体建模、构建多主体系统的框架.本文改进了ABLE的决策树算法,在其中计算属性的信息增益时加入一个模糊因子,使算法能更简单、有效地学习.在UCI数据集上的测试结果表明改进后的算法在不降低精度的前提下,可以生成更简洁的决策树,特别是处理复杂的数据时,可显著降低规则数目.  相似文献   

13.
模糊近似空间的上近似和下近似的计算解析式   总被引:1,自引:0,他引:1  
粗糙集的概念被推广到模糊近似空间上,给出了上近似、下近似的新定义,并获得上近似和下近似的计算解析式。  相似文献   

14.
传统的决策树方法在实际应用中存在很多不足,如生成树规模过大,抗噪性较差等,因此,提出了将变精度粗糙集和混合变量集算法应用于决策树分类中,通过变精度和混合属性集分类减小树的规模和过度拟合问题,降低了噪声数据对属性选择的影响,并通过实验证明该算法与传统的算法相比具有较大的优越性。  相似文献   

15.
ID3算法是决策树学习归纳和数据挖掘中的核心方法。针对ID3算法存在的多值偏向问题,该文提出了一种新的方法对ID3算法加以改进。首先建立属性的关联矩阵,然后通过计算属性的类方差选择分裂属性,结合实例说明了改进算法的基本思想。实验结果表明,改进后的算法能够构造更合理的决策树并能在一定程度上克服多值偏向。  相似文献   

16.
基于Rough集的决策树算法   总被引:1,自引:0,他引:1  
针对基于Rough集的经典分类算法值约简算法等不适合大数据集的问题,提出了基于Rough集的决策树算法。采用一个新的选择属性的测度——属性分类粗糙度作为选择属性的启发式,该测度较Rough中刻画属性相关性的测度正区域等更为全面地刻画了属性分类综合贡献能力,并且比信息增益和信息增益率的计算更为简单。采取了一种新的剪枝方法——预剪枝,即在选择属性计算前基于变精度正区域修正属性对数据的初始划分模式,以更有效地消除噪音数据对选择属性和生成叶节点的影响.采取了一种与决策树算法高度融合的简单有效的检测和处理不相容数据的方法,从而使算法对相容和不相容数据都能进行有效处理。对UCI机器学习数据库中几个数据集的挖掘结果表明,该算法生成的决策树较ID3算法小,与用信息增益率作为启发式的决策树算法生成的决策树规模相当。算法生成所有叶节点均满足给定最小置信度和支持度的决策树或分类规则,并易于利用数据库技术实现,适合大数据集。  相似文献   

17.
基于决策树的排序学习算法   总被引:1,自引:0,他引:1  
基于一个修改了的决策树的分裂规则,得到了具有直观解释的排序算法,并给出了相关理论证明.实验结果表明,该算法优于感知机类和序回归类算法.  相似文献   

18.
随着高校招生规模的不断扩大,高校教学管理工作越来越繁重,积累的相关数据也越来越多,如何有效的利用这些数据,分析影响学生培养的因素,完善学生培养方式,是高校发展的关键。结合高校的教学数据,采用数据挖掘技术,将当前的教学管理数据转化成可供使用的信息,通过对数据的分析,挖掘影响学生成绩的内在因素,为高校学生培养方式的完善提供理论指导,为教学改革提供决策依据。研究结果表明,要提高高校教育教学水平,在课程安排上要结合培养专业的需求情况进行分析指导,对考试题目进行优化,改进教学方法、教学评价,依据学生成绩数据分析,指导学生培养中的理论和实践课安排,确定合适、合理的学生培养方案。  相似文献   

19.
AdaBoost算法是一种将多个基学习器通过合理策略结合生成强学习器的集成算法,其性能取决于基学习器的准确率和多样性。但弱学习器分类精度不高往往也导致了最终强分类器性能较差,因此进一步为了提高算法的分类精确率,本文提出一种MDTAda模型,首先利用基尼指数迭代构造一棵不完全决策树,然后在决策树的非纯伪叶结点上添加简单分类器,生成MDT(模型决策树),将MDT作为AdaBoost算法的基分类器,加权平均生成强分类器。在标准数据集上的实验表明,相比传统的AdaBoost算法,本文提出的算法拥有更好的泛化性能和更优的间隔分布,且在与AdaBoost算法达到相同精度时所需迭代次数更少。  相似文献   

20.
将互信息引进模糊决策树,用于确定决策树的候选分类属性,进而构建模糊决策树.通过增量学习来修正决策树分类模型,以修正分类效果,并用实验验证了该方法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号