共查询到20条相似文献,搜索用时 15 毫秒
1.
基于粗糙集理论的决策树构造算法 总被引:3,自引:0,他引:3
应用粗糙集理论,提出了一种利用新的启发式函数构造决策树的方法。该方法以属性重要性评价指标作为信息熵函数,对务件属性进行选择,充分考虑了属性间的依赖性和冗余性,弥补了ID3算法对属性间依赖性强调不够的缺点,解决了决策树中子树的重复和有些属性在同一决策树上被多次选择的问题,该方法还能对不相容决策表进行正确分类。实例表明该方法是正确有效的,而且明显优于传统的决策树构造方法。 相似文献
2.
提出一种基于粗糙集理论的决策树分类算法.首先,将核属性集中的核属性进行合取后加入析取变换,实现属性约简;其次,在决策树构造阶段,对各条件属性分别求其上下近似集,进而得到各属性的近似精度.选择近似精度最大的属性作为决策树的根结点,以此方法递归应用到各子树上来选择决策树的结点并实现决策树的剪枝.实例分析表明,改进的算法提高了决策树方法的效率. 相似文献
3.
基于粗糙集和决策树的数据挖掘方法 总被引:9,自引:1,他引:9
从粗糙集和决策树两种方法具有的优势互补性出发,提出了一种基于粗糙集和决策树相结合的数据挖掘新方法·以胶合板缺陷检测数据分析为应用对象,利用粗糙集理论对胶合板数据库中的特征信息进行缺陷识别·利用谱系聚类重心距离法对数据进行离散化处理,采用粗糙集进行属性约简,得到低维样本数据,最后用决策树方法产生决策规则·实验证明,这种数据挖掘方法保留了原始数据的内部特点,加快了获取知识的进程,提高了模型的分类准确率,增强了规则的可解释性,取得了满意的研究结果· 相似文献
4.
粗糙集和决策树都属于归纳学习方法,都可以从一个离散值决策表中抽取出规则.本文从算法过程、计算复杂性、规则个数、泛化能力、稳健性几个方面对粗糙集和决策树进行了比较研究,得出了一些重要结论,能为相关研究提供一些有价值的参考. 相似文献
5.
基于相似依赖度的属性加权决策树算法 总被引:1,自引:1,他引:1
粗糙集分析方法利用数据本身提供的信息,不需要任何先验知识即可对已有的知识进行处理,在保留关键信息的前提下,对数据进行简化并求得属性组合。在此基础上提出了一种基于相似依赖度的属性选择算法,从约简出的属性组合中选择与决策属性最为相似的核集,根据属性的相似依赖度作为决策树的加权值,从而建立决策树。通过对影响学生成绩因素的数据进行分析表明,所提出的算法是易于实施的,而且形成的决策树的准确率也有了一定的提高。 相似文献
6.
7.
基于粗糙集理论的复方拆方研究 总被引:2,自引:0,他引:2
粗糙集理论是一种新的处理模糊和不确定性知识的数学工具,其主要思想就是在保持分类能力不变的前提下,通过知识约简,导出问题的决策和分类规则.因此,将粗糙集理论引入复方拆方,将有助于从复方配伍的动态性和不确定性的本质上去深入而确切地开展方剂配伍规律的量化研究,从而改变药味与药效之间的分离状态. 相似文献
8.
基于粗糙集属性约简的模糊模式识别 总被引:3,自引:1,他引:3
通过运用粗糙集归约理论对资料进行浓缩和筛选,略去不必要的属性,简化数据。用模糊模式识别确定对象应当归属的模式,给出其对于各个模式的相对隶属度,从而达到分类目的。经实例计算,得到了较好的结果。 相似文献
9.
一种基于粗糙集的决策树构造方法 总被引:2,自引:1,他引:2
决策树是一种有效的数据分类方法。传统的决策树方法是通过信息熵的计算去生成决策树的节点,计算量大。基于粗糙集理论,利用近似精度的概念来进行属性选择,构造决策树,有效地提高了效率并降低了决策树的复杂度。 相似文献
10.
11.
本文研究了粗糙集理论在数据挖掘中的应用,提出了一种基于粗糙集理论的数据挖掘算法。首先对信息系统的数据加工泛化,构造其二进制可辨矩阵。对矩阵进行化简得到属性约简并生成规则。最后,结合银行申请信用卡的实例利用上述方法进行数据挖掘,消去冗余属性,抽取决策规则。 相似文献
12.
粗糙集的应用中,对象集通常具有数量大、属性多、单一属性分类大的特点,这是在已有知识基础上提出规则时所遇到的3个主要问题,针对其中单一属性分类的约简问题提出了一种新的方法,它采用了先合并分解再综合的思想简化问题的求解,能快速有效地发掘信息中蕴涵的规则。 相似文献
13.
传统的决策树方法在实际应用中存在很多不足,如生成树规模过大,抗噪性较差等,因此,提出了将变精度粗糙集和混合变量集算法应用于决策树分类中,通过变精度和混合属性集分类减小树的规模和过度拟合问题,降低了噪声数据对属性选择的影响,并通过实验证明该算法与传统的算法相比具有较大的优越性。 相似文献
14.
粗糙集理论为研究不精确数据的分析、推理,挖掘数据间的关系、发现潜在的知识提供了有效的工具。在数据挖掘技术中KNN算法是一个实现简单和分类准确性较高的方法,但是,当用于样本容量较大以及特征属性较多的类似医疗图像挖掘这样的领域时,其效率受到了很大的影响,找到一个删除最大冗余属性的方法成了解决这个问题的关键。将粗糙集理论与KNN算法结合起来,用粗糙集方法进行属性约简,有效地解决了KNN算法分类的这个缺点。 相似文献
15.
沈晨鸣 《南京工程学院学报(自然科学版)》2007,5(1):30-34
粗糙集理论是一种研究不完整、不确定知识处理的数学工具,属性约简是粗糙集理论的核心内容之一.阐述了粗糙集理论的基本思想,给出了一种启发式的最小约简算法,通过一个实例,分析说明算法的可行性和有效性. 相似文献
16.
17.
一种基于条件熵的粗糙集属性约简算法 总被引:1,自引:0,他引:1
粗糙集(Rough set)理论是一个新的数据挖掘方法,其主要思想是保持分类能力不变的情况下,通过属性约简,达到发掘知识并简化知识的目的。本文在理解和分析基于粗糙集理论的数据挖掘算法基础上针对属性约简提出了一个基于条件熵的启发式算法。 相似文献
18.
基于克隆选择的粗糙集属性约简方法 总被引:6,自引:1,他引:6
基于免疫克隆选择的原理,提出了一种新的粗糙集属性约简方法,将属性集合的分类近似质量作为进化目标,利用免疫反应的分布性特点通过局部并行搜索实现全局优化,并采用抗体更新和亲和力抑制手段来维持群体的多样性,保证了各抗体局部优化解的稳定性,从而获得了多个优化约简集合,通过机械故障诊断数据的实例应用,表明该方法可以获得多个符合分类质量要求的属性约简集合,因此满足了设备故障诊断的特征优化选择要求。 相似文献
19.
属性约简是粗糙集理论中的核心问题,如何能够快速且有效删除其中不相关的或不重要的属性是当前所迫切需要的研究。针对这一需要,本文提出一种基于基因表达式编程的属性约简算法,该方法具有较快的收敛速度和不易陷入局部最优的优点。实验表明,这一方法能够快速有效地求出最小约简。 相似文献
20.
基于粗糙集理论的一种数据约简算法 总被引:1,自引:0,他引:1
Roughsets理论被广泛运用于不确定环境下的信息处理 .基于粗糙集理论的数据约简算法正日益受到计算机科学家和数学家的重视 .笔者探讨了一种生成对称矩阵的约简算法 ,与传统算法相比 ,该方法更易于在计算机上实现 相似文献