首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
基于粗集理论的数据离散化技术研究   总被引:3,自引:0,他引:3  
信息系统连续型属性值的离散化对决策规则或决策树的学习具有非常重要的意义。它能够提高系统对样本的聚类能力,增强系统抗数据噪音的能力,减少机器学习算法的时间和空间开销,提高其学习精度。粗集是有效的数据离散化工具。对基于粗集理论的数据离散化方法进行了深入研究,分析其特征,评述其研究进展,并通过仿真实验研究了几种典型的启发式离散化算法的性能。其结果对发展新的离散化技术或为特定应用选择合适算法都有参考价值。  相似文献   

2.
基于粗集理论的数据离散化技术研究   总被引:2,自引:0,他引:2  
信息系统连续型属性值的离散化对决策规则或决策树的学习具有非常重要的意义,它能够提高系统对样本的聚类能力,增强系统抗数据噪音的能力,减少机器学习算法的时间和空间开销,提高其学习精度。粗集是有效的数据离散化工具。对基于粗集理论的数据离散化方法进行了深入研究,分析其特征,评述其研究进展,并通过仿真实验研究了几种典型的启发式离散化算法的性能。其结果对发展新的离散化技术或为特定应用选择合适算法都有参考价值。  相似文献   

3.
基于粗集理论的数据挖掘应用   总被引:2,自引:0,他引:2  
论述了粗集的基本理论和特点,并对其在旋转机械故障诊断中的应用进行了探索,提出了粗集理论在旋转机械故障诊断中的数据挖掘方法,运用这一方法对故障诊断决策表进行属性约简,去除其中不必要的属性,揭示出旋转机械故障诊断条件属性中的冗余性,最后得出了属性约简的结果以及决策规则。  相似文献   

4.
5.
6.
讨论模糊C均值聚类算法在决策表条件属性对决策属性的相容程度的指导下对粗集理论中的连续属性进行离散化的一种新算法。该算法充分考虑属性之间的相关性,将所有连续属性转化为矩阵同时处理,能明显提高传统动态层次聚类算法离散化过程的速度。算法测试结果表明,新算法能较好地保留有效属性,提高离散化精度。  相似文献   

7.
连续属性离散化是数据挖掘的重要预处理步骤,直接关系到挖掘或学习的效果,对于降低算法的实际空间要求和时间消耗、提高后续算法的运行速度具有极其重要的意义。在分析贪心算法的特点和基本思路的基础上,提出了一种新的以属性重要性辅助判断断点重要性的离散化算法,经实例验证,该离散化算法所获得的结果与现场技术人员依据经验所得结论一致。该算法的研究成果为后续的属性约简及数学模型的建立提供了重要的理论依据。  相似文献   

8.
讨论模糊C均值聚类算法在决策表条件属性对决策属性的相容程度的指导下对粗集理论中的连续属性进行离散化的一种新算法.该算法充分考虑属性之间的相关性,将所有连续属性转化为矩阵同时处理,能明显提高传统动态层次聚类算法离散化过程的速度.算法测试结果表明,新算法能较好地保留有效属性,提高离散化精度.  相似文献   

9.
讨论模糊C均值聚类算法在决策表条件属性对决策属性的相容程度的指导下对粗集理论中的连续属性进行离散化的一种新算法。该算法充分考虑属性之间的相关性,将所有连续属性转化为矩阵同时处理,能明显提高传统动态层次聚类算法离散化过程的速度。算法测试结果表明,新算法能较好地保留有效属性,提高离散化精度。  相似文献   

10.
粗集理论在数据处理中的研究与应用   总被引:6,自引:0,他引:6  
论述了粗集方法性质及特点,提出了粗集方法在数据处理中的应用模型,同时给出了应用这一模型对一个数据库实例进行数据处理的过程。另外,从精确性、鲁棒性等方面对数据处理中的粗集方法的适用范围进行了分析。  相似文献   

11.
基于Rough Set理论中的不可分辨性原理,给出两个新的定义属性的最大区分值(Maximum Dis-cernibility Value,MDV)和属性冗余度(Attribute Redundancy Rate,ARR)。在数据预处理阶段,属性的MDV数值用于确定关于自组织映射网络SOM输出单元数量的启发式搜索策略;属性冗余度则用于衡量属性约简结果的信息冗余程度,并以此作为优化SOM网络输出层结构的依据。不依赖于领域经验知识,建立了MDV、SOM、ARR的组合算法模型,实现了Rough Set理论中连续属性的自动离散化计算,并明显提高了属性约简的速度。最后,通过项目实例对全过程进行有效验证。  相似文献   

12.
一种基于粗糙集理论的连续属性离散化方法   总被引:14,自引:0,他引:14  
基于粗糙集的有关理论,提出了一种新的连续属性离散化方法·首先说明决策属性支持度的概念,再利用决策属性支持度作为反馈信息,提出一种领域独立的基于决策属性支持度的连续属性离散化算法·该算法能在保证决策表原始分类能力不变的前提下,提高约简效率·同时,各个属性拥有较少的分割区间,会使规则集合更加简洁·通过实例分析比较,说明该算法是非常有效的·  相似文献   

13.
离散化方法在基于粗糙集焊接建模中的比较   总被引:1,自引:0,他引:1  
粗糙集建模方法是一种新的且重要的焊接过程建模方法,离散化是粗糙集建模方法中一个必要且重要的步骤.针对已有离散化方法众多、难以取舍的特点,讨论并确立了焊接建模过程中离散化方法的选择标准.以低碳钢的脉冲钨极氩弧焊为背景,针对相同的建模数据,采用除离散化外相同的粗糙集建模步骤,并以十折交叉确认法为验证方法,对比不同离散化方法对焊接粗糙集模型的预测能力的影响.实验表明,基于熵的离散化方法更加适合焊接过程的粗糙集建模.最后,探讨了基于熵的离散化方法的参数选择.  相似文献   

14.
提出和探讨了一种新的基于模糊粗糙集和断点简约化的离散化方法.综合考虑到规则的支持度和可信度及其关系,应用属性离散指标作为离散化的标准,证明了该指标可以作为离散化彻底的充分条件.并且在时间复杂度和空间复杂度方面分析了算法的有效性,与同类算法比较可以发现该算法在基本不损失分类信息的基础上有效降低这两方面的复杂度,能有效地避免以往各种算法中出现的弊端.最后将其应用于电网故障诊断中,通过具体算例测试,证明该算法的有效性和实用性.  相似文献   

15.
基于启发式信息熵的粗集数值属性离散化算法   总被引:1,自引:0,他引:1  
在一致性假设前提下,以数据集的统计性质作为启发式知识,从候选离散点集中选择离散点,根据数据集的期望值和方差来确定搜索最优离散点的区域,提出一种新的基于信息熵粗集数值属性离散化算法,并采用UCI国际标准数据集来验证新算法.新算法与已报道的算法所得到的离散断点集完全一致,决策表的离散化结果也相同,但时间代价不同,新算法比其计算效率提高40%~50%.  相似文献   

16.
为了解决目前航材订货模型单纯依托人为经验,对航材消耗规律变化反应滞后且可信度不高工作量过大的问题,提出在原始订货模型的框架下,使用PAM聚类、粗糙集全局离散和粒子群算法,计算模型中的航材分类、属性离散和区间权重,从而建立启发式航材订货模型,并在测试集上对比新老模型的均方离差。结果表明,启发式航材订货模型可以使人摆脱依靠经验确定模型的繁琐工作,并且能有效提高模型的准确性和及时性,从而提高航材订货工作效率。  相似文献   

17.
探讨数据挖掘过程中,数据预处理应用粗糙集理论进行属性和属性值约简的方法以及用计算机实现约简的算法.通过对医疗数据的预处理表明,利用粗糙集理论来进行数据预处理是一种十分有效的精简、求最小决策算法的有效方法.  相似文献   

18.
粗糙集理论应用中的离散化方法综述   总被引:8,自引:0,他引:8  
粗糙集理论是一种有效处理不确定、不精确、不完备信息的数学工具。但是传统的粗糙集理论只能对数据库中的离散属性进行处理,而绝大多数现实的数据库既包含了离散属性,又包含了连续属性。针对粗糙集理论的这些缺陷,综述了几种比较常用的离散化算法,并在此基础上,引申出一些启发式离散算法。最后指出,现有的离散化算法都会或多或少地损失部分信息,目前还没有确定的评判准则评论哪一种方法更好、更合适;离散化方法的一个有效思想就是“最低限度地减少信息丢失、保持数据分类能力和使最终得到的离散化最小(分类器最小)”的原则。  相似文献   

19.
基于信息熵的Rough集粗糙性度量新方法   总被引:1,自引:0,他引:1  
基于等价关系和一般二元关系,通过引入Rough集边界熵概念,利用Rough集边界的知识粗糙性和Rough集本身的粗糙度来刻画Rough集粗糙性,为Rough集粗糙性提供了一种更为合理的度量方法,为Rough集中概念的获取和刻画提供了理论依据.  相似文献   

20.
粗糙集理论中新的知识发现方法   总被引:1,自引:0,他引:1  
与现有的基于属性简约的知识发现方法不同 ,本文基于粗糙集合理论定义了 2类新的知识发现 ,即 1、2类知识发现 ( FCKD,SCKD) ,目的是在知识系统动态变化后 ,通过减小知识的粗糙度 ,发现原规则中没有的、有决定性作用的新属性。在此意义下改变规则中属性结构 ,并发现新的规则。定义了两个用于发现新属性的算子 ,并给出两个定理 ,一个推论及其证明 ,最后通过实例 ,对提出的方法作了说明。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号