首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 187 毫秒
1.
讨论模糊C均值聚类算法在决策表条件属性对决策属性的相容程度的指导下对粗集理论中的连续属性进行离散化的一种新算法.该算法充分考虑属性之间的相关性,将所有连续属性转化为矩阵同时处理,能明显提高传统动态层次聚类算法离散化过程的速度.算法测试结果表明,新算法能较好地保留有效属性,提高离散化精度.  相似文献   

2.
提出一种基于连续属性离散化的知识分类方法.将条件属性按照重要度由高到低排序,并依照此排序将决策表中各条件属性依次离散化.在对决策表中条件属性的离散化过程中充分考虑已离散化的条件属性及决策属性,离散后的决策表不需要进一步约简.使用了模拟数据和UCI机器学习数据集中的数据进行算法测试,而且与其他离散化算法进行了对比,结果充分证明了新方法的有效性.  相似文献   

3.
讨论模糊C均值聚类算法在决策表条件属性对决策属性的相容程度的指导下对粗集理论中的连续属性进行离散化的一种新算法。该算法充分考虑属性之间的相关性,将所有连续属性转化为矩阵同时处理,能明显提高传统动态层次聚类算法离散化过程的速度。算法测试结果表明,新算法能较好地保留有效属性,提高离散化精度。  相似文献   

4.
讨论模糊C均值聚类算法在决策表条件属性对决策属性的相容程度的指导下对粗集理论中的连续属性进行离散化的一种新算法。该算法充分考虑属性之间的相关性,将所有连续属性转化为矩阵同时处理,能明显提高传统动态层次聚类算法离散化过程的速度。算法测试结果表明,新算法能较好地保留有效属性,提高离散化精度。  相似文献   

5.
连续型属性的离散化问题是机器学习中的关键问题,是一个NP难题.该文针对决策表,在NaiveScaler算法的基础上,给出了一种直观、有效和易于理解的离散化方法.该方法从整个属性空间的角度来考虑属性的离散化问题,可有效地保证决策表中原有分类结果的不变性.  相似文献   

6.
一种连续属性离散化的新算法   总被引:5,自引:0,他引:5  
连续属性的离散化问题是机器学习、数据挖掘等领域中重要研究课题之一,本文深入讨论连续属性离散的各种方法,提出一种基于RS理论和条件信息熵的决策表条件属性离散化算法,计算简单、易实现并以实例加以说明。  相似文献   

7.
基于粗糙集方法提出了一种系统的决策表约简和决策规则提取方法. 为了避免现有属性离散化方法的不足,使用多元统计中的聚类分析,并借助树形图,R2、半偏相关以及伪F统计量,对连续属性进行离散化处理,得到适合粗糙集方法要求的决策表. 在此基础上,简化了基于可辨识矩阵和逻辑运算的传统属性约简算法,并完善了启发式算法进行属性值约简和决策规则提取. 最后,以应用实例验证了该方法的可行性和有效性.  相似文献   

8.
应用经典粗糙集理论处理连续值属性决策表问题时,对连续值属性进行离散化会造成信息损失.本文在分析已有相似度不足的基础上提出一种改进的相似度,建立基于改进相似度的扩展粗糙集模型,并提出一种基于重要度的约简算法.  相似文献   

9.
一种基于粗糙集理论的连续属性离散化方法   总被引:14,自引:0,他引:14  
基于粗糙集的有关理论,提出了一种新的连续属性离散化方法·首先说明决策属性支持度的概念,再利用决策属性支持度作为反馈信息,提出一种领域独立的基于决策属性支持度的连续属性离散化算法·该算法能在保证决策表原始分类能力不变的前提下,提高约简效率·同时,各个属性拥有较少的分割区间,会使规则集合更加简洁·通过实例分析比较,说明该算法是非常有效的·  相似文献   

10.
在对典型的离散化方法分析的基础上,提出一种适用于粗糙集决策表的连续属性离散化处理的通用模型结构;对遗传算法的适应度线性尺度变换作改进,将模拟退火的思想引入遗传算法,提出基于遗传模拟退火算法(GASA)的数据离散化方法,并用UCI机器学习数据库中的Iris和Glass数据集进行验证.实验结果表明,离散化方法通用模型对数据...  相似文献   

11.
连续属性的离散化是粗糙集理论亟待解决的关键问题之一。基于灰色系统和粗糙集的有关理论,提出了 一种新的基于属性重要性的离散化算法。该算法以条件属性对决策属性的灰色关联度来度量条件属性的重要性, 在保证决策表原始分类能力不变的前提下,按照属性重要性由小到大的顺序对每个条件属性的侯选断点进行考 察!将冗余的断点去掉,从而将条件属性离散化。同时给出了该算法的时间复杂度分析,并通过实例分析验证了算 法的有效性和实用性。  相似文献   

12.
基于决策支持度的不完备信息系统约简算法   总被引:1,自引:0,他引:1  
提出了一种基于决策属性支持度的属性相对约简算法。通过引入决策属性支持度对不完备决策表中属性的重要性进行了定义,并以此作为启发信息进行属性的选择,该算法的时间复杂度是多项式的。寻找决策表中最小相对约简问题是典型的NP-hard问题,采用该算法可降低问题复杂度。通过实例说明,该算法能得到不完备决策表的最小相对约简。  相似文献   

13.
基于云模型的连续属性决策表简化算法   总被引:1,自引:0,他引:1  
从降低样本数据模糊性及随机性角度出发,提出了一种基于云模型的连续属性决策表简化算法.该算法通过对决策表的转换,建立云相似度概念来刻画样本间等价关系,并采用改进的动态聚类方法自动获取相似样本,完成对样本的较粗粒度表示.实验结果表明,简化决策表在不到原规模十分之一的条件下,取得了大致相当的识别率,从而大幅降低粗集知识获取时间.  相似文献   

14.
提出了一种新型的决策规则约简方法。基于均匀划分和正态分布隶属度函数,对决策表的连续属性进行模糊化,用欧氏距离贴近度来构建相似矩阵,并提出了一种论域的模糊划分算法;依据粗糙集隶属度进行属性约简的基础上,给出了一种决策规则约简算法,从而达到发掘知识并简化知识的目的。  相似文献   

15.
属性约简和属性值约简是利用粗糙集理论从决策表中挖掘决策规则的基础,挖掘决策规则是粗糙集理论的重要研究领域之一。本文根据属性的重要度和条件差别矩阵来进行条件属性约简,找出有效约简。同时定义了决策表的不一致度,并根据属性重要度来进行属性值约简,在保持决策表不一致度不增加的前提下挖掘出决策规则,该决策规则集满足独立性、覆盖全域性、可接受性和一致性,即决策规则集为决策算法,最后运用实例对该方法的有效性进行说明。  相似文献   

16.
针对粗糙集中连续属性需要离散化问题进行了研究.根据数据对象的可分辨性原理构造超立方体,在数据空间上对信息表中的连续属性进行整体离散化处理.根据条件属性与决策属性的一致性关系,依照条件属性在粗糙集边界域中的分类能力来确定条件属性的重要性,在此基础上选取重要划分点对信息表中的连续属性进行局部离散化,同时以信息熵作为迭代约束条件.数值示例和实验表明这种整体与局部相结合的离散化方法是有效可行的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号