首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 849 毫秒
1.
一种连续属性离散化的新算法   总被引:5,自引:0,他引:5  
连续属性的离散化问题是机器学习、数据挖掘等领域中重要研究课题之一,本文深入讨论连续属性离散的各种方法,提出一种基于RS理论和条件信息熵的决策表条件属性离散化算法,计算简单、易实现并以实例加以说明。  相似文献   

2.
针对在使用粗糙集理论处理决策表时需要事先对连续属性进行离散化处理的问题,提出了一种基于连续属性分布特征的离散化算法.并通过实例分析说明该算法能在保证决策表原始分类能力不变的前提下,获得较少的断点数.  相似文献   

3.
提出一种基于连续属性离散化的知识分类方法.将条件属性按照重要度由高到低排序,并依照此排序将决策表中各条件属性依次离散化.在对决策表中条件属性的离散化过程中充分考虑已离散化的条件属性及决策属性,离散后的决策表不需要进一步约简.使用了模拟数据和UCI机器学习数据集中的数据进行算法测试,而且与其他离散化算法进行了对比,结果充分证明了新方法的有效性.  相似文献   

4.
目的 讨论连续值决策表的一种属性约简方法.方法 连续值决策表是一种常见的根据实际应用抽象所得的数据库.本文通过对连续值决策表进行预处理--离散化,把它们转化为有序决策表,然后以r度量作为度量标准对转化后所得的有序决策表进行属性约简.结果 与结论可以证明该方法可对连续值决策表有效的进行属性约简,使此类决策表的规则表示简单直观.  相似文献   

5.
讨论模糊C均值聚类算法在决策表条件属性对决策属性的相容程度的指导下对粗集理论中的连续属性进行离散化的一种新算法。该算法充分考虑属性之间的相关性,将所有连续属性转化为矩阵同时处理,能明显提高传统动态层次聚类算法离散化过程的速度。算法测试结果表明,新算法能较好地保留有效属性,提高离散化精度。  相似文献   

6.
讨论模糊C均值聚类算法在决策表条件属性对决策属性的相容程度的指导下对粗集理论中的连续属性进行离散化的一种新算法。该算法充分考虑属性之间的相关性,将所有连续属性转化为矩阵同时处理,能明显提高传统动态层次聚类算法离散化过程的速度。算法测试结果表明,新算法能较好地保留有效属性,提高离散化精度。  相似文献   

7.
基于自组织特征映射的属性离散化方法   总被引:1,自引:0,他引:1  
基于粗糙集理论,用K-W方法初步评价各连续属性的重要性,用自组织特征映射的聚类方法进行离散化,以决策表相容性为判决标准.试验表明,这是一种令人满意的离散化方法.  相似文献   

8.
邓青  薛青  杜楠  付朝博 《科学技术与工程》2021,21(27):11674-11680
离散化是装备模拟训练系统数据预处理的重要组成部分。针对传统数据离散化方法对单个属性依次处理,往往忽视属性间的相关性,造成装备模拟训练系统数据离散化后的误差。提出基于层次聚类和相容度的数据离散化方法。采用逐层泛化构建离散化总体框架,完成对装备模拟训练系统数据混合型决策表处理。设计动态确定簇数的层次聚类,实现对属性的初始整体划分;结合类别属性信息和相容度合并相邻区间,去除冗余的离散划分。实验结果表明,基于层次聚类和相容度的数据离散化方法在区间总数、精度方面有明显优势。  相似文献   

9.
基于粗糙集方法提出了一种系统的决策表约简和决策规则提取方法. 为了避免现有属性离散化方法的不足,使用多元统计中的聚类分析,并借助树形图,R2、半偏相关以及伪F统计量,对连续属性进行离散化处理,得到适合粗糙集方法要求的决策表. 在此基础上,简化了基于可辨识矩阵和逻辑运算的传统属性约简算法,并完善了启发式算法进行属性值约简和决策规则提取. 最后,以应用实例验证了该方法的可行性和有效性.  相似文献   

10.
讨论模糊C均值聚类算法在决策表条件属性对决策属性的相容程度的指导下对粗集理论中的连续属性进行离散化的一种新算法.该算法充分考虑属性之间的相关性,将所有连续属性转化为矩阵同时处理,能明显提高传统动态层次聚类算法离散化过程的速度.算法测试结果表明,新算法能较好地保留有效属性,提高离散化精度.  相似文献   

11.
本文根据一种基于粗糙集理论的数据挖掘方法,以路口检测数据为研究对象,通过记录数据形成原始的决策表,后通过改进的Semi Naive Scaler算法对原始决策表进行数据预处理,最后对数据预处理后的决策表采用基于可辨识矩阵的属性频度的启发式约简算法进行属性约简,得出的约简结果为关键的属性,即关键的相位,根据程序实现结果为道路决策部门提供依据。  相似文献   

12.
运用统计物理学的平均场理论来研究改进的联想记忆器问题。通过对三阶输出函数的有关网络状态的稳定性讨论,提出了一种对伪态的影响加以削弱的方法,并与Hopfield联想记忆网络进行了比较以及给出模拟结果来验证理论分析。  相似文献   

13.
By redefining test selection measure, we propose in this paper a new algorithm, Flexible NBTree, which induces a hybrid of decision tree and Naive Bayes. Flexible NBTree mitigates the negative effect of information loss on test selection by applying postdiscretization strategy: at each internal node in the tree, we first select the test which is the most useful for improving classification accuracy, then apply discretization of continuous tests. The finial decision tree nodes contain univariate splits as regular decision trees, but the leaves contain Naive Bayesian classifiers. To evaluate the performance of Flexible NBTree, we compare it with NBTree and C4.5, both applying pre-discretization of continuous attributes. Experimental results on a variety of natural domains indicate that the classification accuracy of Flexible NBTree is substantially improved.  相似文献   

14.
不一致决策表的分配序约简   总被引:2,自引:0,他引:2  
在不一致决策表中定义了分配序约简,给出分配序一致集的判定定理。通过定义分配序区分矩阵给出求分配序约简的区分矩阵法。为克服区分矩阵法时间复杂度随系统大小的增加而指数增长的缺陷,通过定义属性的相对重要性,提出一种求分配序约简的启发式算法。通过实例分析说明启发式算法的有效性,为从不一致决策表中获取知识提供了一种有效方法。  相似文献   

15.
基于相关系数的加权朴素贝叶斯分类算法   总被引:7,自引:0,他引:7  
朴素贝叶斯分类算法的条件独立性假设在很少情况下能够满足,为了克服该问题,提出了一种基于相关系数的加权朴素贝叶斯分类模型.通过计算条件属性和决策属性之间的相关系数,对不同的条件属性赋予不同的权重,从而在保持简单性的基础上有效地提高了朴素贝叶斯算法的分类性能.首先给出了基于相关系数的属性权值求解方法,然后描述了相应的算法,并对算法原理进行了分析与证明.通过在中医小儿肺炎病例数据集和UCI数据集上的仿真实验,验证了该方法的有效性.  相似文献   

16.
知识约简的差别矩阵启发式算法   总被引:9,自引:1,他引:9       下载免费PDF全文
首先从差别矩阵的角度 ,对决策表中属性的重要性给出度量 ,并提出了部分差别矩阵的概念 .在此基础上提出了一种基于部分差别矩阵的知识相对约简的启发式算法 ,并通过实例分析表明 ,在多数情况下该算法能够得到决策表的最小约简 .  相似文献   

17.
一种改进的Rough集属性约简启发式遗传算法   总被引:4,自引:0,他引:4  
属性约简是知识发现中的关键问题之一 .为了能够有效地获取决策表中属性最小相对约简 ,提出了一种在优化初始群体基础上提高算法性能的启发式遗传算法 .首先 ,通过构造一个新的算子 ,将信息论角度定义的属性重要性度量作为启发式信息 ,来描述所选择的属性子集对论域中确定分类子集的影响 ;接着 ,以此为基础并结合遗传算法 ,选择一些经过优化的染色体作为初始群体 ,在加强局部搜索能力的同时保持了该算法全局寻优的特性 .最后 ,从理论上对算法做了分析 ,证明了新算子所选择的属性子集对原有属性分类能力保持不变 .试验分析表明 ,该算法能有效地对决策表属性进行约简  相似文献   

18.
基于粗糙集理论的决策树构造算法   总被引:3,自引:0,他引:3  
应用粗糙集理论,提出了一种利用新的启发式函数构造决策树的方法。该方法以属性重要性评价指标作为信息熵函数,对务件属性进行选择,充分考虑了属性间的依赖性和冗余性,弥补了ID3算法对属性间依赖性强调不够的缺点,解决了决策树中子树的重复和有些属性在同一决策树上被多次选择的问题,该方法还能对不相容决策表进行正确分类。实例表明该方法是正确有效的,而且明显优于传统的决策树构造方法。  相似文献   

19.
属性约简和属性值约简是利用粗糙集理论从决策表中挖掘决策规则的基础,挖掘决策规则是粗糙集理论的重要研究领域之一。本文根据属性的重要度和条件差别矩阵来进行条件属性约简,找出有效约简。同时定义了决策表的不一致度,并根据属性重要度来进行属性值约简,在保持决策表不一致度不增加的前提下挖掘出决策规则,该决策规则集满足独立性、覆盖全域性、可接受性和一致性,即决策规则集为决策算法,最后运用实例对该方法的有效性进行说明。  相似文献   

20.
朴素贝叶斯分类作为一种统计分类的方法,简单高效,但它是建立在属性独立性假设的基础上,有一定的局限性,影响了它的分类效果.x2统计是一种度量属性相关性的方法,通过属性相关的分析,可以对属性进行约简,去除冗余和无关属性,达到简化朴素贝叶斯分类器的目的.朴素贝叶斯分类器的扩展方法是在非类父子结点之间添加扩展弧,表示相关属性间的依赖关系,从而扩展朴素贝叶斯分类器的结构.在数据集上的实验结果显示,KEANBC分类器优于NBC分类器,提高了分类正确率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号