首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 171 毫秒
1.
连续属性的离散化是粗糙集理论亟待解决的关键问题之一。基于灰色系统和粗糙集的有关理论,提出了 一种新的基于属性重要性的离散化算法。该算法以条件属性对决策属性的灰色关联度来度量条件属性的重要性, 在保证决策表原始分类能力不变的前提下,按照属性重要性由小到大的顺序对每个条件属性的侯选断点进行考 察!将冗余的断点去掉,从而将条件属性离散化。同时给出了该算法的时间复杂度分析,并通过实例分析验证了算 法的有效性和实用性。  相似文献   

2.
在数据挖掘和机器学习研究中,许多算法以离散值为处理对象,常常需要对连续属性进行离散化.由于正态分布的广泛性,本文提出一种基于正态分布的近似等频离散化方法.该方法实现简单,关于数据集大小具有线性时间复杂度,适用于大规模数据集.在许多数据集上与文献中多个离散化方法进行了对比测试,实验结果表明,提出的无指导的离散化方法是有效、可行的.  相似文献   

3.
为了降低基于成型脉冲滤波的时频局部化多载波系统的实现难度,提出了一种低复杂度的快速实现算法.首先基于时频分析和多载波通信理论得到发送端和接收端基带系统模型,然后通过数字化和延时处理对模型进行离散因果化,最后利用成型脉冲的有限截断长度和复指数函数的周期性简化离散模型并得到了快速实现算法.该算法具有计算复杂度低、便于灵活实...  相似文献   

4.
提出一种基于分类目标的启发式离散化算法, 通过该算法能够解决粗糙集理论中的连续属性离散化问题. 该算法充分考虑目标分类和属性的重要性, 在减少决策规则的同时完成了属性约简. 通过茶味觉信号的验证及与传统算法结果的比较, 验证了所给算法的有效性.  相似文献   

5.
目前常用的离散算法多为单属性离散化算法.利用该类算法对多维连续属性进行离散化时,逐次对单个属性进行离散化,割裂了多维属性之间的关系.基于此提出了一种基于遗传算法和变精度粗糙集的多属性离散化算法.该算法基于变精度粗糙集所具有的较好数据分类容错和抗噪能力,通过变精度粗糙集近似分类精度建立遗传算法适宜度评价函数,并利用遗传算法在多维连续属性候选断点集上寻找最优断点子集.基于UCI数据集比较了所提算法与多种常用的离散化算法的差异,实验结果表明,该算法可以获得相对较好的离散化效果.  相似文献   

6.
提出一种基于连续属性离散化的知识分类方法.将条件属性按照重要度由高到低排序,并依照此排序将决策表中各条件属性依次离散化.在对决策表中条件属性的离散化过程中充分考虑已离散化的条件属性及决策属性,离散后的决策表不需要进一步约简.使用了模拟数据和UCI机器学习数据集中的数据进行算法测试,而且与其他离散化算法进行了对比,结果充分证明了新方法的有效性.  相似文献   

7.
针对决策树C4.5算法在处理数值型因素时比较复杂和分类精度不高等问题,在数据预处理过程中采用云变换进行连续因素离散化,给出了连续属性离散化的具体算法.利用因素空间理论给出一种构造决策树算法的新的启发式函数—分辨度,分析了算法的时间复杂度,证明其为多项式算法.研究结果表明:改进算法的测试准确率和效率均优于决策树算法.  相似文献   

8.
连续属性离散化是数据预处理的关键步骤之一,在实际应用中往往通过高效的启发式算法来计算离散化结果.对基于辅助矩阵和信息熵的两类启发式离散化算法进行实验研究,分别选取每类算法中的5种典型方法,通过系列实验,对两类算法的性能进行对比研究,结果表明:辅助矩阵类算法具有相对较高的样本识别能力,但算法复杂度较高,运行时间更长,较适...  相似文献   

9.
针对目前离散化信息量度无法准确表征数据离散后有效分类信息量的问题,提出了一种基于有效信息比率的离散化算法.在构建离散化方案相依表的基础上,分析了离散区间内类属性分布与分类信息蕴含量间的关系,并根据类属性分布信息引入有效信息比率,用于表征各离散区间内有效分类信息量.然后,依据离散化方案的离散区间数及其有效信息比率,设计出表征离散化方案划分质量的离散化评价指标,从而提高了数据的离散化效果.仿真实验和实际应用的结果表明,该算法离散化后在有效分类信息量和分类预测精度上高于主流基于信息论的离散化算法.  相似文献   

10.
提出了一种基于贪心启发式的计算方法,可以在多项式时间复杂度内获得DUDC问题的近似最优解.首先生成了可替代二维平面的离散单元格,在每一单元格中心建立能够覆盖一定数量目标点的替代集,使用贪心算法确定替代集的最小组合方式,实现了对目标点的全覆盖.基于每个子集内所包含的点的具体位置,计算了其最小覆盖圆.最小覆盖圆的中心视为选址位置.基于具体案例证明了算法的有效性.讨论了该算法的影响因素,分析了时间复杂度以及近似度比率.  相似文献   

11.
基于启发式信息熵的粗集数值属性离散化算法   总被引:1,自引:0,他引:1  
在一致性假设前提下,以数据集的统计性质作为启发式知识,从候选离散点集中选择离散点,根据数据集的期望值和方差来确定搜索最优离散点的区域,提出一种新的基于信息熵粗集数值属性离散化算法,并采用UCI国际标准数据集来验证新算法.新算法与已报道的算法所得到的离散断点集完全一致,决策表的离散化结果也相同,但时间代价不同,新算法比其计算效率提高40%~50%.  相似文献   

12.
针对k等价度容差关系,提出了一种基于k等价度容差关系的变精度粗糙集模型,该模型是变精度粗糙集模型在不完备信息系统中的拓展.在此基础上,定义了变精度粗糙集模型约简的概念,讨论了一种刻画属性重要性的新指标,提出了一种启发式约简算法.该算法能从搜索空间中不断地添加重要的属性,并且删除不重要的属性,从而降低了约简的时间复杂度.最后,通过实例说明该算法的有效性.  相似文献   

13.
基于信息最大覆盖率蚁群算法的Rough集属性优化约简   总被引:1,自引:0,他引:1  
属性约简是一个NP难问题,这种算法不仅复杂而且非常耗时。因此本文提出了一种基于等价划分的信息一致性的属性约简算法,降低了属性约简计算复杂度,并将信息最大覆盖率和属性重要性作为蚁群优化算法的信息素进行添加式属性约简,既减小了属性约简的空间复杂度,也提高了计算效率。最后通过一个具体的例子,证明了此算法的有效性和可行性。  相似文献   

14.
决策树是数据挖掘中的一种重要分类方法。在此以粗糙集理论中的正域为启发式函数,设计了一种新的、有效的决策树构造方法。该算法具有较大的灵活性,能从测试属性空间逐次删除已使用过的属性。避免对这些属性进行重复测试,减少测试空间,降低了树的复杂性,从而提高了分类效率。最后,实例验证了算法的可行性与有效性。  相似文献   

15.
给出一种针对标准正六面体格子集合中探寻两个格子集合公共边界的算法,并利用这种算法在上得到相应边界图示.在两个集合个数分别为和的情况下,算法的时间复杂度以及空间复杂度均为O(mn).  相似文献   

16.
基于正区域的快速求核算法   总被引:2,自引:0,他引:2  
基于正区域求核算法的最好时间复杂度为O(|C|2|U|log|U|),为降低该求核算法的时间复杂度,给出了基于正区域的简化决策表定义和相应核的定义.证明了该简化决策表的核与原决策表的核等价.由于求正区域的简化决策表首先要求划分U/C,而求划分U/C的最好算法的时间复杂度为O(|C||U|log|U|),因此以基数排序的思想设计了一个新的求划分U/C的算法,其时间复杂度为O(|C||U|).最后以快速缩小搜索空间为目的设计了一个新的求正区域POSC(D)的算法.在此基础上,利用核的性质设计了一个新的求核算法,其时间复杂度为max(O(|C||U|,O(|C|2|U/C|)).并用实例说明了算法的实用性.  相似文献   

17.
一种改进的Fuzzy c—means聚类算法   总被引:2,自引:0,他引:2  
该文提出了一种改进的fuzzy c-means算法(MFCM)。此算法是将传统算法(FCM)直接对样本集聚类变为对特征集聚类,从而极大提高了fuzzy c-means的速度,证明了MCM与FMC在分类效果上的等价性,且MFCM较FCM有较低的时间复杂性,讨论了MFCM与FMC空间复杂性的关系。最后数值实验证实了结论。  相似文献   

18.
基于粗集理论的数据离散化技术研究   总被引:2,自引:0,他引:2  
信息系统连续型属性值的离散化对决策规则或决策树的学习具有非常重要的意义,它能够提高系统对样本的聚类能力,增强系统抗数据噪音的能力,减少机器学习算法的时间和空间开销,提高其学习精度。粗集是有效的数据离散化工具。对基于粗集理论的数据离散化方法进行了深入研究,分析其特征,评述其研究进展,并通过仿真实验研究了几种典型的启发式离散化算法的性能。其结果对发展新的离散化技术或为特定应用选择合适算法都有参考价值。  相似文献   

19.
基于粗集理论的数据离散化技术研究   总被引:3,自引:0,他引:3  
信息系统连续型属性值的离散化对决策规则或决策树的学习具有非常重要的意义。它能够提高系统对样本的聚类能力,增强系统抗数据噪音的能力,减少机器学习算法的时间和空间开销,提高其学习精度。粗集是有效的数据离散化工具。对基于粗集理论的数据离散化方法进行了深入研究,分析其特征,评述其研究进展,并通过仿真实验研究了几种典型的启发式离散化算法的性能。其结果对发展新的离散化技术或为特定应用选择合适算法都有参考价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号