首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 187 毫秒
1.
提出一种基于连续属性离散化的知识分类方法.将条件属性按照重要度由高到低排序,并依照此排序将决策表中各条件属性依次离散化.在对决策表中条件属性的离散化过程中充分考虑已离散化的条件属性及决策属性,离散后的决策表不需要进一步约简.使用了模拟数据和UCI机器学习数据集中的数据进行算法测试,而且与其他离散化算法进行了对比,结果充分证明了新方法的有效性.  相似文献   

2.
文章提出了一种利用粗糙集理论生成文本分类规则的方法.首先,抽取特征词并计算权重.然后,在权值离散化之后,构造决策表.其中,特征词作为条件属性,类别作为决策属性.之后,将文本用属性约简和属性相对约简进行处理,得出决策规则.最后给出分类算法.  相似文献   

3.
决策粗糙集基于严格的不可分辨等价关系,只能适用于离散型数据,文中研究了一种新的模糊决策粗糙集模型及相应的属性约简算法.该模型将不可分辨等价关系放松为高斯核模糊T-等价关系,从模糊隶属度角度定义了条件概率,能够直接对数值型数据进行属性约简.利用UCI标准数据集,将该模型与Pawlak经典粗糙集、决策粗糙集在属性约简能力上进行比较,仿真实验结果表明,该模型具有较好的性能.  相似文献   

4.
基于差别矩阵的增量式属性约简完备算法   总被引:1,自引:0,他引:1  
为了解决基于差别矩阵的属性约简完备算法得不到最小约简的问题,提出了一种改进的属性约简方法.该方法将信息论定义的属性重要性作为启发式信息,并通过构造一个条件信息熵算子对差别集合进行运算,同时利用算子来计算候选属性的剔除次序,采用宽度优先搜索策略使约简集合中含有最重要的属性,这样就解决了完备算法约简率低的问题.结合该方法并在分析对象集增量与差别矩阵关系的基础上,证明了增量约简定理,由此提出了一种增量式约简完备算法(CAIR),当新数据加入决策表时,算法可增量构造差别集合.实验结果表明,所提CAIR在大大缩短计算差别集合时间的同时,约简率比非完备算法提高了20.3%,是同条件下完备算法执行效率的13.2倍.  相似文献   

5.
提出一种基于粗糙集中连续属性离散化和支持向量机(SVM)的分类预测算法。首先,提出一种新颖的Improved Chi2离散化技术,将其作为预处理器将连续属性数据离散化,然后应用粗糙集理论进行属性约简和规则提取,删去冗余的属性和样本,在横向和纵向均大大降低了数据的维度,降低了样本的存储要求,而且没有失去原始决策表所表达的信息。应用支持向量机进行分类建模预测,大大降低了SVM分类过程中的复杂度,不会降低分类能力。仿真实验表明了本文算法的有效性,不仅分类预测精度高,且训练速度快了。  相似文献   

6.
基于包含程度的属性重要性定义   总被引:2,自引:2,他引:0  
利用粗糙集理论讨论了一种基于条件属性和决策属性相互包含程度的新的条件属性重要性,得到了基于该定义下的属性最佳约简方法,最后结合实例说明该方法的有效性.  相似文献   

7.
信息表相对属性约简的一个算法   总被引:4,自引:0,他引:4       下载免费PDF全文
给出一种相对属性约简的算法 .该算法对于信息表中由决策属性决定的划分中的每个基本集合 ,计算它们的下逼近集并对每个条件属性在下逼近集中的取值进行检索 ,剔除可能是多余的条件属性 ,得到一个候选属性约简 .在此基础上 ,通过逐步扩展属性 ,最终得到一个属性约简 .与已有的一些算法相比 ,该算法计算量较少  相似文献   

8.
基于粗糙集的故障案例特征提取方法   总被引:1,自引:0,他引:1  
针对故障案例特征属性提取在故障案例推理中的重要性,提出了案例的决策表表示形式,介绍了Semi-Naive-Scaler属性离散化算法,并给出了基于遗传算法的属性约简算法。在粗糙集的基本理论和方法基础上,计算了特征属性的重要度,给出了计算实例。  相似文献   

9.
应用经典粗糙集理论处理连续值属性决策表问题时,对连续值属性进行离散化会造成信息损失.本文在分析已有相似度不足的基础上提出一种改进的相似度,建立基于改进相似度的扩展粗糙集模型,并提出一种基于重要度的约简算法.  相似文献   

10.
经典粗糙集的前向启发式正域约简算法没有考虑到存在多个重要度最大的条件属性时如何合理地去选择候选属性;同时在度量条件属性间相关性时忽略了决策属性的影响程度,由此得到的约简集合泛化能力较弱.针对这些问题,首先引入信息粒度,提出一种候选属性选择的优化策略;其次引入信息论中交互信息的概念,通过计算属性之间的交互信息来剔除冗余属...  相似文献   

11.
一种变粒度的规则提取算法   总被引:1,自引:0,他引:1  
属性约简和值约简是粗糙集理论中知识获取的重要组成部分。通常,在知识获取的过程中先进行属性约简,然后在其基础上进行规则提取。但在实际应用中,属性约简在简化信息系统与提高规则提取效率的同时,原始信息系统中有些重要的条件属性可能被丢弃,从而导致属性约简后对信息系统进行知识获取得到的规则其数量与简化程度并不占优。针对上述问题,提出一种基于粒度变化的规则获取算法,通过属性粒度从粗到细的变化,直接从原始信息系统中提取规则;采用该方法得到的规则与属性约简后得到的规则相比,它们的数量与平均每条规则包含的特征属性数相对较少。最后,在理论分析的基础上,通过实例验证了算法可行性,并通过实验验证了算法的正确性和高效性。  相似文献   

12.
一种基于差别矩阵的属性约简完备算法   总被引:15,自引:0,他引:15  
提出了一种基于差别矩阵的粗糙集属性约简完备算法,算法的求解策略是在每次迭代过程中只选择必要的条件属性,如果在某次迭代过程中找不到这样的条件属性,则任意排除一条件属性,为下一次迭代中找到必要的条件属性做准备.分析了算法在最坏情况下的时间复杂性,给出了该算法相对Pawlak约简的完备性的证明.同已有的同类约简算法相比,该算法在最坏情况下具有更小的时间复杂性.  相似文献   

13.
一种基于属性重要性的属性约简启发式算法   总被引:2,自引:0,他引:2  
属性约简是粗糙集理论研究中的关键问题之一.文中定义了一种新的属性重要性度量准则,克服了多值偏向性问题,并给出一种新的属性约简算法.该算法以核属性集为初始约简集合,以新的属性重要性度量准则为启发信息,通过逐步加入相对于决策而言重要的条件属性来求取最小约简.实例分析表明该算法是有效的.  相似文献   

14.
针对连续型数据的属性约简问题, 提出了一种新的属性约简方法[CD2]基于分配可辨识矩阵的属性约简方法。给出了基于连续型数据的分配协调集的概念, 研究了基于连续型数据的分配协调集的基本性质, 定义了基于分配协调集的辨识矩阵。在此基础上提出了基于辨识矩阵的连续型数据的属性约简方法, 并给出了计算辨识矩阵的算法。实例分析表明, 该方法能有效地对连续型数据进行属性约简。  相似文献   

15.
基于信息最大覆盖率蚁群算法的Rough集属性优化约简   总被引:1,自引:0,他引:1  
属性约简是一个NP难问题,这种算法不仅复杂而且非常耗时。因此本文提出了一种基于等价划分的信息一致性的属性约简算法,降低了属性约简计算复杂度,并将信息最大覆盖率和属性重要性作为蚁群优化算法的信息素进行添加式属性约简,既减小了属性约简的空间复杂度,也提高了计算效率。最后通过一个具体的例子,证明了此算法的有效性和可行性。  相似文献   

16.
粗糙集理论是一种新的处理模糊和不确定知识的数学工具。属性约简是粗糙集理论研究中的重要内容之一。本文提出基于属性约简的模糊综合评判。通过属性约简,模糊评判过程中因素集(属性集)的指标数大大减少,从而达到简化运算、节约时空资源的目的。  相似文献   

17.
陈炎龙 《科学技术与工程》2012,12(24):6179-6183,6199
属性约简是粗糙集理论的核心研究内容之一。通过对某些现存属性约简算法分析,发现它们并不能有效地或正确地获取约简结果。为此,论文提出了一种基于属性递减策略的属性约简递归算法,该算法首先求出每个条件属性的依赖度,然后依次从条件属性集中减去依赖度较小的属性,并判断剩余属性集依赖度是否为1,如果是,则算法递归执行。最后把所获属性集并入约简集并求得核。该算法不仅能够快速计算出所有约简和核,而且运算简单、计算量较少,从而提高了算法效率。实例验证表明,该算法能更有效地对决策表进行约简,具有很强的实用性。  相似文献   

18.
首先通过对长度不同的犹豫模糊元进行补齐来定义犹豫模糊集新的交并运算,在Pawlak近似空间中利用新的运算建立粗糙犹豫模糊集模型;然后将Pawlak近似空间推广到一般犹豫模糊近似空间,利用犹豫模糊元间的相似度获得犹豫模糊近似空间中对象间的模糊关系矩阵,再利用模糊集的传递闭包法将模糊相似矩阵转化成模糊等价矩阵,在此基础上建立犹豫模糊信息系统中的粗糙集模型,研究犹豫模糊信息系统的属性约简。最后通过一个算例来说明犹豫模糊信息系统的属性约简方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号