首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 890 毫秒
1.
为了提高决策系统的分类质量,探讨了一种在数据仓库中基于粗糙逼近近似度量的挖掘分类规则策略.首先介绍了数据集中挖掘分类规则的基本原理,并利用粗糙集理论中粗糙逼近近似度量概念,根据决策表条件属性重要性度量及条件属性对决策类划分的逼近近似度量,提出了基于改进粗糙逼近近似度量的数据挖掘进行属性约减方法,最后举例说明了如何在数据库中发现分类规则.实验结果表明此方法挖掘出的规则简练且合理可靠.  相似文献   

2.
邻域粗糙集和模糊粗糙集是粗糙集理论中处理数值型数据的两种重要模型.在数值型信息系统中融合两者在不确定性度量方面的优越性,首先引入了模糊邻域粗糙集模型,并在该模型上定义了模糊邻域粗糙度的概念.模糊邻域粗糙度是通过粗糙集的边界域来度量信息系统的不确定性,为了达到更为全面的度量效果,在模糊邻域粗糙集模型中定义了模糊邻域粒结构,并基于该粒结构提出了模糊邻域粒度的概念,模糊邻域粒度是对信息系统分类能力的一种度量.最后,通过将两种度量方法进行结合,提出了一种基于模糊邻域粗糙集的混合不确定性度量方法,并从理论上证明其有效性.实验结果表明,所提出的混合度量方法综合了两种单独度量方法的优点,在数值型信息系统中具有更好的度量效果,因此所提出的不确定性度量方法更具有一定的优越性.  相似文献   

3.
基于本体粗糙集的程序代码相似度度量方法   总被引:2,自引:0,他引:2  
结合本体粗糙集理论,融合粗糙集理论分类处理能力与本体论数据描述能力,提出了一种基于本体粗糙集的个体相似度计算方法,并将其应用于程序代码相似度上。实验结果显示该方法在程序代码相似度度量上具备较好的实际效果,同时也揭示了属性度量和结构度量方法应用上的关系。  相似文献   

4.
连续属性的离散化是粗糙集理论亟待解决的关键问题之一。基于灰色系统和粗糙集的有关理论,提出了 一种新的基于属性重要性的离散化算法。该算法以条件属性对决策属性的灰色关联度来度量条件属性的重要性, 在保证决策表原始分类能力不变的前提下,按照属性重要性由小到大的顺序对每个条件属性的侯选断点进行考 察!将冗余的断点去掉,从而将条件属性离散化。同时给出了该算法的时间复杂度分析,并通过实例分析验证了算 法的有效性和实用性。  相似文献   

5.
首先分析了粗糙集理论中现有属性依赖性定义的不合理性,然后给出一种新的属性依赖性度量.根据这种依赖性度量,给出属性重要性的定义,再以这种属性重要性为权重,给出一种基于加权综合的样本分类算法。由于属性的重要性是由条件属性相对于决策属性的依赖性决定的,它的数值相对比较客观,这样解决了常用的定权方法的弱点,它们一般是凭经验或由专家给出,具有相当的主观性。  相似文献   

6.
为了从海量的信息资源库中快速、准确地进行分类并提取出有用的信息,提出了一种基于粗糙集和KNN混合的Web文本分类模型。利用粗糙集的属性约简理论降低了文本分类过程中的向量维数,使用一种基于分明矩阵的属性约简算法,特征选择过程采用互信息量计算方法,并对该混合算法进行了实验,同时结合传统的KNN方法对该混合算法进行比较,验证该算法的可行性。  相似文献   

7.
分析了在知识约简过程中经典粗糙集理论决策表知识约简方法的不足。以知识粗糙熵为基础,将一致和不一致对象分开,提出决策熵的概念及其属性重要性,在此基础上给出约简的判定定理;然后以条件属性子集的决策熵来度量其对决策分类的重要性,提出一种新的知识约简启发式方法。理论分析和实验结果表明,基于决策熵的属性重要性是一种更有效的启发式信息,该方法时间复杂度较低,有助于搜索最小或次优约简。  相似文献   

8.
一种新的基于决策熵的决策表约简方法   总被引:2,自引:0,他引:2  
分析了在知识约简过程中经典粗糙集理论决策表知识约简方法的不足.以知识粗糙熵为基础,将一致和不一致对象分开,提出决策熵的概念及其属性重要性,在此基础上给出约简的判定定理;然后以条件属性子集的决策熵来度量其对决策分类的重要性,提出一种新的知识约简启发式方法.理论分析和实验结果表明,基于决策熵的属性重要性是一种更有效的启发式信息,该方法时间复杂度较低,有助于搜索最小或次优约简.  相似文献   

9.
变精度邻域粗糙集相比于邻域粗糙集具有抗噪容错的能力,但由于重新定义了下近似,正域的划分不再严格,使得属性重要度的可信度降低,在精度改变的情况下无法优先选取最优的属性.针对这一问题,分析变精度邻域粗糙集的下近似,引入邻域内的正确分类率,定义属性质量度,提出一种基于正域的增量和平均正确分类率的增率相结合的属性度量方法.通过和现有的基于属性重要度的属性约简算法做比较,实验结果表明,改进后的属性度量方法对变精度有更好的适应性,在不同变精度阈值下能得到更优的约简结果.  相似文献   

10.
属性约简的一种贪心算法   总被引:2,自引:0,他引:2  
属性约简是粗糙集理论研究的关键问题之一 ,现已证明寻找一个决策表的最优约简是 NP- hard问题 .首先在粗糙集理论的基础上 ,给出决策表中属性重要性的两种度量 ,并以此为启发式信息 ,提出了一种基于粗糙集的属性约简贪心算法 ;最后 ,实验结果表明 ,该算法在大多数情况下能有效地获得决策表的最优约简 .  相似文献   

11.
基于粗糙集理论的火灾危险源风险评价权重确定   总被引:4,自引:0,他引:4  
针对属性权重完全未知且属性值以专家经验给出的多属性决策问题,提出了利用属性重要度计算权重的分配方法.根据粗糙集中的相对正域概念,探讨了如何运用属性重要度确定各属性的权重.将权重确定问题转化为粗糙集中属性重要性评价问题,建立了关于风险评价的关系数据模型,经过属性值特征化建立了知识系统,在数据分析下通过分析评判方法对评价对象的支持度和重要性,计算出风险评价模型的权重.该方法克服了传统权重确定方法的主观性,使得风险评价方法更具客观性,从而提高了火灾危险源风险评价的精度,通过实例说明该方法更加有效合理.  相似文献   

12.
目前常用的离散算法多为单属性离散化算法.利用该类算法对多维连续属性进行离散化时,逐次对单个属性进行离散化,割裂了多维属性之间的关系.基于此提出了一种基于遗传算法和变精度粗糙集的多属性离散化算法.该算法基于变精度粗糙集所具有的较好数据分类容错和抗噪能力,通过变精度粗糙集近似分类精度建立遗传算法适宜度评价函数,并利用遗传算法在多维连续属性候选断点集上寻找最优断点子集.基于UCI数据集比较了所提算法与多种常用的离散化算法的差异,实验结果表明,该算法可以获得相对较好的离散化效果.  相似文献   

13.
基于粗糙集的模糊模型辨识方法   总被引:5,自引:1,他引:4  
提出了一种基于粗糙数据分析的模糊模型辨识方法·二值化数据过滤和决策表的简约算法是该方法的两个关键点·通过将传统的决策表转化成二进制决策表,并采用二值化数据过滤技术,可以同时简化决策表的属性和属性值·通过决策表的简约算法,从决策表中提取出重要的属性和关键的属性值,从而得到了输入空间的模糊最优化分,进一步得到模糊模型的前提结构和参数·利用这种方法以一组经典数据为背景建立了岩石边坡工程中边坡稳定性分析的模糊模型,仿真结果说明了该方法的有效性  相似文献   

14.
连续属性离散化是粗糙集应用研究的重点内容之一.基于条件熵可以反应属性依赖度的性质,将决策属性对条件属性的条件熵作为离散化标准,提出了一种粗糙集连续属性离散化方法,并通过实例证明了该方法的正确性.  相似文献   

15.
利用覆盖粗糙集研究信息系统的属性约简.首先,回顾了覆盖粗糙集的基础知识,然后提出了相关类的概念以及几个相关定理,并且逐步阐述如何用相关类的方法来进行属性约简,最后用例子证明了此方法的可行性,并得出结论.  相似文献   

16.
利用近似质量作为度量标准,借助启发式算法求解约简,其本质是根据近似质量的变化情况来找出冗余属性,但这一方法其并未考虑每一个决策类别所对应的下近似集合在约简前后的变化程度.鉴于此,提出了一种基于类别近似质量的属性约简策略,其目标是使得每一个类别的近似质量都满足约简的约束条件.借助邻域粗糙集模型,在UCI数据集上将传统约简策略与类别近似质量约简策略进行了对比分析,实验结果不仅验证了类别近似质量约简策略的有效性,而且表明这种策略依然能够满足传统约简的约束条件.  相似文献   

17.
提出了基于粗集理论的煤矿瓦斯预测专家系统知识获取方法.该方法首先建立瓦斯数据与瓦斯突出强度之间关系的预测样本集;然后运用粗糙集的连续属性离散化、属性约简以及规则提取算法,从大量的预测样本集中自动获取预测知识,并将预测知识存储于专家系统知识库中;最后基于推理机,实现煤矿瓦斯突出的实时预测.实例分析表明,粗糙集方法在煤矿瓦斯突出预测专家系统知识获取中的有效性和实用性.  相似文献   

18.
许韦 《科学技术与工程》2013,13(9):2517-2522
在不完备信息系统中基于相似关系,引入了可变精度和多粒度粗糙集,进而提出一种基于相似关系的变精度多粒度粗糙集模型。研究了基于相似关系的变精度多粒度粗糙集的相关性质和关系。随后讨论了基于相似关系变精度多粒度粗糙集的约简问题,提出了一种基于属性重要度的启发式分布约简算法,实例分析的结果验证了该方法的可行性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号