首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
基于粗糙集理论的一种数据约简算法   总被引:1,自引:0,他引:1  
Roughsets理论被广泛运用于不确定环境下的信息处理 .基于粗糙集理论的数据约简算法正日益受到计算机科学家和数学家的重视 .笔者探讨了一种生成对称矩阵的约简算法 ,与传统算法相比 ,该方法更易于在计算机上实现  相似文献   

2.
基于粗糙集理论的一种数据约简算法   总被引:3,自引:0,他引:3  
Rough sets理论被广泛运用于不确定环境下的信息处理。基于粗糙集理论的数据约简算法正日益受到计算机科学家和数学家的重视。笔者探讨了一种生成对称矩阵的约简算法,与传统算法相比,该方法更易于在计算机上实现。  相似文献   

3.
一种基于粗糙集的数据约简改进算法   总被引:1,自引:0,他引:1  
在应用粗糙集理论对决策表进行数据处理时对数据约简算法进行了改进,以达到提高约简效率的目的.在进行属性约简时采用分辨矩阵的做法,但其缺点是生成中间过程的数据时需要耗费大量的资源,可以考虑在生成分辨矩阵时的循环过程中利用吸收律及时进行化简,在记录比较多的情况下对于降低宅间利用率,提高运算速度是有效的.在对属性值进行约简生成规则时,针对生成等价类时间复杂度高的问题,不再对每一个节点约简时调用等价类生成函数,而是采用生成一次等价类,存储多次调用的办法,大大降低了时间复杂度,提高了运行效率.  相似文献   

4.
基于粗糙集理论,提出一种无需建立差别矩阵,无需计算分明函数的值约简算法,阐述该算法的设计思想和具体步骤,并用具体算例证明此算法可行,而且获取的规则是完备无冗余的。  相似文献   

5.
为更有效更迅速地获得大量信息中所包含的潜在知识和规律,有关数据挖掘和数据库知识发现的研究变得更为广泛和深入.结合粗糙集理论的优势和层次分析模型的特点并将两者有机地结合起来,通过在非核属性中引入重要性概念并利用简单相异矩阵,提出了基于粗糙集理论和层次分析的数据约简算法,同时证明了该算法的有效性和完备性.最后,应用该算法解决了医疗决策系统中一个数据约简问题,实现了知识和规律的挖掘,提高了数据约简的合理性.  相似文献   

6.
陈胜  曾雪兰  梅良才 《广西科学》2009,16(4):389-391
在分析贝叶斯粗糙集模型已有的约简算法的基础上,从含有多个决策类情况下的全局相对增益函数的角度,利用二进制编码方法给出一种求贝叶斯粗糙集所有约简及核的算法,并基于实际应用,给出对求出的所有约简进行筛选的拓展算法。通过算例说明算法的实用性和有效性。  相似文献   

7.
基于模糊相似关系的决策粗糙集是经典决策粗糙集的延伸与拓展,为当今的研究热点之一.在实际处理数据时,同一对象的同一属性可能具有不同层次,并且在不同层次上取得不同值.为此,该文针对多尺度决策系统,提出多尺度决策系统中基于模糊相似关系的决策粗糙集模型,给出相应的最优尺度选择及约简方法,并讨论了获得一个最优尺度约简的简便算法....  相似文献   

8.
在文献[1]提出的决策表属性约简的信息熵表示的基础上,给出了一种基于互信息求取属性约简的算法.同时给出了该算法的时间复杂度分析,并举例验证了所提出算法的有效性和实用性.  相似文献   

9.
基于粗糙集理论的决策表属性约简算法   总被引:2,自引:1,他引:2  
属性约简是粗糙集理论的一个重要内容,是进行知识获取中的核心问题之一.本文在粗糙集理论的基础上构造了区分图,在区分图上以属性的重要度作为启发信息,快速缩小搜索空间,求解最小属性约简.给出了一个最坏情况下时间复杂度为max(O(|C|^2),O(|C‖U|^2))的快速属性约简算法.该算法统一考虑一致性决策表和不一致性决策表两种情况下的属性约简.  相似文献   

10.
为了去除系统中的冗余属性,保持系统的分类能力,研究了连续值分布式数据的属性约简.给出了连续值分布式决策信息系统中邻域粗糙集的定义,讨论了分布式连续值决策信息系统中正域计算的可分解性.以保持分布式决策信息系统的正域不变为前提,探讨了分布式决策信息系统中属性的可约性,提出了分布式连续值决策信息系统的属性约简算法.为了验证该算法的有效性,在7份数据集上进行了3组实验.实验使用提出的算法对分布式数据进行属性约简,进而采用加权集成的方式进行分类测试.实验结果表明,该算法能够有效去除连续值分布式数据中的冗余属性,使得约简后的连续值分布式数据的集成分类能力与约简前相差不大.甚至更高.  相似文献   

11.
基于Rough集的决策树算法   总被引:1,自引:0,他引:1  
针对基于Rough集的经典分类算法值约简算法等不适合大数据集的问题,提出了基于Rough集的决策树算法。采用一个新的选择属性的测度——属性分类粗糙度作为选择属性的启发式,该测度较Rough中刻画属性相关性的测度正区域等更为全面地刻画了属性分类综合贡献能力,并且比信息增益和信息增益率的计算更为简单。采取了一种新的剪枝方法——预剪枝,即在选择属性计算前基于变精度正区域修正属性对数据的初始划分模式,以更有效地消除噪音数据对选择属性和生成叶节点的影响.采取了一种与决策树算法高度融合的简单有效的检测和处理不相容数据的方法,从而使算法对相容和不相容数据都能进行有效处理。对UCI机器学习数据库中几个数据集的挖掘结果表明,该算法生成的决策树较ID3算法小,与用信息增益率作为启发式的决策树算法生成的决策树规模相当。算法生成所有叶节点均满足给定最小置信度和支持度的决策树或分类规则,并易于利用数据库技术实现,适合大数据集。  相似文献   

12.
传统的决策树方法在实际应用中存在很多不足,如生成树规模过大,抗噪性较差等,因此,提出了将变精度粗糙集和混合变量集算法应用于决策树分类中,通过变精度和混合属性集分类减小树的规模和过度拟合问题,降低了噪声数据对属性选择的影响,并通过实验证明该算法与传统的算法相比具有较大的优越性。  相似文献   

13.
提出了一种基于可变精度粗糙集的规则挖掘矩阵算法,它是一个采用基于分类精确度的粗糙集模型进行决策规则挖掘的新方法,能有效地处理决策表的不一致性。实例结果和实际应用表明该算法是有效的,为信息系统的规则约简、获取和信息压缩提供了新的思路。  相似文献   

14.
认为数据量的巨大和高维、用户交互与先验知识的利用等等是知识发现领域面临的问题和难点 .粗糙集理论是一种具有模糊边界的集合理论 ,它作为研究知识发现的新型工具 ,能严格地处理不精确数据的分类问题 ,被广泛应用于不相容决策表中的规则提取过程中 .针对粗糙集理论中属性约减和属性值约减这两个重要问题进行了研究 ,并介绍了数据集中挖掘分类规则的基本原理 ,同时利用 RS理论中核和核值的概念 ,提出了一个在数据集中发现没有冗余属性的最小归纳依赖关系并简化决策系统的数据挖掘算法 ,并应用一简单的例子说明如何在数据库中发现分类规则 ,实验结果表明此算法可以大大提高系统潜在知识的清晰度  相似文献   

15.
【目的】为提高决策树集成的泛化能力和效率,解决集成全部决策树的情况下有时并不显著提高精度、反而导致额外存储和计算开销的问题,提出一种基于粗糙集的决策树集成学习算法。【方法】该算法基于粗糙集理论,从训练的全部决策树中选择一部分进行集成。【结果】与目前流行的集成学习算法Bagging和Boosting相比,本文提出的算法有效地减小了集成规模,并获得更好的泛化能力。【结论】该算法提高了决策树集成的泛化能力和效率。  相似文献   

16.
基于粗糙集和证据理论的决策规则提取   总被引:1,自引:1,他引:1  
提出一种基于粗糙集和证据理论的两阶段决策规则提取算法, 该算法首先利用粗糙集中属性缩减的思想, 找出每条规则中的重要条件属性集合, 然后再基于证据理论中证据结合的思想进一步去掉重要条件属性集中的冗余条件属性, 从而得到最终的决策规则. 所给算法简化了属性集的约简, 对高维数据也是可行的. 实验结果表明, 利用该算法能够挖掘出高质量的决策规则.  相似文献   

17.
探讨数据挖掘过程中,数据预处理应用粗糙集理论进行属性和属性值约简的方法以及用计算机实现约简的算法.通过对医疗数据的预处理表明,利用粗糙集理论来进行数据预处理是一种十分有效的精简、求最小决策算法的有效方法.  相似文献   

18.
粗糙集结合BP神经网络的数据融合方法研究   总被引:2,自引:0,他引:2  
在粗糙集和数据融合基本理论的基础上,研究了基于粗糙集理论和BP神经网络相结合的数据融合方法。先利用粗糙集对输入信息进行简化,剔除冗余信息,从而缩减了BP神经网络的规模,提高了融合系统的识别率,进而提高整个融合系统的效率。与传统的神经网络融合系统进行比较,通过实例说明了该方法的有效性。  相似文献   

19.
一种基于粗糙集理论的数据挖掘算法的研究   总被引:6,自引:0,他引:6  
研究了粗糙集理论在数据挖掘中的应用,提出了一种基于粗糙集理论的数据挖掘算法.首先对信息系统的数据加工泛化,构造其二进制可辨矩阵.对矩阵进行化简得到属性约简并生成规则.最后,结合银行申请信用卡的实例,利用上述方法进行数据挖掘,消去冗余属性,抽取决策规则.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号