首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 62 毫秒
1.
为了对现实中的大规模数据集进行分类挖掘,提出了一个基于关联的自适应分类规则挖掘模型,研究了该模型在预处理、多层分类规则的挖掘、算法的可扩展性、效率和输入参数的自适应等方面的技术和方法.  相似文献   

2.
认为数据量的巨大和高维、用户交互与先验知识的利用等等是知识发现领域面临的问题和难点。粗糙集理论是一种具有模糊边界的集合理论,它作为研究知识发现的新型工具,能严格地处理不精确数据的分类问题,被广泛应用于不相容决策表中的规则提取过程中。针对粗糙集理论中属性约减和属性值约减这两个重要问题进行了研究,并介绍了数据集中挖分类规则的基本原理,同时利用RS理论中核和核值的概念,提出了一个在数据集中发现没有冗余属性的最小归纳依赖关系并简化决策系统的数据挖掘算法,并应用一简单的例子说明如何在数据库中发现分类规则,实验结果表明此算法可以大大提高系统潜在知识的清晰度。  相似文献   

3.
认为数据量的巨大和高维、用户交互与先验知识的利用等等是知识发现领域面临的问题和难点 .粗糙集理论是一种具有模糊边界的集合理论 ,它作为研究知识发现的新型工具 ,能严格地处理不精确数据的分类问题 ,被广泛应用于不相容决策表中的规则提取过程中 .针对粗糙集理论中属性约减和属性值约减这两个重要问题进行了研究 ,并介绍了数据集中挖掘分类规则的基本原理 ,同时利用 RS理论中核和核值的概念 ,提出了一个在数据集中发现没有冗余属性的最小归纳依赖关系并简化决策系统的数据挖掘算法 ,并应用一简单的例子说明如何在数据库中发现分类规则 ,实验结果表明此算法可以大大提高系统潜在知识的清晰度  相似文献   

4.
基于分布式数据挖掘技术,提出了一种基于自适应蚁群算法的分布式分类规则算法。该算法采用了不同的启发式函数及信息素改变方法,引入了自适应机制与变异策略,从而达到缩短蚁群算法计算时间、加快算法收敛速度、提高预测准确率的目的。实验结果验证了该算法的有效性。  相似文献   

5.
在分析类Apriori算法存在效率瓶颈的基础上,提出了一个高效改进算法——基于分类树的关联规则挖掘算法.该算法只需要两次访问数据库,把数据库中的数据利用分类树来存储,减少了访问数据库的次数;并且由分类树的全部或部分来求得频繁项目集,减少了求频繁项目集的比较次数.此算法通过结合Apriori和FP—tree两种算法来提高挖掘效率,降低了挖掘算法的时间复杂度和空间复杂度.通过多次试验证明该算法比Apriori及其改良算法的挖掘效率高2到8倍.  相似文献   

6.
基于增量式遗传算法的粗糙集分类规则挖掘   总被引:8,自引:0,他引:8  
从规则获取和优化两个方面研究了基于遗传算法(GA)的增量式粗糙集分类规则挖掘方法.通过研究决策表和决策规则系数,建立了基于粗糙集表示和度量的知识理论,将GA和粗糙集分类规则挖掘算法相结合,在保持原有知识完备的前提下,利用GA对以增量形式获得的分类规则进行优化,获取最优分类规则.试验结果表明,执行增量式GA所需时间较执行一般GA所需时间要少,可有效完成分类规则优化的任务,同时还可提高分类的精度,使分类结果具有更好的可理解性.  相似文献   

7.
基于频繁模式树的关联分类规则挖掘算法   总被引:1,自引:1,他引:1  
构建精确而有效的分类器是数据挖掘和机器学习中的一个重要任务.提出了一种基于频繁模式树的关联分类规则挖掘算法,该算法同时考虑所有属性,并对现有关联分类规则挖掘算法中内存要求高、类别属性处理难、I/O访问次数多等问题提出了相应的解决方案.试验结果表明,该方法可以取得比同样基于关联规则的分类算法CMAR更高的执行效率以及基于规则的决策树分类算法C4.5更好的分类效果.  相似文献   

8.
郑羽  寿志勤 《科学技术与工程》2012,12(24):6192-6195
关于多级关联规则挖掘方面的研究到目前为止还非常有限,尤其是在减少所需存储空间、产生有效规则、缩短计算时间方面还有很多工作要做。基于FP-Tree的算法在以上方面被证实有其非常大的优势。故本文提出了一种基于FP-Tree的多级关联规则挖掘算法,并采用简化前缀树的方法优化算法性能。  相似文献   

9.
对遗传算法应用于分类规则挖掘问题进行研究,提出一种基于遗传算法和Apriori算法的混合分类规则挖掘算法,该算法的具体方案包括分类规则编码、适应度函数定义以及对进化后的规则的约简方法,最后通过实例仿真证明了该算法的有效性。  相似文献   

10.
关联规则挖掘算法FP-Growth在挖掘大型数据库时,占用内存大、运行速度慢或根本无法构造基于内存的FP-tree。针对这些问题,文章提出一种适合于挖掘较大型数据库的新的关联规则挖掘算法DFP-Growth,新算法将数据库分解,然后对分解得到的各个数据库子集用FP-Growth算法进行约束频繁项集挖掘,以满足大型数据库挖掘的需求。  相似文献   

11.
关联规则是数据挖掘中的一个重要研究方向.经典的Apriori算法是一种最有影响的挖掘布尔型关联规则频繁项集的算法,但其并不适合挖掘近年来兴起的多维数据模型.在改进Apriori算法的基础上,提出了一种"二次剪枝"的算法,此算法适用于挖掘多维关联规则,并且在一定程度上提高了算法效率.  相似文献   

12.
分类规则挖掘的免疫算法   总被引:4,自引:0,他引:4  
为了高效地从数据库中挖掘分类规则,提出了一种基于免疫算法的分类算法.该算法的核心思想为:对规则的前件进行固定长度编码,适应度函数的计算由分类规则的较小分类错误率、简洁性、一致性和训练实例的覆盖性构成,通过把适应度最小的个体作为先验知识来修改个体的某些分量的方法进行疫苗接种,并通过检测个体是否出现退化和模拟退火来实现免疫选择,同时还采用了基于信息增益的规则剪枝策略.在美国加州大学标准数据集中的5个数据集上将该算法与RISE和OCEC算法进行了实验比较,结果表明该算法不仅具有更快的收敛速度,而且获得了更高的预测准确率及更小的规则集。  相似文献   

13.
经典的关联规则求解算法(如Apriori算法)是串行算法,当数据量比较大时挖掘效率较低;提出了新的并行BVP算法,BVP算法通过多线程并行读取数据并计算相应的数据特征,然后计算频繁项集和关联规则;实验结果表明:相对于经典Apriori算法,算法执行效率更高。  相似文献   

14.
改进购物篮分析的关联规则挖掘算法   总被引:5,自引:1,他引:5  
基于改进传统购物篮分析的关联规则挖掘是在数据处理时引入兴趣度加权的思想,将所有交易中同一类商品的交易量进行归一化处理,根据用户领域知识的要求,计算该类商品的兴趣度加权阈值,从而改进传统的购物篮分析,使所挖掘出的关联规则符合实际,同时减少关联规则挖掘的工作量,提高规则挖掘的效率和准确性.  相似文献   

15.
分析了关联规则挖掘的各种算法,详尽分析和探讨了一种用于挖掘关联规则的矩阵算法并给出了矩阵算法实现过程.矩阵算法扫描数据库一次,然后生成事务矩阵,在矩阵上进行相关的数据挖掘操作.当数据库规模较大时,矩阵算法能够显著提高关联规则挖掘的效率.  相似文献   

16.
随着计算机技术和通信技术的不断发展,用户存储了越来越多、具有很高使用价值的信息,不断涌现的大量信息在给人们带来方便的同时也带来了问题,怎样提取有用信息使得数据挖掘技术应运而生.关联分析是数据挖掘的本质,关联规则挖掘是进行关联分析最常用的方法.在关联规则的Apriori算法的基础上,指出了该算法的不足之处,提出了一种新的改进算法,从而增强了算法的适应性.  相似文献   

17.
关联规则挖掘研究综述   总被引:6,自引:0,他引:6  
介绍了关联规则挖掘的一般概念,并对一些典型算法进行了介绍,展望了关联规则挖掘的未来研究方向.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号