首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 108 毫秒
1.
针对多维数据集的关联规则挖掘,提出了一种基于反区分矩阵的方法.首先由数据集同步得出区分矩阵和反区分矩阵,然后根据区分矩阵进行属性约简,再根据反区分矩阵找出约简后的频繁项集,最后给出关联规则.通过区分矩阵和反区分矩阵将属性约简和关联规则挖掘联系起来,减少了计算步骤,且算法只需扫描数据集一次,避免了繁琐的连接操作.应用实例表明该算法是一种合理有效的关联规则挖掘方法.  相似文献   

2.
针对“挖掘不同支持度下的关联规则需要反复扫描多维数据库所带来大量的系统I/O开销”这一缺限,提出一种基于中间存储的联机分析关联规则挖掘OLAM方法.在自行开发的联机分析处理OLAP的基础上,对待分析的多维数据集利用BCTree存储谓词集频度索引数,利用改进的Apriori关联规则挖掘算法分析用户感兴趣的维度,减少挖掘维度的个数,提高了反复挖掘的系统效率和系统针对性.生产数据证明了该方案的正确性和有效性.  相似文献   

3.
对多维关联规则中混合维关联规则数据挖掘技术进行了探索,实现了基于多维频繁项集进行多维关联规则数据挖掘的一种实用高效的方法,文中基于多维的频繁项集的挖掘算法主要分为2个步骤,并在高校学生信息系统中给予具体运用.  相似文献   

4.
传统的基于支持度—置信度框架的关联规则挖掘方法可能会产生大量不相关的、甚至是误导的关联规则,同时也不能区分正负关联规则。在充分考虑用户感兴趣模式的基础上,采用一阶谓词逻辑作为用户感兴趣的背景知识表示技术,提出了一种基于背景知识的包含正负项目集的频繁模式树,给出了针对正负项目集的约束频繁模式树的构造算法NCFP-Construct,从而提高了关联规则挖掘的效率和针对性,实验结果显示该方法是有效的。  相似文献   

5.
针对传统数据挖掘方法存在挖掘精度低、速度慢、占用内存多而不适于实际应用等缺点,提出一种属性受限状态下低维冗余聚类数据挖掘方法。通过计算低维冗余聚类数据的支持度,把低维冗余聚类数据挖掘问题转变成频繁项集挖掘问题;利用支持度与可信度对关联规则产生结果进行评价,并添加属性对其进行限制,以减少无用规则的产生。通过属性位复用方法建立候选区域,产生关联规则集,对符合关联规则集的低维冗余数据进行聚类,实现对其挖掘。实验结果表明,通过所提方法对属性受限状态下低维冗余数据进行挖掘,挖掘速度快,结果可靠。  相似文献   

6.
针对海量数据的关联规则挖掘问题,提出了一种有效的基于等价类划分的并行频繁闭项集挖掘算法.该算法在MapReduce框架下,通过等价类的产生与划分、数据集的分配、异步频繁闭项集挖掘和汇总等步骤,不但较好地解决了多节点间的负载均衡问题,而且易于获得可靠的频繁闭项集.实验表明,该算法能有效克服传统算法挖掘效率低、冗余规则较多的缺点,整体上具有较高的性能.  相似文献   

7.
针对传统数据挖掘方法存在挖掘精度低、速度慢、占用内存多而不适于实际应用等缺点,提出一种属性受限状态下低维冗余聚类数据挖掘方法。通过计算低维冗余聚类数据的支持度,把低维冗余聚类数据挖掘问题转变成频繁项集挖掘问题;利用支持度与可信度对关联规则产生结果进行评价,并添加属性对其进行限制,以减少无用规则的产生。通过属性位复用方法建立候选区域,产生关联规则集,对符合关联规则集的低维冗余数据进行聚类,实现对其挖掘。实验结果表明,通过所提方法对属性受限状态下低维冗余数据进行挖掘,挖掘速度快,结果可靠。  相似文献   

8.
针对穿戴式跌倒检测中特征属性过多,传统的降维和PCA赋权降维方法仅考虑了单个特征的重要度,未将特征组合的重要性考虑在内的问题,提出一种改进的基于关联规则挖掘的赋权特征选择方法。在特征降维过程中引入关联规则挖掘,根据频繁项集的支持度和置信度为特征赋权,实现特征选择。利用真实的数据集进行对比实验,结果表明:该方法分类的正确率、特异度和灵敏度均高于未经降维的原始数据集和经PCA赋权选择的数据集。该方法不仅能够实现对高维数据的降维,而且考虑了特征间的关联规则,能够得到更为优质的特征向量数据集。  相似文献   

9.
从大型事务数据库中发现关联规则是数据挖掘中的一个重要课题,其核心问题是挖掘频繁项集.经典Apriori算法是有效的挖掘频繁项目集的算法.在分析Apriori算法的基础上,提出了一种利用二维数组来代替算法中的哈希树的方法,可以迅速产生二阶频繁项目集,改善了Apriori算法的效率瓶颈,大大提高了算法的执行效率.  相似文献   

10.
 针对现有拓扑关联规则挖掘算法不能够有效地提取长频繁约束拓扑关联规则,提出一种基于区间映射的约束拓扑关联规则挖掘算法,该算法适合挖掘带约束空间布局关系的长频繁拓扑关联规则;该算法用区间映射法的下行搜索策略产生候选频繁拓扑项目集,利用逻辑"与"运算计算拓扑关系事务的支持数.实验证明在挖掘长频繁约束拓扑项目集时,该算法比现有算法更快速更有效.  相似文献   

11.
介绍了模糊关联规则挖掘算法的基本思想及实现步骤,提出了模糊关联规则的并行挖掘算法.并行挖掘算法采用并行的模糊c-均值算法将数量型属性划分成若干个模糊集,并借助模糊集软化属性的划分边界.用改进布尔型关联规则的并行挖掘算法来发现频繁模糊属性集.最后由多个处理器并行地产生满足最小模糊信任度的模糊关联规则.在分布式互连的PC/工作站环境下进行性能分析,结果表明并行的挖掘算法具有好的可扩展性、规模增长性和加速比性能.  相似文献   

12.
基于平行坐标技术的关联规则可视化模型   总被引:1,自引:0,他引:1  
数据挖掘可视化是数据挖掘过程中的重要组成部分.通过交互式数据挖掘可以增强挖掘结果的可理解性和可信度.平行坐标技术是数据挖掘可视化技术中的一个重要技术之一,该文在这种技术的基础上,提出了一种基于此技术的关联规则的可视化模型及显示方法.在最后对现有的关联规则的可视化方法进行了比较,论文中提出的显示模型在海量多维规则的显示和交互式操作上表现较为突出.  相似文献   

13.
针对传统的关联规则在试卷评估中应用出现的问题:由于试题的难易程度不同,被答对的概率也不一样,即数据集中数据项发生的概率不一样,数据项具有倾斜支持度分布的特征,选择合适的支持度阈值挖掘这样的数据集相当棘手。文章提出了基于试题难度系数加权的关联规则挖掘算法,从而解决因试题难度不同而导致数据项出现的概率不均的问题,发现更多有趣的关联规则,并且理论上证明了基于难度系数的加权关联规则算法保持频繁项集向下封闭的重要特性。  相似文献   

14.
一种多维关联规则算法的研究   总被引:2,自引:0,他引:2  
针对目前很少有一整套能同时处理量化属性和分类属性字段的多维关联规则的解决方法,对将单维关联规则的Aprior算法改进为量化属性的静态离散化多维关联规则的算法进行了研究,并以实例阐述了该算法在电子商店中的应用,分析了其商业价值。  相似文献   

15.
为在Web日志数据中挖掘关联规则以指导信息无障碍网站的设计与开发, 针对大量用户对网站页面URL(Uniform Resoure Locator)的访问频率等信息, 通过Apriori算法实
现数据挖掘, 以寻找用户访问页面之间的关联规则。根据3次点击原则及网站结构设计的特点, 对Apriori 算法网页超链接挖掘的过程进行了改进, 频繁项集最多只需找出所有3
-项集即可。算法实现过程表明, 该方法可有效降低算法的时间复杂度, 能通过对关联规则的分析确定用户感兴趣的网页类型, 找出用户所访问网页之间的链接关系。  相似文献   

16.
快速关联规则挖掘算法   总被引:1,自引:0,他引:1  
刘景春 《佳木斯大学学报》2004,22(2):151-156,177
提出了一种新颖的关联规则挖掘算法QAIS,与经典两阶段式关联规则挖掘算法不同的是,它只需扫描一遍事务数据库,不需要生成候选集,并且可以方便的应用在增量式关联规则挖掘算法中,该算法经合成数据验证是有效的.同时针对关联规则生成过程中出现大量冗余规则的问题,还讨论了冗余关联规则去除的问题.  相似文献   

17.
基于trie的关联规则发现算法   总被引:3,自引:1,他引:2  
分析了现有的关联规则挖掘算法,总结了当前的研究概况,从数据结构的角度出发,提出了用trie做数据结构存储交易数据库的所有项集,实现快速产生频繁项集,改进关联发现的性能.该方法只需一次扫描数据库,能够支持小的支持度计数和数据库的动态修改.  相似文献   

18.
数据挖掘中并行离散化数据准备优化   总被引:2,自引:0,他引:2  
在海量数据挖掘中,针对元数据的离散化数据准备处理能有效提高数据挖掘效率.本文提出了一种并行比较并获得最优离散化的数据准备算法(AOA),针对不同数据集,先进行数据集的特性检测以获得数据集分布特性,按照分布特性进行数据集的异常值检测和剔除,并行完成与分布特性适配的离散化方法处理,通过比较不同离散化方法的熵、方差指数、稳定性参数的最小欧氏距离,根据三个参数自动化比选,获得最优离散化的预处理成果.仿真表明,对不同样本数据库进行关联规则挖掘结果中,比较四种固定的离散化数据预处理方法,在使用AOA数据准备算法并行比选出最优的离散化来数据预处理后,在不同最小支持度阈值情况下,挖掘得到关联规则数都更少,因此效率得到提高.  相似文献   

19.
具有动态加权特性的关联规则算法   总被引:8,自引:1,他引:7  
基于FP_growth关联规则, 提出一种具有动态加权特性 的改进算法. 把事务数据库中的项目按其重要程度划分为5个等级; 运用层次分析(AHP)算法 构造判断矩阵, 计算特征向量; 将得到的向量作为权值, 与项目在事务数据库中出现的次数 综合考虑作为衡量重要程度的标准, 生成FP_tree; 最后得到频繁项目集和关联规则. 由于 权重的赋予过程可以由领域专家动态地改变, 这样不但能挖掘出更有意义的规则, 而且在算 法的运行初期就大量剔除了那些权重小的无用项目集, 从而大大提高了算法的运行效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号