首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 46 毫秒
1.
随着数据库规模的日益增大,关联规则挖掘需要在挖掘效率、可用性、隐私性及精确性等方面得到提升,需要对传统的关联规则挖掘算法进行更新和改进.在传统的Apriori算法基础上,提出了一种新的在关系数据库中挖掘关联规则的算法.该算法只需扫描一次数据库即可得到频繁项集,并通过非频繁项集来减少候选项集的生成,从而提高了算法的运算效率;此外,该算法将包含敏感数据事务做相关的处理,以达到隐藏包含敏感数据的关联规则.理论分析和实验结果表明,新算法不仅提高了关联规则挖掘的效率,而且还达到了隐藏包含敏感规则的目的.  相似文献   

2.
VSS-MASK算法使用数据随机化方法对原始数据进行数据变换,采用纵向结构组织数据与只提交变换后为'1'的数据组成的数据表的方法,克服了原MASK算法中横向组织数据造成的数据稀疏性强、通用性差的缺点,并通过试验证明了VSS-MASK算法效率的提升.  相似文献   

3.
吴方 《科技资讯》2008,(32):21-21
隐私数据保护是目前网络安全关注一个热点之一,随着数据挖掘技术的不断发展,恶意用户可以使用相关技术推理出正常用户的隐私信息。在提出关联规则的前提下,提出了一种基于关联规则挖掘的隐私数据保护方法,对数据进行规则隐藏,从而保护用户的隐私数据。  相似文献   

4.
关联规则挖掘Apriori算法研究   总被引:1,自引:0,他引:1  
随着收集和存储在数据库中的数据规模越来越大,人们对从这些数据中挖掘出相应的联知识愈来愈感兴趣,关联规则一个典型的应用实例就是市场购物分析.本文介绍了关联分析的概念Apriori算法及其改进技术,对Apriori算法地优缺点进行了评价.  相似文献   

5.
为了给高考制度改革提供科学合理的依据,招生考试管理部门向高校或科研机构提供考生数据进行挖掘研究,同时,希望采取一系列措施对考生数据进行预处理,防止考生隐私泄露.通过关联规则数据挖掘算法对高考数据进行分析,揭示高考数据背后隐藏的关联关系,尽量避免发布一些不是很重要且与敏感属性关系不密切的信息,不仅可以减少隐私保护算法的运算量,而且能够降低攻击者通过其它渠道数据逆推隐私信息的可能性,从而降低隐私泄露风险.实验表明,方法简单可行,可为数据提供机构提供有价值的参考.  相似文献   

6.
分析了经典关联规则挖掘及相关的隐私保护等问题,同时研究了多关系关联规则的刻画和挖掘问题.通过重新定义查询模式,改进了Warmr方法,使查询模式支持“频繁查询模式的子模式也必然是频繁的“这种Apriori特性,进而将其移植到多关系规则的挖掘过程,从而加快规则的挖掘.研究了有针对性的敏感规则的挖掘方法,通过挖掘包含敏感信息的所有频繁查询模式,从中导出所有能够导致信息泄露的敏感规则;为了平衡数据可用性和安全性之间的矛盾,通过隐藏所有敏感规则中公共关系的元组,在保证规则隐藏和数据安全的同时,降低了对数据可用性的影响.  相似文献   

7.
介绍了由ChristianHidber提出的在线挖掘关联规则算法Carma,提出了该算法的若干改进,减弱了原算法第一步有交易的子集v被插入集合V的条件,同时改进了maxMissed的计算公式,使其计算更为简单。实验证明,以上改进提高了算法的速度。  相似文献   

8.
关联规则的动态快速挖掘算法(Dynamic Fast Mining Algorithm,DFMA),不需要重复扫描原始数据库,克服关联规则挖掘最具代表性的方法Apriori算法耗时多、无法在线挖掘等诸多弱点。可支持在线挖掘及渐进式挖掘的需求。利用DFMA多层同步处理与更新的特性,搭配敏感度指数的定义,可以被用来挖掘对决策者有用的实时性信息。  相似文献   

9.
对挖掘关联规则的Apriori算法的关键思想进行了研究,给出了该算法的一个改进算法,提高了原算法的效率。  相似文献   

10.
基于支持格的关联规则挖掘算法   总被引:1,自引:0,他引:1  
提出了一种基于支持格的关联规则挖掘算法(ARSL),该算法连续扫描数据库事务序列,逐步构造支持格,对数据库扫描不超过2遍即可求得所有大项目集。首次扫描数据库时,能提供反馈信息,允许用户对最小支持率进行调整。该算法能连续处理事务序列,可用于网上在线数据挖掘。  相似文献   

11.
目前关于隐私保护数据发布的研究大多是面向低维的关系型数据,其相关模型及算法无法直接用于解决稀疏的高维事务型数据发布中可能存在的隐私泄露问题.本文以剖分技术为基础,设计出一个面向隐私保护事务型数据发布的p-剖分l-多样化匿名算法.算法通过计算事务型数据中属性间的均方列联系数将高维属性集剖分成互不相交的p个属性子集,而后对事务型数据进行记录划分,使记录划分后的事务型数据关于p个属性子集满足l-多样化的要求.实验对匿名前后事务型数据的关联规则挖掘结果进行比较分析.理论分析和实验结果表明,本文的算法可安全地实现事务型数据发布的隐私保护,同时保证发布数据的可用性较高.  相似文献   

12.
通过给定的最小支持率和最小信任度来挖掘语言值关联规则往往会得到很多规则,因此用户很难获得真正关注的语言值关联规则.本文提出一种挖掘典型语言值关联规则的算法,此算法将挖掘得到的语言值关联规则按照相同的后件进行分组,然后对每个分组中的语言值关联规则根据规则之间的不相似性进行聚类.最后从每个类中挑选出代表类原型的语言值关联规则作为典型的语言值关联规则.典型的语言值关联规则是语言值关联规则集合中最具有代表意义的规则.  相似文献   

13.
定量关联规则的挖掘   总被引:2,自引:0,他引:2  
介绍在关系数据库中包含定量和范围属性关联规则的挖掘问题,给出一些定义和方法,引人局部完备性来度量由于划分而引起大量信息的丢失程序,决定是否划分一个定量属性及划分数。  相似文献   

14.
考虑事务数据库D长度不变、项目集I发生变化并且带有权重时的关联规则挖掘问题,提出了一种针对项目集增加的加权关联规则更新算法,解决了增加项目集的加权关联规则更新问题,与对新数据库重新运行算法相比,其运行效率有显著提高.  相似文献   

15.
在关联规则挖掘中,大量的数据是多维的,且带有时态特性,所以往往需要在时态约束的前提下挖掘多维关联规则.本文从一个实际问题出发,在单维Apriori算法和已有的工作基础上,提出了一种新的多维时态关联规则挖掘算法,并与类似算法进行了比较.  相似文献   

16.
一种基于关联规则的增量数据挖掘算法   总被引:4,自引:0,他引:4  
分析了关联规则增量更新挖掘算法FUP和IUA,指出了其效率低下的主要原因.针对关联规则增量更新问题,提出了一种新的简单高效的增量挖掘算法LIUA,并对算法LIUA进行了测试,测试结果表明算法是高效、可行的.  相似文献   

17.
基于trie的关联规则发现算法   总被引:3,自引:1,他引:2  
分析了现有的关联规则挖掘算法,总结了当前的研究概况,从数据结构的角度出发,提出了用trie做数据结构存储交易数据库的所有项集,实现快速产生频繁项集,改进关联发现的性能.该方法只需一次扫描数据库,能够支持小的支持度计数和数据库的动态修改.  相似文献   

18.
频繁项目集是满足最小支持度和最小置信度下的一个项目集合,但随着最小支持度的不同,就会产生不同的频繁项目集,而频繁项目集的发现又是一个高花费的过程.该文提出一个新的维护算法,用来解决关联规则的更新维护问题.  相似文献   

19.
针对Apriori和AprioriTid算法中存在的项集生成瓶颈问题,提出了一种基于事务集压缩、候选项集压缩和支持度布尔矩阵的改进AprioriTid算法.该算法中通过删去不必比较的事务来有效缩减数据集;优化频繁项集的自连接方式来减少生成的候选项集个数;使用支持度布尔矩阵来加快候选项集的验证速度.实验结果表明改进算法比原算法执行效率明显提高,同时也验证了该算法在油液监测故障诊断中的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号