共查询到19条相似文献,搜索用时 74 毫秒
1.
随着数据库规模的日益增大,关联规则挖掘需要在挖掘效率、可用性、隐私性及精确性等方面得到提升,需要对传统的关联规则挖掘算法进行更新和改进。在传统的Apriori算法基础上,提出了一种新的在关系数据库中挖掘关联规则的算法。该算法只需扫描一次数据库即可得到频繁项集,并通过非频繁项集来减少候选项集的生成,从而提高了算法的运算效率;此外,该算法将包含敏感数据事务做相关的处理,以达到隐藏包含敏感数据的关联规则。理论分析和实验结果表明,新算法不仅提高了关联规则挖掘的效率,而且还达到了隐藏包含敏感规则的目的。 相似文献
2.
VSS-MASK算法使用数据随机化方法对原始数据进行数据变换,采用纵向结构组织数据与只提交变换后为'1'的数据组成的数据表的方法,克服了原MASK算法中横向组织数据造成的数据稀疏性强、通用性差的缺点,并通过试验证明了VSS-MASK算法效率的提升. 相似文献
3.
隐私数据保护是目前网络安全关注一个热点之一,随着数据挖掘技术的不断发展,恶意用户可以使用相关技术推理出正常用户的隐私信息。在提出关联规则的前提下,提出了一种基于关联规则挖掘的隐私数据保护方法,对数据进行规则隐藏,从而保护用户的隐私数据。 相似文献
4.
为了给高考制度改革提供科学合理的依据,招生考试管理部门向高校或科研机构提供考生数据进行挖掘研究,同时,希望采取一系列措施对考生数据进行预处理,防止考生隐私泄露.通过关联规则数据挖掘算法对高考数据进行分析,揭示高考数据背后隐藏的关联关系,尽量避免发布一些不是很重要且与敏感属性关系不密切的信息,不仅可以减少隐私保护算法的运算量,而且能够降低攻击者通过其它渠道数据逆推隐私信息的可能性,从而降低隐私泄露风险.实验表明,方法简单可行,可为数据提供机构提供有价值的参考. 相似文献
5.
关联规则挖掘Apriori算法研究 总被引:1,自引:0,他引:1
随着收集和存储在数据库中的数据规模越来越大,人们对从这些数据中挖掘出相应的联知识愈来愈感兴趣,关联规则一个典型的应用实例就是市场购物分析.本文介绍了关联分析的概念Apriori算法及其改进技术,对Apriori算法地优缺点进行了评价. 相似文献
6.
分析了经典关联规则挖掘及相关的隐私保护等问题,同时研究了多关系关联规则的刻画和挖掘问题.通过重新定义查询模式,改进了Warmr方法,使查询模式支持“频繁查询模式的子模式也必然是频繁的“这种Apriori特性,进而将其移植到多关系规则的挖掘过程,从而加快规则的挖掘.研究了有针对性的敏感规则的挖掘方法,通过挖掘包含敏感信息的所有频繁查询模式,从中导出所有能够导致信息泄露的敏感规则;为了平衡数据可用性和安全性之间的矛盾,通过隐藏所有敏感规则中公共关系的元组,在保证规则隐藏和数据安全的同时,降低了对数据可用性的影响. 相似文献
7.
介绍了由ChristianHidber提出的在线挖掘关联规则算法Carma,提出了该算法的若干改进,减弱了原算法第一步有交易的子集v被插入集合V的条件,同时改进了maxMissed的计算公式,使其计算更为简单。实验证明,以上改进提高了算法的速度。 相似文献
8.
关联规则的动态快速挖掘算法(Dynamic Fast Mining Algorithm,DFMA),不需要重复扫描原始数据库,克服关联规则挖掘最具代表性的方法Apriori算法耗时多、无法在线挖掘等诸多弱点。可支持在线挖掘及渐进式挖掘的需求。利用DFMA多层同步处理与更新的特性,搭配敏感度指数的定义,可以被用来挖掘对决策者有用的实时性信息。 相似文献
9.
对挖掘关联规则的Apriori算法的关键思想进行了研究,给出了该算法的一个改进算法,提高了原算法的效率。 相似文献
10.
基于支持格的关联规则挖掘算法 总被引:1,自引:0,他引:1
提出了一种基于支持格的关联规则挖掘算法(ARSL),该算法连续扫描数据库事务序列,逐步构造支持格,对数据库扫描不超过2遍即可求得所有大项目集。首次扫描数据库时,能提供反馈信息,允许用户对最小支持率进行调整。该算法能连续处理事务序列,可用于网上在线数据挖掘。 相似文献
11.
关联规则挖掘主要用来发现数据库中存在的频繁项集.利用权值标识项目的重要程度,提出一种新的关联规则——加权关联规则的挖掘.由于项目权值的引入,Apriori性质不再成立,频繁项集的子集不再一定是频繁的.为此,提出k-最小支持数的概念,对原有Apriori算法进行改进.该算法能够挖掘出现频率小但是带来更大利润的项目,使得挖掘出的关联规则更加满足决策者的需求,也更加符合实际需要. 相似文献
12.
定量关联规则的挖掘 总被引:2,自引:0,他引:2
聂永红 《广西大学学报(自然科学版)》2000,25(4):316-319
介绍在关系数据库中包含定量和范围属性关联规则的挖掘问题,给出一些定义和方法,引人局部完备性来度量由于划分而引起大量信息的丢失程序,决定是否划分一个定量属性及划分数。 相似文献
13.
通过给定的最小支持率和最小信任度来挖掘语言值关联规则往往会得到很多规则,因此用户很难获得真正关注的语言值关联规则.本文提出一种挖掘典型语言值关联规则的算法,此算法将挖掘得到的语言值关联规则按照相同的后件进行分组,然后对每个分组中的语言值关联规则根据规则之间的不相似性进行聚类.最后从每个类中挑选出代表类原型的语言值关联规则作为典型的语言值关联规则.典型的语言值关联规则是语言值关联规则集合中最具有代表意义的规则. 相似文献
14.
目前关于隐私保护数据发布的研究大多是面向低维的关系型数据,其相关模型及算法无法直接用于解决稀疏的高维事务型数据发布中可能存在的隐私泄露问题.本文以剖分技术为基础,设计出一个面向隐私保护事务型数据发布的p-剖分l-多样化匿名算法.算法通过计算事务型数据中属性间的均方列联系数将高维属性集剖分成互不相交的p个属性子集,而后对事务型数据进行记录划分,使记录划分后的事务型数据关于p个属性子集满足l-多样化的要求.实验对匿名前后事务型数据的关联规则挖掘结果进行比较分析.理论分析和实验结果表明,本文的算法可安全地实现事务型数据发布的隐私保护,同时保证发布数据的可用性较高. 相似文献
15.
先从理论上证明分布数据库局部频繁集与全局候选频繁集之间存在某种关系 ,利用该关系设计分布数据库关联规则挖掘算法 .该算法的局部频繁集挖掘利用FP -树实现 ,不需生成候选频繁集 ,全局频繁集在局部频繁集基础上直接生成 ,不需重新扫描各局部数据库 ,不会造成过度的网络通信开销 ,具有很好的挖掘效率 相似文献
16.
基于遥感图像的光谱特征和纹理特征,提出图像关联规则的定义,通过对图像降阶预处理构造图像模板,
采用关联规则挖掘算法对图像纹理的频繁模式进行挖掘,通过联合关联规则来表达纹理。试验表明,挖掘出的关
联规则不仅能够表达规则纹理,而且能够较好表达随机纹理,据此可以进行纹理图像分割。 相似文献
17.
针对相联规则的提取,给出算法XL-T2L1。利用概念层次树编码及自顶向下逐步深化的策略发现任意层次概念间的关联,并引入了有趣规则的概念,对已发现的大量规则进行精减,便于用户对规则的利用。 相似文献
18.
基于trie的关联规则发现算法 总被引:2,自引:1,他引:2
郑丽英 《兰州理工大学学报》2004,30(5):90-92
分析了现有的关联规则挖掘算法,总结了当前的研究概况,从数据结构的角度出发,提出了用trie做数据结构存储交易数据库的所有项集,实现快速产生频繁项集,改进关联发现的性能.该方法只需一次扫描数据库,能够支持小的支持度计数和数据库的动态修改. 相似文献
19.
基于有向图的关联规则算法 总被引:5,自引:0,他引:5
提出了一种基于有向图的关联规则挖掘算法,采用了垂直二进制位图映射数据库,根据垂直二进制位图来生成有向图,将频繁项的二进制位串作为有向图的权值,通过分析有向图生成最大频繁项集,并给出了最大频繁项集挖掘算法的优势。 相似文献