首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 296 毫秒
1.
利用向量点积方法从垂直型分布数据中挖掘关联规则,并且保持其隐私性;给出了数量积算法和隐私挖掘的步骤,最后举例说明了如何利用数量积算法进行垂直型分布式数据挖掘.  相似文献   

2.
保持隐私是未来数据挖掘领域的焦点问题之一,如何在不共享精确数据的条件下,获取准确的数据关系是保持隐私的数据挖掘的首要任务.本文利用向量点积方法从垂直型分布数据中挖掘关联规则,并且保持其隐私性.给出了数量积算法和隐私挖掘的步骤,最后举例说明了如何利用数量积算法进行垂直型分布式数据挖掘.  相似文献   

3.
隐私保护是当前数据挖掘领域中一个十分重要的研究方向,其目的是要在不精确访问真实原始数据的条件下,得到准确的模型和分析结果.为了提高对隐私数据的保护程度和挖掘结果的准确性,研究了一种基于向量点积的分布式关联规则挖掘算法.此算法在分布式环境下,利用保持隐私数据挖掘的基本方法和安全两方计算协议,可以在不泄露任何隐私的基础上有效地对垂直型数据分布进行挖掘.  相似文献   

4.
吴方 《科技资讯》2008,(32):21-21
隐私数据保护是目前网络安全关注一个热点之一,随着数据挖掘技术的不断发展,恶意用户可以使用相关技术推理出正常用户的隐私信息。在提出关联规则的前提下,提出了一种基于关联规则挖掘的隐私数据保护方法,对数据进行规则隐藏,从而保护用户的隐私数据。  相似文献   

5.
关联规则挖掘是目前数据挖掘的研究难点之一,介绍了关联规则的划分情况,对频集算法进行了改进,提出了处理数值型字段的基本方法,展望了关联规则挖掘的未来研究方向.  相似文献   

6.
分析了经典关联规则挖掘及相关的隐私保护等问题,同时研究了多关系关联规则的刻画和挖掘问题.通过重新定义查询模式,改进了Warmr方法,使查询模式支持“频繁查询模式的子模式也必然是频繁的“这种Apriori特性,进而将其移植到多关系规则的挖掘过程,从而加快规则的挖掘.研究了有针对性的敏感规则的挖掘方法,通过挖掘包含敏感信息的所有频繁查询模式,从中导出所有能够导致信息泄露的敏感规则;为了平衡数据可用性和安全性之间的矛盾,通过隐藏所有敏感规则中公共关系的元组,在保证规则隐藏和数据安全的同时,降低了对数据可用性的影响.  相似文献   

7.
仲波  张远平 《科学技术与工程》2006,6(24):3863-38663870
基于随机响应技术,提出了一种在保护隐私的关联规则挖掘中对包含三个属性值的序数型数据进行伪装的方法.设计了在伪装的数据集上进行挖掘的算法;分析了算法的安全性及复杂度。并通过实验表明,该算法在伪装的数据集上挖掘出来的规则与原规则相比,相对误差不超过5%。  相似文献   

8.
提高频繁项集挖掘算法的效率一直是数据挖掘领域中关联规则挖掘研究的一个重点。Apriori算法是一种经典的最有影响的挖掘关联规则的算法,该算法虽然能有效地挖掘出关联规则,但是产生的冗余规则多,效率低下。针对数据挖掘的现状及关联规则算法的瓶颈问题,提出一种基于串与运算的关联规则挖掘算法,并对关联规则挖掘的未来研究方向进行了展望。  相似文献   

9.
关联规则挖掘在旅游突发事件预测中的研究   总被引:1,自引:0,他引:1  
基于数据挖掘中的关联规则挖掘及Apriori算法,研究了在旅游行业中用挖掘得到的规则对突发事件进行预测的方法.对突发事件进行了预处理,对与突发事件相关的规则进行了挖掘,提出了改进的关联规则算法,并获得了有意义的规则输出,并对这些关联规则在旅游业的应用进行了研究.  相似文献   

10.
随着数据库规模的日益增大,关联规则挖掘需要在挖掘效率、可用性、隐私性及精确性等方面得到提升,需要对传统的关联规则挖掘算法进行更新和改进。在传统的Apriori算法基础上,提出了一种新的在关系数据库中挖掘关联规则的算法。该算法只需扫描一次数据库即可得到频繁项集,并通过非频繁项集来减少候选项集的生成,从而提高了算法的运算效率;此外,该算法将包含敏感数据事务做相关的处理,以达到隐藏包含敏感数据的关联规则。理论分析和实验结果表明,新算法不仅提高了关联规则挖掘的效率,而且还达到了隐藏包含敏感规则的目的。  相似文献   

11.
关联规则挖掘应用于商业等领域,它能发现大量数据中的关联关系,为制定决策提供重要信息。将关联规则应用于客户关系管理,深化CRM的分析功能。针对企业要求和交叉销售的特点,分析基于约束关联规则挖掘方法,提出基于约束的FP-growth算法。分析表明,在CRM中应用基于约束关联规则挖掘方法,可以为企业制定销售策略提供有效的依据。  相似文献   

12.
时序关联规则的研究具有重要的现实意义,因而根据传统的FP-树思想,提出了一种基于改进的FP-树的时序关联规则挖掘的方法.根据FP-树的思想,将时间序列中的频繁项映射到树中,以降低频繁时序模式的搜索空间,该算法在挖掘过程中不用生成大量的频繁模式候选集,提高了时序关联规则的挖掘效率.  相似文献   

13.
关联规则挖掘方法自提出以来已有很多改进算法,但均局限于布尔关联规则的挖掘.已有的数量关联规则挖掘主要考虑了连续属性值离散化、最优的数量关联规则挖掘等问题,但存在过小支持度和过小置信度问题.研究了这一问题并提出了一个在频繁2-项集的基础上挖掘数量关联规则的改进算法.它不仅可以用于典型的购物篮分析,还可以用于购物篮分析不能完成的关联规则挖掘问题,如带数量的捆绑销售问题.  相似文献   

14.
关联规则挖掘是数据挖掘的主要技术之一,现有的关联规则挖掘算法均基于支持度-置信度框架,当用户调整阈值时存在多次遍历数据库和重复计算问题。该文针对支持度阈值变化时的关联规则维护问题,提出了关联规则交互挖掘算法HIUA,该算法改进了原始IUA算法的剪枝过程,并通过Hash结构提高算法运行效率。在UCI数据集及企业实际财务数据集中的实验结果表明:在支持度阈值发生变化的过程中HIUA算法进一步利用已有挖掘结果,有效提高了关联规则挖掘的效率。  相似文献   

15.
王娟 《科技信息》2011,(33):56-56,45
关联规则是数据挖掘的重要手段,它基于支持度、置信度等对规则进行筛选,生成有用的规则。关联规则反映了大量数据中项集之间的相互依存性和关联性。Apriori算法和FP-Growth算法是关联规则挖掘中的两个典型算法。本文阐述了这两种算法的基本思想、数据挖掘步骤,并讨论了它们的优缺点及差异。  相似文献   

16.
一种基于闭项集的无冗余关联规则挖掘方法   总被引:1,自引:0,他引:1  
针对关联规则挖掘中存在的规则数量过多,难于理解和应用的问题,提出了一种基于闭项集的无冗余关联规则挖掘算法.首先,给出了无冗余关联规则的定义,并基于规则信任度的概念说明了该定义的合理性;其次,在生成子、闭项集和无冗余关联规则的基础上,给出了无冗余最小-最大精确规则基和无冗余最小-最大近似规则基的定义,并讨论了它们的剪枝策略.最后,讨论了生成子的性质及连接策略,并在包含索引的基础上,给出了一种宽度优先的无冗余关联规则挖掘算法.实验结果表明,本文提出的算法不仅可以发现规模较小的无冗余关联规则,提高了挖掘结果的可理解性,而且具有较高的挖掘效率.  相似文献   

17.
通过对Apriori算法的分析,提出了一种关联规则挖掘的改进算法Apriori_Q。该改进算法减少了模式匹配和对数据库访问的次数,理论分析与实验结果表明,Apriori_Q提高了关联规则生成的效率,因而更具有实用价值。  相似文献   

18.
提出了推荐模型中的关联规则挖掘方法的改进,给出了自定义的页面权值的定义,并改进了基于关联图的关联规则挖掘算法,将页面权值应用于关联规则的挖掘中。此算法是利用Web日志中经过预处理后得到的数据进行规则挖掘,将处理后的数据应用正态分布函数来得到页面权值。用页面权值重新计算支持度,最后将得到的支持度应用于改进的规则挖掘算法中,形成一种基于权值的关联图的关联规则算法。  相似文献   

19.
对海量的时间序列进行处理,挖掘其背后蕴涵的价值信息具有重要的意义。本文结合了时序逻辑和数据挖掘的知识对基于FP_树的时序关联规则展开了研究,并在传统的算法基础上提出了一种改进算法。该方法不用生成大量的频繁模式候选集,从而提高了时序关联规则的挖掘效率。  相似文献   

20.
传统的关联规则挖掘框架产生大量的规则,使得人们很难利用它们。本文主要针对项目集进行研究,提出了项目集的上、下闭集的概念,并得到了上、下闭集及其它们之间的一些性质,为解决规则数量问题提供了理论基础。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号