首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
为了解决聚类挖掘中隐私保护问题,提出一种基于随机投影的数据扰动方法.该方法首先生成投影矩阵,然后根据生成的投影矩阵对数据进行对称扰动,使得扰动后的数据和原数据在维数、聚类形状等多方面均有较大的不同,能很好地保护隐私信息,且扰动后的数据可用性较高,具备一定的抗攻击性.实例验证了所提算法的有效性.  相似文献   

2.
针对可还原数据扰动(retrievable general additive data perturbation,RGADP)算法在保护数据库隐私时会影响数据挖掘结果的问题,提出一种利用贝叶斯原理在扰动数据上进行分类的方法。该方法分析RGADP算法过程,利用贝叶斯原理,根据扰动数据推算原始数据的概率分布,用估算的概率分布重构数据,并对重构数据进行分类以提高分类的正确性。实验结果表明:该方法估算出的概率分布与原始数据概率分布接近,且重构数据的分类正确率相比扰动数据而言平均可提高4%以上,其更接近原始数据的分类正确率,从而有效地降低了扰动算法对数据分类的影响;该方法的运行时间与数据量和数据分组数成正比,重构10 000条数据的运行时间在200ms以内,因此该方法也具有较高的效率。  相似文献   

3.
为了提高高维数据集合离群数据挖掘效率,在分析了传统的离群数据挖掘算法优点和缺点的基础上,提出了一种离群点检测算法,首先将非线性问题转化为高维特征空间中的线性问题,然后利用非线性数据变换进行维数约减,对所得数据对象每个投影分量逐个判断数据点是否是离群点,通过实验证明该算法不仅可用于线性可分数据集的离群点检测,而且可用于线性不可分数据集的离群点检测,表明了算法的优越性。  相似文献   

4.
目前关于隐私保护数据发布的研究大多是面向低维的关系型数据,其相关模型及算法无法直接用于解决稀疏的高维事务型数据发布中可能存在的隐私泄露问题.本文以剖分技术为基础,设计出一个面向隐私保护事务型数据发布的p-剖分l-多样化匿名算法.算法通过计算事务型数据中属性间的均方列联系数将高维属性集剖分成互不相交的p个属性子集,而后对事务型数据进行记录划分,使记录划分后的事务型数据关于p个属性子集满足l-多样化的要求.实验对匿名前后事务型数据的关联规则挖掘结果进行比较分析.理论分析和实验结果表明,本文的算法可安全地实现事务型数据发布的隐私保护,同时保证发布数据的可用性较高.  相似文献   

5.
针对隐私保护在复杂社会场景下可能面临的问题,提出一种非加密的隐私保护算法.该算法将复杂社会场景抽象成多属性关联模型,通过关联属性分离的方式,将关联隐私的属性组合分离存储于不同的数据块中解决数据隐私保护问题.同时,为了保证数据重构的效率,还提出一种组合关联属性分离算法,达到了在数据隐私保护性能与数据利用效率之间的最大优化.  相似文献   

6.
针对轨迹数据发布中的隐私保护和数据可用性问题,结合统计学的概念,提出一种基于扰动的轨迹数据隐藏发布方法.首先定义一种隐私泄露检测机制,当该检测机制发现攻击者依赖所掌握部分轨迹能以较大概率推测出某隐私节点时,基于统计方法,寻找出现频率最低的同类隐私节点,若存在且用其替换有隐私泄露风险的隐私节点后不会出现新的隐私泄露,则执行替换操作;否则在拥有该隐私节点的所有轨迹中,选择最佳的那条轨迹,将该隐私节点移除.这样,就能降低隐私节点的隐私泄露概率,保证发布后的轨迹数据满足用户的隐私需求.理论分析和实验结果表明,所提出的方法能有效避免基于部分轨迹推测剩余隐私节点的攻击,有效保持原有轨迹数据中不同种类节点间连接关系的可用性.  相似文献   

7.
随着人们对隐私权的越来越重视,隐私保护数据挖掘成为当前研究热点.分类算法作为一个重要的数据挖掘方法被应用到各个领域,其中支持向量机(SVM)是分类算法中一个重要方法.并且数据的隐私性和安全性是人们关注的重点.本文对SSP协议进行扩展提出了一个基于垂直分布数据的隐私支持向量机算法,这个算法具有更高的效率和更好的安全性.  相似文献   

8.
由于数据量的不断增长,出现了大量的不平衡高维数据,传统的数据挖掘分类算法在处理这些数据时,易受到样本分布和维数的影响,存在分类性能不佳的问题.提出一种针对不平衡高维数据集的改进支持向量机(Supported Vector Machine,SVM)分类算法,首先通过核函数将数据集映射到特征空间中,再引入改进的核SMOTE(Kernel Synthetic Minority Over-sampling Technique)算法而得到正类样本,使两类样本数目平衡化;然后将维数高的数据集通过稀疏表示的方法投影到低维的空间中,实现降维;最后根据空间的距离关系来确定在输入空间中合成样本的原像,再对得到的平衡样本集通过SVM来分类,通过仿真实验验证了该算法对于高维不平衡数据集有较优的分类性能.  相似文献   

9.
差分隐私可以有效解决推荐系统的隐私泄露问题,但是其引入的噪声会降低推荐系统的性能.此外,不同用户对隐私保护的敏感性是不同的,考虑用户的个性化需求可以减少加入的噪声,有助于提高推荐系统性能.综合以上两个维度,在考虑用户评分敏感性的基础上,提出了一种个性化的差分隐私保护协同过滤算法.算法在用户本地划分评分的隐私敏感度,并采用随机翻转机制对隐私敏感评分进行隐私保护.服务器获取扰动后的数据,利用贝叶斯估计方法重构项目之间的联合分布以提高算法的推荐准确性.理论和实验结果表明,算法在保护用户隐私安全的同时具有良好的推荐性能.  相似文献   

10.
传统的基于向量的降维算法需要将图像数据进行向量化处理。然而,向量表示难以考虑数据各维度上的变化,容易丢失有效的结构信息和判别信息。为此,从数据的张量表示出发,将新近提出的稀疏保持投影方法(sparsity preserving projections,SPP)推广到张量空间中,提出了基于张量的稀疏保持投影降维方法。该方法可直接将图像数据作为张量目标进行运算,保留了数据的完整性以及数据的原始结构和判别信息。降维的同时保持了原始张量空间中数据样本的稀疏重构信息。人脸数据库的识别实验结果表明,基于张量的稀疏保持投影降维方法能有效地提高识别率。  相似文献   

11.
数据挖掘是近年来随着人工智能和数据库技术的发展而出现的运用比较频繁的技术.它是从大量数据中筛选出隐含的、可信的信息的一种处理过程.在筛选的过程中,对数据的隐私保护便成了一个大的问题.本文针对隐私保护关联规则数据挖掘中的MASK挖掘算法进行了分析,就MASK算法在求频繁项集中涉及到的矩阵求逆问题上提出了两种改进的算法,通过实验表明,有效地提高了传统MASK算法的运行时间.  相似文献   

12.
面向相关多敏感属性的隐私保护方法   总被引:1,自引:0,他引:1  
将现有的敏感属性隐私保护方法直接应用于相关多敏感属性的隐私保护中会导致隐私数据的泄漏。本文借鉴有损连接对隐私数据进行保护的思想,对表中的记录进行聚类,保证了关系表中的记录按敏感等级划分。其次,对已划分的记录按照频率比较策略进行分组,提出了一种基于聚类的相关多敏感属性数据分组算法。实验结果表明该算法可以有效地防止隐私泄露,增强了数据发布的安全性。  相似文献   

13.
扰动技术是社交网络隐私保护的重要方法,本文提出了高斯随机扰动和贪心扰动两种扰动算法保护社交网络的权值,分别适用于动态和静态社交网络。高斯随机扰动可以简单有效地保护动态社交网络的权值隐私,贪心扰动算法将社交网络的边分类,可以在保护静态社交网络权值隐私的同时保证社交网络的最小生成树不变,提高社交网络数据的可用性。实验结果表明两种算法均能有效保护社交网络的权值安全,并且保持较高的数据可用性。  相似文献   

14.
度量学习是机器学习中的重要研究问题之一,针对实际应用中的噪声数据,如何建立一个鲁棒的度量仍是一个挑战.本文将稀疏表示、特征学习与分类模型相结合提出了一种新的基于鲁棒回归度量学习(RRML)的算法并将其应用于图像分类.算法对最优特征子空间和稀疏表示进行联合学习,在更具判别性的低维表征空间中,通过稀疏表示有效地编码数据的局部结构信息,进而更好地揭示数据的内在鉴别信息,并以此指导该模型学习到最优的投影矩阵;同时对噪声矩阵和投影矩阵的行稀疏约束,可以极大降低噪声的影响.实验结果表明所提算法在图像分类准确率和鲁棒性方面均优于其他对比算法.  相似文献   

15.
隐私保护是当前数据挖掘领域中一个十分重要的研究方向,其目的是要在不精确访问真实原始数据的条件下,得到准确的模型和分析结果.为了提高对隐私数据的保护程度和挖掘结果的准确性,研究了一种基于向量点积的分布式关联规则挖掘算法.此算法在分布式环境下,利用保持隐私数据挖掘的基本方法和安全两方计算协议,可以在不泄露任何隐私的基础上有效地对垂直型数据分布进行挖掘.  相似文献   

16.
在数据挖掘隐私保护进行协作数据分析时,部分数据集可能分属不同的数据对象,处理时就需要采取不同的数据失真方法.提出了一组全新的数据失真优化策略,通过将属性划分与奇异值分解法(SVD)、非负矩阵因子分解法(NMF)、离散小波变换法(DWT)相结合,运用4种方案对隐私保护原始数据集的子矩阵进行扰动,并用一些衡量指标来衡量这些策略的效果;利用基于支持向量机(SVM)的二元分类来进行数据实用性的检测.结果表明与数据失真单策略相比,新提出的方案在实现数据隐私和数据实用性的良好平衡方面效果十分显著,为协作数据分析提供了可行性解决方案.  相似文献   

17.
设计隐私保护策略本体,提出一个基于智能体和本体的数据集成的架构,包括知识浏览器、全局本体、局部本体、映射和上下文、隐私保护知识库、隐私策略本体、数据挖掘本体、数据挖掘智能体、集成智能体等,可在保护用户隐私的基础上有效地实现分布异构环境的语义数据集成.并介绍了一个反洗钱领域隐私保护数据集成的实例.  相似文献   

18.
针对高维数据出现的"维灾"、稀疏性问题及各属性维自身具有的特点,采用高斯混合模型定义的相关子空间,给出一种投影聚类分析算法。首先,采用KNN,得到各个数据对象的局部数据集LDS,并引入稀疏因子生成稀疏度矩阵,而后依据高斯混合模型和稀疏度矩阵,识别出相关子空间和不相关子空间;其次,根据相似性度量,剔除稀疏数据和无关属性维,并利用K-means算法形成聚类簇;最后,采用UCI数据集,验证了该算法的有效性与准确性。  相似文献   

19.
对隐私保护数据挖掘算法进行了深入研究和分析。总结出目前研究的缺点,提出了一种新的K均值数据挖掘的隐私保护算法,通过与已有隐私保护算法的比较,在保证不减少隐私强度的情况下,提高了挖掘的精度。  相似文献   

20.
针对智能电网中的大数据安全和隐私保护问题,梳理了当前智能电网大数据安全与隐私保护关键技术,按照保护隐私的智能电网大数据分析挖掘技术路线,提出一种保护隐私的智能电网关联规则挖掘方案,即使用简单的加法秘密共享方案,加密和发送电表数据给可信第三方,并在安全聚合协议下汇总电表数据,使用安全多方计算关联规则的支持度和置信度。保护隐私的智能电网大数据挖掘使得电力公司在不泄露客户隐私信息的前提下,能够提高服务质量。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号