首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 390 毫秒
1.
轨迹数据的发布能够为政府部门进行城市规划或商业机构进行决策制定提供有力支持,但存在着严重的隐私泄露风险。在现有的基于差分隐私机制的轨迹发布技术基础上,提出以TFIDF统计值作为参考指标的AC_TFIDF算法。该算法符合差分隐私的定义并能够动态确定轨迹中不同时刻的泛化程度;在泛化过程中,用距离聚类中心最近的有效点替换聚类中心,进一步提高发布数据的可用性。通过在真实数据集上的验证与分析,表明了该算法具有较好的效用性。  相似文献   

2.
为了解决数据发布过程中存在的隐私泄露问题,同时保持数据在数据挖掘和数据分析等方面的良好可用性,提出了一种基于身份替代的隐私保护方法.一方面,该方法通过用虚拟身份替代原始身份的方式,保证数据的原始身份不出现在公开数据中,进而保护隐私信息;另一方面,总结并提出了数据身份和数据特征两个概念,并设计了数学模型来衡量数据的身份相似度和特征相似度,保证虚拟身份保留原始数据的特性.最后,从数据可用性、隐私泄露风险和时间复杂度3个方面对该方法进行了测试,实验结果表明该方法可以保护隐私信息,同时能有效保持数据的可用性.  相似文献   

3.
现有的差分隐私轨迹发布方法在存储轨迹序列特征时未充分考虑轨迹位置点前后的关联关系,查找序列特征较慢,轨迹重构的效率较低;另外,现有方法未充分捕获轨迹的时空特征,重构的轨迹数据可用性较差.为此,提出一种基于前缀邻接表的高可用性差分隐私轨迹发布方法.该方法在轨迹序列特征存储时采用了一种新的数据结构——前缀邻接表,该表记录了轨迹位置网格的轨迹前缀计数信息及下一位置网格的存储位置,有利于轨迹重构阶段的候选网格概率的计算,提高了轨迹重构效率.同时,该方法结合k阶马尔科夫链与目的地分布选取网格,在网格内采用了基于密度的位置点选择策略,进而重构出可用性更高的轨迹.实验结果表明,在同等隐私保护水平下,提出的方法在效率和数据可用性方面均优于现有的方法.  相似文献   

4.
为提高发布轨迹数据的隐私保护程度和数据可用效率,提出了一种基于最小支持度的轨迹数据隐私保护方法support-set.在满足最小支持度的条件下,使用距离最近的归纳化集合代替真实的位置点,通过最小化原始轨迹数据库和匿名化处理后的轨迹数据库之间的距离,能够保护用户的隐私信息和提高数据的可用性.最后,通过实验验证了提出方法的...  相似文献   

5.
针对面向聚类的数据隐私发布问题,基于密度可达邻域的概念,提出一种面向聚类的隐私保护模型PPC(r,ε,h).该模型通过要求隐藏后所有数据记录在ε内密度可达(r相关)的近邻数不小于h,以避免可能出现的近邻攻击.进一步提出密度可达安全邻域概念,对不满足模型要求的邻域,采用平移近邻的数据隐藏方法进行处理,保证发布后数据集满足模型约束.并利用邻域价值和邻域相似性的概念,对平移过程进行优化.理论分析和实验结果表明,基于PPC(r,ε,h)隐私模型设计的数据隐藏方法,能有效维持原数据集中数据点在各聚簇中的分布,且兼顾了发布后数据的聚类可用性和数据安全性.  相似文献   

6.
针对现有的层次聚类算法可能存在的隐私数据泄露问题,提出一个面向大规模数据集,且有效保护用户隐私的差分隐私BIRCH算法DP-BIRCH.DP-BIRCH算法依据差分隐私模型并借鉴概率分配思想,基于误差最小原则来调整隐私预算,采用异方差加噪方式,对待发布的CF树加入Laplace噪音.为进一步提高算法的查询精度及可用性,在DP-BIRCH算法的基础上,提出FP-BIRCH算法,同时采用线性回归及迭代运算等方法,解决了DP-BIRCH算法中存在的不一致约束性问题.实验采用两组真实数据集,在不同的隐私预算下,对DP-BIRCH算法和FP-BIRCH算法发布的DP-CF树与FP-CF树进行查询误差比较.实验结果表明,相比DP-BIRCH算法,所提出的FP-BIRCH算法有效可行,且查询精度更高.  相似文献   

7.
为了解决某类风湿性关节炎与致病基因单核苷酸多态性(Single-Nucleotide Polymorphism,SNP)的相关度研究中,针对病人隐私保护强度与数据可用性的权衡问题,提出一种新型的基于经验小波变换(Empirical Wavelet Transform,EWT)的隐私保护方法.该方法通过对差分隐私加噪机制产生的数据进行EWT变换和分解,然后计算各EWT分量的峭度值并筛选出可能的噪声分量,去除一定的噪声分量后对信号进行重构得到新数据,基于该数据进行致病基因相关度排序.实验结果表明使用该方法能在保证差分隐私保护强度的情况下提高数据可用性,实现了隐私保护强度与数据可用性的合理权衡.  相似文献   

8.
当前许多隐私保护技术主要针对静态社交网络.然而,由于数据连续发布,动态社交网络也存在隐私泄露问题.为了防范敌人的攻击,引入一种新的动态隐私保护方法,称为动态kw重结构多样性匿名法kw-SDA.该方法通过对个体分组保护,将连续发布数据时结点/社区身份的泄露概率限制为1/k.然后,提出一种可以实现动态kw-SDA算法的可拓展启发式算法.该算法可根据前w-1次发布的数据对图形进行匿名化处理,使图形改动最小化.此外,通过引入CS表,该算法可以逐渐汇总连续数据发布时的结点信息,避免了匿名化处理时扫描发布的所有数据.评估结果表明,该方法既能保护网络的大部分特征,又能有效保护隐私.  相似文献   

9.
针对基于位置服务中连续查询可能存在的隐私泄露问题,提出基于历史轨迹的连续查询隐私保护匿名算法.首先针对传统基于贪心策略的两条轨迹匿名算法无法保证全局最小轨迹扭曲度的不足,设计出可保证全局最优的两条轨迹匿名动态规划算法,找出历史轨迹与连续查询所对应的基轨迹之间的最优配对方案;然后在此基础上提出可有效保护连续查询隐私的轨迹匿名算法.对本文算法与同类算法在发布轨迹数据质量上进行实验比较分析,仿真实验结果表明本文算法是有效可行的.  相似文献   

10.
在数据发布过程中,如果对发布的敏感属性信息不进行任何保护处理而直接发布,容易遭受攻击导致隐私信息泄露.针对传统的单敏感属性隐私保护方法在多敏感属性中不能得到很好的隐私保护效果,提出了一种基于多敏感属性相关性划分的(m,l)-匿名隐私保护模型.利用信息增益法对多敏感属性的相关性进行计算并划分,降低敏感属性维度;根据(m,l)-diversity原则对敏感属性分组,保证发布的数据能防止偏斜性攻击,并且在一定程度上降低背景知识攻击的风险;采用聚类技术实现该模型,减小该模型产生的附加信息损失和隐匿率,确保发布的数据具有较高的可用性.实验结果表明,基于多敏感属性相关性划分的(p,l)-匿名隐私保护模型具有较小的附加信息损失和隐匿率,保证了发布数据的可用性.  相似文献   

11.
近些年来,基于位置系统的设备越来越多,从而导致用户的大量位置信息被移动设备获取并利用,从数据挖掘的角度来说,这些数据具有不可估量的价值,但从个人隐私方面来说却恰恰相反,每个人都不希望自己的信息被泄露和利用,从而引发了人们强烈的隐私关注.目前许多文献都提出了隐私保护技术来解决这个问题,概括来说是干扰、抑制和泛化几大类.为了对个人时空数据的隐私进行保护,本文提出了κ-泛化的方法.对用户可能出现的点进行范围限定,更好地提高了数据的可用性;对泛化节点的选取要使得用户的安全性最高;考虑了多个敏感节点存在情况下的解决方案,并且出于提高数据效用的目的对多个敏感节点进行了优化.最后通过实验评估了算法的性能并且验证了算法保护个人隐私是有效的.  相似文献   

12.
针对集值型数据动态发布中添加噪音量过大、运行时间长、数据可用性低的问题,提出一种基于Diffpart算法的发布算法。该算法首先将数据集按Diffpart算法构造分类树;而后,利用随机抽样法对分类树节点进行抽样,并对抽样节点对应数据统计值应用差分隐私机制添加噪声,非抽样节点对应数据统计值直接发布。最后,随机生成移位数对抽样点进行调整,实现后续数据的动态发布。实验证明动态发布算法在保护性和实用性上均达到了理想效果。  相似文献   

13.
针对关系型数据中多维敏感属性隐私差异所引起的隐私保护效用降低问题,提出了一种能有效表达多维敏感属性隐私差异的隐私保护数据发布方法.基于一种多维桶分组技术(MSB)对数据集的多维敏感属性隐私差异以及记录价值进行量化区分,给出记录分组优先级参数的计算方法,进而可实现基于记录分组优先级参数多维桶记录分组(TPSB)算法的隐私保护数据发布.实验结果表明:在权重参数合理赋值条件下,该方法在保证数据发布效率的同时可有效提升数据发布的质量.  相似文献   

14.
针对连续位置服务查询的隐私问题,提出一种面向位置相关性的差分扰动机制.首先,提出攻击者差分隐私度量模型,量化可用性泄露在时序相关性中导致的隐私风险.其次利用差分隐私中的Laplace扰动构建噪音查询矩阵和基于距离的可用性扰动机制,抵抗基于查询矩阵的数据分析攻击.最后,利用真实数据集实验分析,结果显示本方案提供了更好的隐私保证.  相似文献   

15.
针对目前大数据缺乏群组隐私保护的问题,提出一种基于二分关联图的大数据群组隐私保护方法,在不同群组隐私层级的二分关联图中保护数据隐私。所提算法通过关联图分层(association graph layering, AGL)和层级群组差分隐私(hierarchical group differential privacy, HGDP),实现发布大数据的群组隐私保护。关联图分层将给定关联图的节点和边分组,通过划分二分关联图的节点最小化每个层级的敏感度,可以向不同权限的用户公开不同层级的子图;在层级群组差分隐私过程中,对不同层级选择灵敏度并计算方差,重复聚合噪声减少方差,通过高斯机制进行子图噪声注入,实现分层关联图的扰动,以保证每个层级的群组隐私。实验结果表明,所提方法可以用来保护群组数据的综合敏感信息,并且比其他方法具有更好的隐私保护效果和更高的数据可用性。  相似文献   

16.
为了解决聚类挖掘中隐私保护问题,提出一种基于随机投影的数据扰动方法.该方法首先生成投影矩阵,然后根据生成的投影矩阵对数据进行对称扰动,使得扰动后的数据和原数据在维数、聚类形状等多方面均有较大的不同,能很好地保护隐私信息,且扰动后的数据可用性较高,具备一定的抗攻击性.实例验证了所提算法的有效性.  相似文献   

17.
社交网络在帮助人们建立社会性网络应用服务的同时,收集了大量的用户资料和敏感数据,通过分析这些数据可能泄露潜在的隐私信息.目前差分隐私保护模型对隐私泄露风险给出了严谨、定量化的表示和证明,极大地保证了数据的可用性.设计了一个满足差分隐私保护的社交网络发布图生成模型,首先通过图模型表示社交网络结构,并将原图按照节点特征分类为多个子图;然后利用四叉树方法对子图的密集区域进行划分,在树的叶子节点添加满足差分隐私保护的噪声;通过子图重构的方式,生成待发布图.最后,利用度分布、最短路径、聚类系数等统计分析方法,实验验证了该模型的可行性和有用性.  相似文献   

18.
为解决数据共享应用中的隐私保护问题和提高数据共享的可用性,提出一种以用户为中心的隐私保护模型.在该模型中,用户可以通过关键字和特征的选取对隐私信息进行自主设置,并采用基于信任的方法来确定共享数据对象可获得的隐私量.当共享数据中包含的隐私量超过共享对象可获得的范围后,通过替换的方法来保护用户隐私.仿真实验表明,对比基于访...  相似文献   

19.
在社会网络数据被大量收集和发布的过程中存在隐私信息泄露的情况,社会网络隐私保护问题引起了人们的关注。本文针对单一方式的社会网络隐私保护方法中数据损失程度较大及数据可用性较低等方面问题,优化了k-同构算法和随机化算法,设计基于k-同构和局部随机化的隐私保护方法。实验结果表明:本文方法可以有效减少信息损失,保护用户隐私信息,对于衡量图谱中的调和平均最短距离、子图中心度2个方面均有较好效果,提高了发布数据可用性,可以抵御图结构信息背景知识再识别攻击。  相似文献   

20.
在社交网络信息传播过程中,信息转发在用户之间广泛使用,但是存在着隐私信患在信息发布者未授权的情况下遭到泄露的问题.预测发现隐私信息泄露节点,对杜绝该类安全隐患具有重要意义.该文针对隐私信息泄露节点预测问题,提出了一种基于估计器的分布式学习自动机的信任推断(EDLATrust)算法,该算法能够推断社交网络中非直连节点之间...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号