首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
介绍主要的数据匿名保护模型,总结分析基于泛化和隐匿、基于聚类、基于交换和分解的数据匿名化算法的研究成果和存在的问题,指出数据发布的匿名化技术还需要在同质性攻击和背景知识攻击、动态性数据的隐私保护、个性化的隐私保护、数据发布自适应机制、面向应用的隐私保护和多属性数据集的隐私保护等几个方面做进一步的研究。  相似文献   

2.
社会网络数据发布的隐私保护是为了确保数据集中隐私信息的安全.针对社会网络数据发布所面临的隐私保护问题,引入严格的差分隐私保护模型,设计了一种基于马尔科夫算法(Markov cluster algorithm,MCL)并且满足ε-差分隐私的社会网络差分隐私数据发布方法.设计实现了满足ε-差分隐私(MCL differential privacy algorithm,MDPA)算法,以Si为抽样频率,对网络边权重添加满足ε的隐私保护预算,服从拉普拉斯分布的噪声.真实数据集上的实验结果表明,MDPA算法满足用户在社会网络中的差分隐私要求,并提高了数据效用性.  相似文献   

3.
针对权重社会网络发布算法中使用全局统一的ε值而导致隐私保护不均衡的问题,提出一种动态ε社会网络差分隐私保护方法.使用马尔可夫聚类(Markov cluster algorithm,MCL)和Chameleon混合聚类把社会网络图划分成若干个簇,根据每个簇中边的权重信息使用ε函数f(x)来确定簇的ε值,对带有大权重边的簇添加较多的服从拉普拉斯分布的噪声,该方法满足ε-差分隐私模型.实验表明,动态ε使每个簇能添加合适的噪声,比全局统一设定ε值有更好的数据效用性.该方法有效解决了权重社会网络中的隐私保护不均衡问题.  相似文献   

4.
文章提出了一种面向多次发布的数据库隐私保护模型,通过等价类的动态调整来隐藏数据和等价类间的映射关系,降低隐私泄露的风险。利用伪数据调节数据的多样性以满足匿名规则的要求,伪数据亦可作为噪声数据增加攻击者的分析难度,提高隐私保护强度。在UCI数据库上进行的仿真实验结果表明,该模型能够有效减少因多次发布带来的隐私泄露。  相似文献   

5.
针对轨迹数据发布中的隐私保护和数据可用性问题,结合统计学的概念,提出一种基于扰动的轨迹数据隐藏发布方法.首先定义一种隐私泄露检测机制,当该检测机制发现攻击者依赖所掌握部分轨迹能以较大概率推测出某隐私节点时,基于统计方法,寻找出现频率最低的同类隐私节点,若存在且用其替换有隐私泄露风险的隐私节点后不会出现新的隐私泄露,则执行替换操作;否则在拥有该隐私节点的所有轨迹中,选择最佳的那条轨迹,将该隐私节点移除.这样,就能降低隐私节点的隐私泄露概率,保证发布后的轨迹数据满足用户的隐私需求.理论分析和实验结果表明,所提出的方法能有效避免基于部分轨迹推测剩余隐私节点的攻击,有效保持原有轨迹数据中不同种类节点间连接关系的可用性.  相似文献   

6.
一种简单有效的基于密度的聚类分析算法   总被引:1,自引:0,他引:1  
对数据挖掘中基于密度聚类的相关概念和算法进行了讨论,对OPTICS(O rdering Pointers to Iden-tify the C lustering Structure)算法聚类分析的正确性给以了证明。以DBSCAN,OPTICS为基础,提出了一种基于密度的简单有效的聚类算法。新算法主要在ε-邻域查询和种子队列的更新两个方面作了改进,给出了一种简单、效率较高的邻域查询方法-哈希表法,即对整个数据集合或部分数据作网格化处理。测试结果表明新算法能够有效地对大规模数据进行聚类,效率较高。  相似文献   

7.
由于异构数据的发布缺乏灵活性与实用性,提出了一种基于聚类分析的个性化异构数据发布方法.首先综合考虑数据的各种属性,通过聚类标签对数据的集群结构进行编码.另外,通过不断迭代更新原始数据能够始终保留数据的聚类结构,进一步在原始数据中加入噪声从而满足-差分隐私的要求.在满足差分隐私原则的前提下,提出了一种同时处理关系数据和集值数据的不确定性算法,不同类型的数据以类似的方式进行匿名化.通过实验验证了该方法能够有效提升异构数据发布的泛化能力,提升安全性与实用性.  相似文献   

8.
为了进一步均衡噪声误差和均匀假设误差对二维划分发布带来的影响,提出一种新的分层差分隐私位置信息划分发布算法。首先将位置空间聚类形成第一层密度自适应网格,然后对不同性质的密度区块采取不同的二次划分方法,在降低均匀假设误差的同时避免了大量空结点引入的噪声误差。在采用分层划分策略的同时,结合差分隐私模型的串行组合特性,对2个阶段的划分结果添加不同隐私预算的Laplace噪声,总体上实现对发布数据的ε-差分隐私保护。实验证明,该算法在改善区域计数查询精度方面具有较好的效果,能够节省不必要的划分过程,有效提高了算法的运行效率。  相似文献   

9.
目前关于隐私保护数据发布的研究大多是面向低维的关系型数据,其相关模型及算法无法直接用于解决稀疏的高维事务型数据发布中可能存在的隐私泄露问题.本文以剖分技术为基础,设计出一个面向隐私保护事务型数据发布的p-剖分l-多样化匿名算法.算法通过计算事务型数据中属性间的均方列联系数将高维属性集剖分成互不相交的p个属性子集,而后对事务型数据进行记录划分,使记录划分后的事务型数据关于p个属性子集满足l-多样化的要求.实验对匿名前后事务型数据的关联规则挖掘结果进行比较分析.理论分析和实验结果表明,本文的算法可安全地实现事务型数据发布的隐私保护,同时保证发布数据的可用性较高.  相似文献   

10.
缺失数据插补是数据科学中的基本方法之一.本文针对类别型缺失数据提出了一种基于聚类和半参数logisitic学习模型的插补法.该方法首先采用K-近邻法对缺失数据进行预插补,然后用聚类算法将数据分类,提高数据间的相似性,再为每一类数据集建立半参数logistic学习模型,进而完成最后的插补.基于中国家庭金融调查(CHFS)数据集的实证研究表明,该方法优于常用的K-近邻插补法和随机森林插补法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号