首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 484 毫秒
1.
针对现有的层次聚类算法可能存在的隐私数据泄露问题,提出一个面向大规模数据集,且有效保护用户隐私的差分隐私BIRCH算法DP-BIRCH.DP-BIRCH算法依据差分隐私模型并借鉴概率分配思想,基于误差最小原则来调整隐私预算,采用异方差加噪方式,对待发布的CF树加入Laplace噪音.为进一步提高算法的查询精度及可用性,在DP-BIRCH算法的基础上,提出FP-BIRCH算法,同时采用线性回归及迭代运算等方法,解决了DP-BIRCH算法中存在的不一致约束性问题.实验采用两组真实数据集,在不同的隐私预算下,对DP-BIRCH算法和FP-BIRCH算法发布的DP-CF树与FP-CF树进行查询误差比较.实验结果表明,相比DP-BIRCH算法,所提出的FP-BIRCH算法有效可行,且查询精度更高.  相似文献   

2.
针对组结构数据的隐私保护问题,通过随机响应机制,对原始数据进行扰动,开展满足差分隐私的分布式组变量选择研究。首先基于交替方向乘子法,提出了分布式Logistic组变量选择算法。进一步为了防止计算机信息交互过程中可能产生的隐私泄露,提出了分布式Logistic随机响应组变量选择算法,并证明算法满足差分隐私。实验表明,所提算法可有效处理组结构分类数据并保护其隐私。  相似文献   

3.
针对当前社会网络的动态更新速度越来越快,而社会网络中差分隐私保护方法迭代速度慢的问题,提出一种基于B+树索引的动态社会网络差分隐私保护方法.使用B+树索引社会网络图的边,根据差分隐私并行性组合的特点,对B+树的索引数据划分,为数据分配不同的ε并添加拉普拉斯噪声,实现数据隐私后的整体高效用性和局部强保护性;在迭代时利用B+树的高效索引对欲更新的信息快速定位,实现动态社会网络差分隐私保护的快速迭代.实验表明,B+树索引有效提高了动态社会网络差分隐私保护的迭代速度,同时差分隐私的并行性提高了数据的效用性.  相似文献   

4.
针对隐私保护在复杂社会场景下可能面临的问题,提出一种非加密的隐私保护算法.该算法将复杂社会场景抽象成多属性关联模型,通过关联属性分离的方式,将关联隐私的属性组合分离存储于不同的数据块中解决数据隐私保护问题.同时,为了保证数据重构的效率,还提出一种组合关联属性分离算法,达到了在数据隐私保护性能与数据利用效率之间的最大优化.  相似文献   

5.
针对现有云计算加密数据库分类算法的高时间开销问题,提出一种安全有效的基于Yao式乱码电路云计算隐私保护的kNN分类算法,该方法既能保护数据隐私和查询隐私,又能隐藏数据访问模式,同时又能保证高效查询处理的工作。该算法由4部分组成:加密kd树搜索阶段、kNN检索阶段、结果验证阶段和多数类选择阶段。通过加密索引搜索方案来过滤与查询无关的数据,隐藏了最终的类标签和数据访问模式,提高云计算中数据查询处理的效率。通过Yao式乱码电路来支持有效的kNN分类,保护云计算中数据隐私和查询隐私,同时减少了kNN分类的时间开销。对Yao式乱码电路kNN分类方法的安全性进行了分析。实验结果表明,在分类时间方面,所提算法的性能优于现有PPkNN方法和SkNNCI方法。  相似文献   

6.
用户兴趣是随时间变化的,若对推荐系统中所有时间段的数据均采用同等程度的隐私保护,容易引入不必要的噪声,降低数据效用.为此,提出一种基于时间权重因子的差分隐私保护推荐算法.首先,设计时间权重因子,用于衡量数据重要性.然后,根据时间权重因子划分隐私预算,对不同时间段的数据施加不同强度的隐私保护.在此基础上,构建基于差分隐私...  相似文献   

7.
差分隐私在隐私保护中越来越受欢迎,它对具有任意背景知识的敌手可以提供严格的隐私保障。通过添加噪声使数据失真的技术,来起到保护隐私的目的。本文主要研究基于拉普拉斯机制和指数机制下的差分隐私直方图发布问题。机制的选择对隐私数据的发布是至关重要的。其中,Laplace机制适合数值型结果的隐私保护,指数机制运用于对非数值型结果的保护。本文在结构优先算法下,选择以上两种不同机制来实现满足差分隐私的直方图发布。  相似文献   

8.
社交网络在帮助人们建立社会性网络应用服务的同时,收集了大量的用户资料和敏感数据,通过分析这些数据可能泄露潜在的隐私信息.目前差分隐私保护模型对隐私泄露风险给出了严谨、定量化的表示和证明,极大地保证了数据的可用性.设计了一个满足差分隐私保护的社交网络发布图生成模型,首先通过图模型表示社交网络结构,并将原图按照节点特征分类为多个子图;然后利用四叉树方法对子图的密集区域进行划分,在树的叶子节点添加满足差分隐私保护的噪声;通过子图重构的方式,生成待发布图.最后,利用度分布、最短路径、聚类系数等统计分析方法,实验验证了该模型的可行性和有用性.  相似文献   

9.
差分隐私可以有效解决推荐系统的隐私泄露问题,但是其引入的噪声会降低推荐系统的性能.此外,不同用户对隐私保护的敏感性是不同的,考虑用户的个性化需求可以减少加入的噪声,有助于提高推荐系统性能.综合以上两个维度,在考虑用户评分敏感性的基础上,提出了一种个性化的差分隐私保护协同过滤算法.算法在用户本地划分评分的隐私敏感度,并采用随机翻转机制对隐私敏感评分进行隐私保护.服务器获取扰动后的数据,利用贝叶斯估计方法重构项目之间的联合分布以提高算法的推荐准确性.理论和实验结果表明,算法在保护用户隐私安全的同时具有良好的推荐性能.  相似文献   

10.
 模式分类过程涉及到对原始训练样本的学习,容易导致用户隐私的泄露。为了避免模式分类过程中的隐私泄露,同时又不影响模式分类算法的性能,提出一种基于主成分分析(PCA)的模式分类隐私保护算法。该算法利用PCA 提取原始训练数据的主成分,并将原始训练样本集合转化为主成分的新样本集合,然后利用新样本集合进行分类学习。选用Adult 数据集和KDDCUP 99 数据集进行仿真实验,并采用正确率和召回率进行性能评价,结果表明,该隐私保护算法通过PCA 提取原始数据特征属性的主成分,可避免原始属性的泄露,同时PCA 在一定程度上可实现去噪,从而使分类器的分类性能优于原始数据集的分类性能。与已有算法比较,该隐私保护算法具有更好的模式分类精度和隐私保护性能。  相似文献   

11.
基于粗糙集决策树优化研究   总被引:2,自引:0,他引:2  
决策树分类方法是一种有效的数据挖掘分类方法.单变量决策树结构简单,但规模较大.多变量决策树是为了进一步缩减树的规模而提出的决策树结构,通过选取属性的合理组合作为分裂属性,可使树的规模相对较小.文章在对以往所提出的混合变量决策树算法RSH2的抗噪性差和属性被多次选取等问题进行改进的基础上,提出了基于粗糙集的多变量决策树算法VPMDT.通过与ID3、HACRs、RSH2和C4.5等算法进行的实验比较表明,VPMDT有较好的时空性能,并保持较高的分类预测正确率.  相似文献   

12.
为了提升传统随机森林算法的分类精度,本文首先对传统随机森林模型中的决策树根据分类性能评价指标AUC值进行降序排列,从中选取出AUC值高的决策树,计算这些决策树之间的相似度并生成相似度矩阵,然后根据相似度矩阵对这些决策树进行聚类,从每一类中选出一棵AUC最大的决策树组成新的随机森林模型,从而达到提升传统随机森林算法分类精度的目的。通过UCI数据集的实验表明,改进后的随机森林算法分类精度上最大提高了2.91%。  相似文献   

13.
为解决日趋增长的噪声大数据分类问题,提出了一种高度随机模糊森林算法.该算法在决策树学习中生成连续属性的模糊分区,并给出在MapReduce框架中所提算法的分布式实现,用于受属性噪声污染的大数据集中学习模糊决策树的集合,该分布式实现模型可以适应计算的有效分配策略,从而产生良好的可扩展性数据,这种分布式算法使得模糊随机森林能够处理大数据集的学习和分类.高度随机模糊森林算法能够实现噪声大数据的高精度分类,为以后的大数据分析打下良好的基础.实验结果表明,所提算法比现有算法准确率更高,在属性噪声情况下,该文分类准确率也高于随机森林算法,说明该文算法的可行性和有效性.  相似文献   

14.
我国网络隐私权法律保护存在的问题及对策   总被引:1,自引:0,他引:1  
随着计算机技术的飞速发展和互联网技术的迅速普及,侵犯网络隐私权的问题和矛盾日益突出,网络隐私权的法律保护成为当务之急。我们应综合考虑目前的立法状况和网络时代侵犯隐私权的特征,借鉴他国的先进经验并结合我国具体国情,完善我国网络隐私权立法,全面保护公民的网络隐私权。  相似文献   

15.
针对目前大数据缺乏群组隐私保护的问题,提出一种基于二分关联图的大数据群组隐私保护方法,在不同群组隐私层级的二分关联图中保护数据隐私。所提算法通过关联图分层(association graph layering, AGL)和层级群组差分隐私(hierarchical group differential privacy, HGDP),实现发布大数据的群组隐私保护。关联图分层将给定关联图的节点和边分组,通过划分二分关联图的节点最小化每个层级的敏感度,可以向不同权限的用户公开不同层级的子图;在层级群组差分隐私过程中,对不同层级选择灵敏度并计算方差,重复聚合噪声减少方差,通过高斯机制进行子图噪声注入,实现分层关联图的扰动,以保证每个层级的群组隐私。实验结果表明,所提方法可以用来保护群组数据的综合敏感信息,并且比其他方法具有更好的隐私保护效果和更高的数据可用性。  相似文献   

16.
姿态估计是自然人机交互最为重要的环节,人体部件识别是姿态估计的重要步骤。本文介绍了一种基于特征预筛选的改进的随机森林的方法来识别人体各个部件。与传统的随机森林构造不同,在该方法中,对于特征空间十分庞大的实例给出了特征预筛选方法,使得每个分裂节点的特征子集更为高效。该方法既保证了树与树之间的独立,又保证了每棵树的分类性能。在树与树之间的组合中,根据人体部件构造,引入了和分层树的组合模型方式,提高了差异较小类的分类性能,进而提高了森林的准确性。  相似文献   

17.
基于Rough集的决策树算法   总被引:1,自引:0,他引:1  
针对基于Rough集的经典分类算法值约简算法等不适合大数据集的问题,提出了基于Rough集的决策树算法。采用一个新的选择属性的测度——属性分类粗糙度作为选择属性的启发式,该测度较Rough中刻画属性相关性的测度正区域等更为全面地刻画了属性分类综合贡献能力,并且比信息增益和信息增益率的计算更为简单。采取了一种新的剪枝方法——预剪枝,即在选择属性计算前基于变精度正区域修正属性对数据的初始划分模式,以更有效地消除噪音数据对选择属性和生成叶节点的影响.采取了一种与决策树算法高度融合的简单有效的检测和处理不相容数据的方法,从而使算法对相容和不相容数据都能进行有效处理。对UCI机器学习数据库中几个数据集的挖掘结果表明,该算法生成的决策树较ID3算法小,与用信息增益率作为启发式的决策树算法生成的决策树规模相当。算法生成所有叶节点均满足给定最小置信度和支持度的决策树或分类规则,并易于利用数据库技术实现,适合大数据集。  相似文献   

18.
针对目前的轨迹聚类隐私保护方法仍然存在适用性较窄、可用性较低以及难以在实际应用中实施的问题,提出了支持轨迹聚类的差分隐私保护方法,首先给出了典型轨迹聚类算法的通用框架模型及其差分隐私定义,然后根据定义设计满足差分隐私机制的二维拉普拉斯噪声,最后将直角坐标系中得到的噪声形式变换到极坐标系,并加入到原始轨迹点中以进行实际应用实现.实验结果表明,本文算法具有更好适用性,与当前的轨迹聚类隐私保护方法相比,在相同保护强度下,本文算法具有更好的聚类效果.  相似文献   

19.
传统的无线传感器网络位置隐私保护算法没有很好地实现安全性与网络能耗之间的均衡.为了解决这个问题,提出了一种基于扇形区域的随机中继节点路由算法,通过调整扇形区域的大小来控制路由路径的范围,并采用随机选取扇形子区域作为下一跳路由节点可选区域的机制来实现源节点的位置隐私保护.仿真实验结果表明,与幻影路由等其他路由算法相比,所提的路由算法可以在不影响数据投递率的前提下,有效地保护源节点的位置隐私,网络能耗较少.同时,该算法具有较好的灵活性,用户可根据实际需求设置高安全性或低能耗模式.  相似文献   

20.
在智能电网的数据采集监测中,针对用户隐私泄露安全隐患问题,采取加噪为主的方式来实现隐私保护。提出一种基于多维分解的拉普拉斯噪声算法(MDLN,multidimensional laplacian noise algorithm),该算法将原始测量值分解成多维数据,并根据各维度的隐私敏感度,自适应决定需添加的拉普拉斯噪声幅度,通过有效的噪声扰动方式实现差分隐私。通过与SLN(simple laplacion noise algorithm)算法ULN(uniform laplacian noise algorithm)算法相比较,仿真表明,MDLN算法的隐私保护强度较高,且效能更高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号