首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
随着电子商务,电子政务等各种网络应用的不断发展,数据挖掘中的隐私保护问题近年来引起人们的广泛关注,并成为一个急待解决的问题。本文介绍了当前数据挖掘隐私保护技术的发展现状,着重介绍了几种关键隐私保护技术的特点。在此基础上对隐私保护技术进行了综合对比与分析,提出了隐私保护技术未来的研究方向。  相似文献   

2.
一种基于语义网技术和本体的数据集成方法   总被引:2,自引:0,他引:2  
研究语义网技术在数据集成中的应用方法。采用规则系统实现对语义网本体语言的扩展,以提高本体语言的表达能力。在此基础上将语义网相关技术系统地应用到数据集成系统的各个方面,包括数据采集、本体构建、本体映射、数据查询和数据持久化。通过一个实例,展示了上述方法的可行性。  相似文献   

3.
为了给高考制度改革提供科学合理的依据,招生考试管理部门向高校或科研机构提供考生数据进行挖掘研究,同时,希望采取一系列措施对考生数据进行预处理,防止考生隐私泄露.通过关联规则数据挖掘算法对高考数据进行分析,揭示高考数据背后隐藏的关联关系,尽量避免发布一些不是很重要且与敏感属性关系不密切的信息,不仅可以减少隐私保护算法的运算量,而且能够降低攻击者通过其它渠道数据逆推隐私信息的可能性,从而降低隐私泄露风险.实验表明,方法简单可行,可为数据提供机构提供有价值的参考.  相似文献   

4.
近年来,信息技术发展迅速,且被广泛应用到信息、通讯、工业生产、企业营销等社会生产、生活的各个领域。作为信息技术的重要组成部分,数据挖掘技术不仅关系着人们对各类信息数据的收集和利用情况,而且对于信息技术的整体发展也具有重要的影响。为了使信息技术下人们的隐私得到更好的保护,该文从数据挖掘技术的角度出发,通过对数据挖掘技术的相关概念进行分析,在结合其在隐私保护方面技术分类的基础上,对基于隐私保护的数据关联规则挖掘展开了深入研究。  相似文献   

5.
贾利锋 《创新科技》2017,(12):80-84
大数据的分析挖掘技术实现了散乱数据的潜在价值,也让人们的个人隐私面临威胁。大数据背景下的个人隐私分散隐匿于海量数据中,各数据间相互关联。数据化的个人隐私具有商业价值,促进了个人数据的挖掘。数据主体隐私保护意识欠缺,除了被动的隐私泄露,还有"数据化表演"的自我隐私披露。大数据背景下,个人隐私保护首先要明确立法,划分权责,加强对大数据产业运营的监管;其次,建立信息生态系统,模拟自然界的规律,为大数据的有序开发共享制定法则;同时还要提高用户对个人数据自我披露后果的预见性,有意识地防范个人隐私泄露。  相似文献   

6.
基于本体的XML数据源语义集成研究   总被引:2,自引:0,他引:2  
提议了一个基于本体的XML数据源语义集成方法,为每个参与集成的XML文档产生一个局部RDF本体,合并局部本体的结果产生一个全局本体.全局本体统一查询访问并在后台局部XML数据源之间建立语义关系,在全局本体上的查询通过从RDF查询到XML查询的转换被处理.  相似文献   

7.
Mangasarian在数据垂直分布的线性规划的隐私保护算法中,采用一个随机矩阵将原始的线性规划问题转化成了一个安全的线性规划问题.但是,当这个随机矩阵不可逆的时候,原始线性规划问题和安全线性规划问题是不等价的.针对这种情况,采用一个可逆随机矩阵,将原始线性规划问题转化成了一个等价的安全的线性规划问题.实验结果表明,用本文算法求得的结果与用原始线性规划求得的结果比较接近,并且随着λ的增大,求得的结果的准确率也随着提高.  相似文献   

8.
目前生物学研究十分依赖生物数据的有效性和可靠性.为了构建新的生物知识,来自不同数据源的生物数据必须集成.本文首先介绍了主要的语义网技术及其在生物学数据集成中的应用.接着分析了由于生物学数据的特殊性,语义网技术在生物学数据集成中也面临了一些挑战.最后指出了语义网技术在生物学数据集成方面研究的方向.  相似文献   

9.
目前生物学研究十分依赖生物数据的有效性和可靠性。为了构建新的生物知识,来自不同数据源的生物数据必须集成。本文首先介绍了主要的语义网技术及其在生物学数据集成中的应用。接着分析了由于生物学数据的特殊性,语义网技术在生物学数据集成中也面临了一些挑战。最后指出了语义网技术在生物学数据集成方面研究的方向。  相似文献   

10.
随着人们对隐私权的越来越重视,隐私保护数据挖掘成为当前研究热点.分类算法作为一个重要的数据挖掘方法被应用到各个领域,其中支持向量机(SVM)是分类算法中一个重要方法.并且数据的隐私性和安全性是人们关注的重点.本文对SSP协议进行扩展提出了一个基于垂直分布数据的隐私支持向量机算法,这个算法具有更高的效率和更好的安全性.  相似文献   

11.
为了兼顾共享位置数据的可用性和隐私保护需求,针对第三方收集的用户共享位置信息,提出了一种基于差分隐私的LBS用户位置隐私保护方案.首先,对共享位置数据集进行预处理,使用字典查询方式构建位置事务数据库,采用Trie树结构存储位置数据和频率,提高查询效率,减少加噪次数;其次,在Trie树上进行频繁位置选取,并使用差分隐私下...  相似文献   

12.
时贵英 《科学技术与工程》2011,18(18):4223-4227
针对当前数据集成方法只能精确到属性级映射的缺陷,提出了基于数据元的数据集成方法。用数据元语义树对实体属性概念的内涵进行语义描述,使实体属性的语义能被计算机理解。然后通过语义计算实现精确到实例级的语义映射,从而完成数据集成。  相似文献   

13.
云计算是当前IT领域正在发生的深刻变革,它在提高使用效率和降低使用成本的同时,带来了极大的安全挑战,其中隐私保护问题首当其冲。分析了云计算中隐私风险产生原因,指出了云计算中隐私保护应解决的关键问题,回顾并总结了当前国内、外在云隐私保护领域的主流技术及研究现状,探讨了云隐私保护领域仍然存在的问题并对未来研究方向进行了展望。  相似文献   

14.
目前基于信任的隐私保护方法将信任等级与隐私信息敏感等级简单进行映射以控制隐私信息的披露,所以不能反映信任和隐私信息的动态性和上下文相关性等特点。为解决此问题,提出一个基于信任的信息流模型,并分析证明了该模型是合理和安全的。结合该模型和隐私信息访问粒度控制,进一步提出了一种基于信任和信息流模型的隐私保护方法,该方法将信任运用在隐私保护中,能有效实现对隐私信息安全的保护。  相似文献   

15.
针对目前大数据缺乏群组隐私保护的问题,提出一种基于二分关联图的大数据群组隐私保护方法,在不同群组隐私层级的二分关联图中保护数据隐私。所提算法通过关联图分层(association graph layering, AGL)和层级群组差分隐私(hierarchical group differential privacy, HGDP),实现发布大数据的群组隐私保护。关联图分层将给定关联图的节点和边分组,通过划分二分关联图的节点最小化每个层级的敏感度,可以向不同权限的用户公开不同层级的子图;在层级群组差分隐私过程中,对不同层级选择灵敏度并计算方差,重复聚合噪声减少方差,通过高斯机制进行子图噪声注入,实现分层关联图的扰动,以保证每个层级的群组隐私。实验结果表明,所提方法可以用来保护群组数据的综合敏感信息,并且比其他方法具有更好的隐私保护效果和更高的数据可用性。  相似文献   

16.
目前面向分类的差分隐私保护算法中,大部分都是基于决策树或者随机森林等树模型。若数据集中同时存在连续数据和离散数据时,算法往往会选择调用2次指数机制,并且进行隐私预算分配时往往选择平均分配。这都使得隐私预算过小、噪声过大、时间成本增加以及分类准确性降低。如何在保证数据隐私的同时尽可能地保证数据可用性,并提高算法性能,成为目前差分隐私保护技术研究的重点。提出了面向决策树和随机森林的差分隐私保护数据挖掘算法,使用Laplace机制来处理离散型特征,使用指数机制处理连续型特征,选择最佳分裂特征和分裂点,并采用最优特征选择策略和等差预算分配加噪策略。对金融数据集的测试结果表明,提出的2种基于树模型的差分隐私保护算法都能在保护数据隐私的同时,具有较高的分类准确性,并且能够充分利用隐私保护预算,节省了时间成本。  相似文献   

17.
随着网络技术、通信技术等的不断突破,互联网、移动网、广电网等多种类现代网络及其衍生业务迅速扩张,形成泛在于网络空间的分布式计算环境。为了最大化这些数据的价值,需要利用数据挖掘技术发现其中隐藏的模式或规则,用以指导和辅助生产或运营中的管理决策行为,以提高决策水平及决策收益。然而,受到普遍存在的异构性、私有性和平台兼容性等限制,兼因行业竞争和法律约束等因素(如个人或企业的数据隐私保护问题等),互联于网络的数据源难于进行集中式挖掘,分布式数据挖掘(DDM)技术应运而生。介绍了DDM的定义与框架、适用场景和研究挑战。根据文中给出的DDM高层架构,最终结果的质量与局部数据源的类型、可用性、局部结果的质量及整合方法等密切相关。DDM的实施未必都以站点间纯粹独立挖掘的方式进行,此外,对于数据集中,系统分布式站点多的情况,也可采用DDM。当前,DDM研究领域的挑战主要有:异构与同构挖掘、动态环境下的数据多变性、通信开销、知识整合和语义异构等。当前的DDM系统被分为4类:1)基于Multi-Agent的系统,利用Agent的自治性实现局部挖掘以保护数据私有性;利用Agent的主动性减少用户参与以提高挖掘自动化水平;利用Agent的协作性实现多算法协同挖掘等;2)基于网格的系统,利用网格在资源共享、开放服务和协同工作等方面的优势,提高挖掘的可靠性和协同性;3)基于元学习的系统,通过元学习优化挖掘算法的选择与组合,并对已获知识进行多次学习以提高结果质量;4)基于CDM(collective data mining)框架的系统,将待学习的函数表示为一组基函数的分布式存在,允许各数据源选择不同的学习算法,并以全局结果正确为前提减少网络通信量。进而,对当前DDM研究存在的共性问题进行了归纳:1)结果质量问题,不考虑各个站点数据源间的内在语义联系,各站点独立挖掘本地数据,与其他站点间无语义层面的数据交互或融合,形成纯粹的"分割式"挖掘,最终导致全局结果质量受损;2)挖掘效率问题,如何调度资源以平衡挖掘负载、减少协作挖掘中的通信开销问题。针对结果质量问题,探讨本体与数据挖掘的结合。作为语义网的基础,本体能为对象语义距离度量提供有效支持。当前,在利用本体描述挖掘任务的领域背景方面,利用本体描述DM过程本身方面,都已经有研究人员进行了探索性工作:针对关联规则挖掘中需要从海量规则中遴选有效规则的问题,提出了交互式的、用于删减冗余规则的挖掘后处理方法;针对在给定知识发现过程的输入和输出类型前提下,知识发现工作流的自动构造问题,提出了解决方法。通过阐述可知,为了提升分布式挖掘过程中局部结果和最终结果的质量,策略之一就是将DDM理论和本体理论作融合,以数据源间语义距离的度量为突破口,建立语义距离度量的复合量化体系,通过构建和求解新型DDM模型来实现目标。  相似文献   

18.
基于本体的数据集成冲突消解   总被引:1,自引:0,他引:1  
文章在深入分析异构数据集成冲突产生原因的基础上,提出一种使用两层本体来消解数据集成中语法和语义冲突的方法;通过使用数据源模型本体和集成映射模型本体,能够在解决语法和语义冲突的同时进行数据划分和安全控制,可提高数据集成的效率和自动化程度。  相似文献   

19.
高校教务信息管理系统的异构数据源之间存在着各种语义冲突.本文结合本体和中间件方法,通过构建教务管理领域本体,将用户对数据集成的需求利用本体词汇进行表达,在中间层完成全局本体到局部数据源之间的模式映射,以处理教务数据集成的语义需求,对于推动数字化校园建设具有现实意义和实用价值.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号