首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 843 毫秒
1.
关联规则挖掘可以发现大量数据中项集之间相关联系的知识,隐私保护是当前数据挖掘领域中一个十分重要的研究问题,其目标是要在不精确访问真实原始数据的条件下,得到准确的模型和分析结果.提出了关联规则挖掘形式化定义以及它的基本算法,从关联规则挖掘角度对当前流行的隐私保护关联规则挖掘算法进行了深入浅出的分析和介绍,最后系统回顾了目前人们在数据挖掘领域中对隐私保护关联规则研究的现状,阐述了隐私保护在未来数据挖掘中的发展方向.  相似文献   

2.
<正>经过数十年的发展,数据挖掘领域产生了众多的算法和挖掘系统。挖掘系统作为研究的有形成果,在展示数据挖掘技术的威力、利用数据挖掘技术产生经济效益方面起着至关重要的作用。目前,各大软件厂商及研究单位都忙着推出了各自的数据挖掘系统。有的作为商业产品,功能强大,集成了数量众多的挖掘算法;有的作为科研试验软件,仅集成了一两个新颖的算  相似文献   

3.
经过数十年的发展,数据挖掘领域产生了众多的算法和挖掘系统.挖掘系统作为研究的有形成果,在展示数据挖掘技术的威力、利用数据挖掘技术产生经济效益方而起着至关重要的作用.目前,各大软件厂商及研究单位都忙着推出了各自的数据挖掘系统.有的作为商业产品,功能强大,集成了数量众多的挖掘算法;有的作为科研试验软件,仅集成了一两个新颖的算法,功能有限.绝大部分的数据挖掘系统采用C/S的两层结构,用户需要安装庞大客户端,使得安装和维护都十分不方便.  相似文献   

4.
尤磊  兰洋 《河南科技》2010,(6):50-51
关联规则(Association Rules)挖掘是数据挖掘研究领域的一个重要研究方向,1993年,美国IBM Almaden Research Center的Agrawal等人首先提出了从交易数据库中发现用户模式的相关性问题,并且提出了基于频繁集的Apriori算法。  相似文献   

5.
<正>关联规则(Association Rules)挖掘是数据挖掘研究领域的一个重要研究方向,1993年,美国IBM Almaden Research Center的Agrawal等人首先提出了从交易数据库中发现用户模式的相关性问题,并且提出了基于频繁集的Apriori算法。  相似文献   

6.
在Fp-growth算法的基础上,提出了一种新颖的关联规则挖掘算法.该算法将大型数据库分解成频繁1-项集的项总数个子集,然后对分解得到的各个数据库子集用Fp-growth算法进行约束项数据挖掘,待所有数据库子集的约束项数据挖掘进行完毕后,再合并这些约束频繁项得到大型数据库的频繁项集.实验结果表明新算法所采用的数据库划分策略克服了FP-growth算法对大型数据库进行挖掘时,占用内存大,运行速度慢的不足,是一种适合于大型数据库的关联规则挖掘算法.  相似文献   

7.
实际应用、大数据、挖掘算法和处理平台4个要素的紧密结合构成了大数据挖掘的核心.根据大数据的特征,分析相关案例,指出实际应用的真实需求才是大数据挖掘的目标.大数据挖掘的价值体现必须结合应用数据和与应用匹配的算法,在数据处理平台的支持下,将挖掘到的知识或模型去指导实践.  相似文献   

8.
一种文本分类数据挖掘的技术   总被引:7,自引:0,他引:7  
挖掘的理论和应用研究是数据挖掘领域一个新的重要分支,介绍了一种文本数据挖掘方法. 首先,论述了文本挖掘的意义和重要性,探讨了文本挖掘的定义和文本分类的一些形式,然后讨论了一个以数据预处理、特征提取、特征表示和特征匹配等文本分类的一些关键理论问题,并给出了一个基于该方法的文本分类系统的实验结果,实验结果表明了该方法的可行性.  相似文献   

9.
关联规则是数据挖掘中的重要研究内容之一,国内现有的关联规则算法大多是研究挖掘数据库不变的限定条件下,发现挖掘数据的各属性间的所有关联型知识.而事实上大多数挖掘数据会随时间的变化不断变化.针对数据库中追加数据时,如何有效地更新关联规则的问题,提出了一种新算法———IUAMAR算法.该算法可以有效地利用知识数据库中保留的最小非高频繁项目集产生新的候选项目集,避免了候选项目集的数量太庞大的问题.  相似文献   

10.
在数据挖掘研究领域中,数据的关联规则占有重要研究地位和突出现实作用。本文论述了关联规则产生的背景,描述了关联规则的相关概念,并对Apriori挖掘算法进行了详细分析。  相似文献   

11.
结合数据流的特点,提出了一种面向数据流挖掘的过程模型PM-DSM。针对目前数据流挖掘过程中存在算法众多但利用率低的问题,提出了一种基于Web服务的数据流挖掘过程模型算法管理框架PMAMF-DSM,描述了该框架的体系结构和运行机制,并用UML活动图给出了框架的实现语义。在Eclipse上基于该框架实现了一个数据流挖掘算法管理系统,实验结果表明了该框架的灵活性与自适应性。  相似文献   

12.
随着Internet网络的高速发展,海量的未标签文档和相对少量的已标签文档是当前Web文档的一个普遍情形,如何有效的利用少量的已标签文档去聚类海量的未标签文档,从而更好地获取有价值的信息,即半监督学习问题,已成为当前研究的热点.本文针对目前Web文本挖掘领域的无监督学习算法的检测率不高,而监督学习算法需要大量的标签数据又不易获得的问题,将半监督中的标签绑定技术与优化球形k-均值聚类算法相结合进行Web文本挖掘,并使用真实的测试数据对Web文本挖掘系统进行实验.结果表明本文方法对有价值文本具有较高检测率及较低的误报率,整体检测性能优于基于监督和无监督学习的Web文本挖掘算法.  相似文献   

13.
在概述Web挖掘以及Web日志挖掘的相关领域的发展和技术及其理论基础上,详细研究了Web日志挖掘的预处理技术,Web日志挖掘利用数据挖掘技术分析和挖掘网络日志,获取网站使用情况的有价值模式,应用于个性化服务、网站设计和商业决策等方面.通过将日志挖掘的结果与最优路径算法将结合,进一步优化网站,设计出拥有最优路径拓扑结构的网站,使优化后的网站更具优势,在同类网站中能够脱颖而出.  相似文献   

14.
时态数据采掘中的时态型与时间粒度研究   总被引:10,自引:0,他引:10  
研究了时态型与时间粒度的有关理论,提出了时态型、时间粒度、粗时间粒度、基时态型、基时间粒度和基准时间等概念,并研究了它们在刻画绝对时间的关系,最后给出一个一类简单频繁事件式发现的例子,对于研究时态数据采掘具有重要意义。  相似文献   

15.
利用数据空间动态网格划分的方法,对数据流空间的数据分布密度情况进行模拟,并在此基础上提出了一种基于密度的偏倚抽样方法.为验证该抽样方法的有效性,将其应用到数据流中的聚类挖掘,实验结果表明该算法具有良好的适用性和有效性.  相似文献   

16.
刘伟 《松辽学刊》2006,27(4):25-26,33
由于经典的粗糙集理论不能处理原始数据资料中,含有连续属性的数据,需要对这些数据进行连续属性离散化才能用于知识获取,因此数据预处理是粗糙集理论应用中非常重要的一环,其结果将直接影响到粗糙集理论应用的效率,准确度.所以有关基于粗集理论的数据挖掘中数据预处理的方法研究具有非常重要的意义。本文对目前主要的离散化算法进行分析和评价,以中值序列分割点集为基础,提出了一种连续、离散混合离散化改进算法,保证划分后决策表一致性,获得合理的划分点.  相似文献   

17.
Web文本分类是Web数据挖掘的一个重要研究方向,它是在通过经验数据训练得到的分类体系下,根据网页的文本内容自动判别网页类别的过程,本文提出一种综合粗糙集与支持向量机的Web文本分类模型,利用粗糙集的属性约简方法,减少支持向量机训练数据的维数,提高Web文本分类的性能与效率.  相似文献   

18.
以汨罗市“城市矿产”产业集群为研究对象,借鉴种群生态学中“生态位”概念,建立“城市矿产”产业集群“生态位”测度模型,运用德尔菲法、层次分析法和图形诊断法进行比较分析,研究得到汨罗市“城市矿产”产业集群“生态位”对比国内其他主要“城市矿产”基地整体上处于劣势水平,并提出相关优化对策:扩大汨罗市“城市矿产”产业集群“生态位”,提高综合竞争力,推动汨罗“城市矿产”产业集群全面升级.  相似文献   

19.
摘要: 机场应急救援工作的规模决策对于抢救生命财产至关重要. 针对目前救援规模决策缺乏合理规则指导的问题, 提出了一种基于满意度控制的数据挖掘方法. 该方法将满意度理论中的选择函数和拒绝函数植入数据挖掘关联规则算法 中,在保持样本完好性的同时识别异样数据,控制挖掘进程,建立有效的机场应急救援辅助决策规则库,用以辅助决策 者作出更为科学合理的决策. 实验结果表明,该算法能挖掘出合理的应急救援规模决策规则,提高挖掘的准确性和效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号