首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
在线挖掘数据流滑动窗口中频繁闭项集   总被引:2,自引:0,他引:2  
在线挖掘滑动窗口中的频繁闭项集是一类重要的数据流挖掘问题.提出了一种新的频繁闭项集挖掘算法FPCFI-DS.该算法能够在有限的存储空间中高速挖掘数据流滑动窗口中的频繁闭项集,并且能够在任意时刻维护当前窗口中精确的频繁闭项集.对于第一个窗口中的数据,FPCFI-DS算法采用单遍过程FPCFI进行挖掘,挖掘结果被保存于一棵全局闭项集树GCT中.当窗口向前滑动时,FPCFI-DS算法采用更新挖掘方式快速挖掘出当前窗口中的频繁闭项集.实验结果表明,FPCFI-DS算法的空间效率和时间效率都显著优于同类经典算法Moment.  相似文献   

2.
一种挖掘最大频繁子图的新算法   总被引:2,自引:0,他引:2  
如何从大量的图中挖掘出令人感兴趣的子图模式已经成为数据挖掘领域研究的热点之一.由于其内在的计算复杂性,挖掘全部频繁子图非常困难,且得到的频繁子图过多,影响着结果的理解和应用.解决方案之一是挖掘最大频繁子图.在经典的Apriori算法的基础上,提出了一种挖掘最大频繁予图的新算法Apriori-MaxGraph.首先给出了一种新的、用于计算图的邻接矩阵规范编码的结点排序策略,大大降低了求图规范编码的复杂度,并可以加速子图规范编码序列匹配的速度.其次,针对最大频繁子图,对候选子图的生成进行了规范.最后,采用双向搜索与剪枝策略,大大减小了搜索空间,提高了算法的效率,实验结果表明,Apriori-MaxGraph算法具有较高的挖掘效率.  相似文献   

3.
频繁子图已成为数据挖掘领域研究的热点之一。在经典的Apriori算法的基础上,提出了一种图挖掘的新算法Apriori-Graph。首先给出了一种新的、用于计算图的邻接矩阵规范编码的结点排序策略,大大降低了求图规范编码的复杂度,并可加速子图规范编码序列匹配的速度。其次,对候选子图的生成进行了规范。最后,针对频繁性检验这一瓶颈过程,给出了若干性质,从而较大地降低了候选子图频繁性判断的代价。实验结果表明,Apriori-Graph算法具有较高的挖掘效率。  相似文献   

4.
在线挖掘数据流滑动窗口中最大频繁项集   总被引:1,自引:0,他引:1  
相对于频繁项集,最大频繁项集的数目较少,挖掘最大频繁项集的算法具有较高的时空效率.提出了一种新的基于文法顺序FP-Tree的最大频繁项集单遍挖掘算法FPMFI-DS.该算法采用了一种混合搜索空间项顺序策略,并利用我们所提出的一种新的剪枝技术-"子集等价剪枝技术",有效缩小搜索空间的大小.基于该算法,提出了一种能够在线更新挖掘数据流滑动窗口中最大频繁项集的算法FPMFI-DS+.FPMFI-DS+算法能够在任意时刻都维护数据流当前窗口中的最大频繁项集.仿真实验表明,FPMFI-DS算法的效率接近于多遍挖掘算法FPMax*,并具有良好的可扩展性,FPMFI-DS+算法更新挖掘速度快.  相似文献   

5.
频繁模式挖掘是很多数据流挖掘工作的基础.现有算法虽然能够有效的在数据流中挖掘近似的频繁模式, 但是由于数据流数据的不确定性、连续性以及海量性, 始终不能有效的将算法的时间效率和空间效率控制在一个可以接受的范围内. 本文通过使用散列表作为概要数据的存储结构, 并引入关联规则兴趣度的概念, 提出了数据流频繁模式挖掘算法MIFS-HT(mining interesting frequent itemsets with hash table), 不仅有效降低现有算法的时空复杂度, 同时提高了算法的应用价值. 最后, 实验结果表明: MIFS-HT是一种高效的数据流频繁模式挖掘算法, 其性能优于FP-Stream、Lossy Counting等算法, 并且挖掘结果更具有现实意义.  相似文献   

6.
一种基于树的频繁模式挖掘算法   总被引:4,自引:0,他引:4  
提出了一种基于树的频繁模式挖掘算法TBA-FP。它以树表示法压缩数据库所含模式信息,将挖掘问题转化为按深度优先策略构造频繁模式树,并引入了虚拟裁剪等优化技术。实验表明,TBA-FP挖掘“长”模式的时间效率与空间可伸缩性远远优于经典算法Apriori.  相似文献   

7.
基于包含索引的频繁闭序列模式挖掘的新算法   总被引:1,自引:0,他引:1  
频繁闭序列模式惟一确定全体频繁序列模式,且规模小得多.传统的闭序列模式挖掘算法对每个频繁项目都进行扩展,往往会产生大量的非闭合序列.为解决这一问题,提出了一种新的基于包含索引的频繁闭序列模式挖掘算法,其主要思想是只对闭项集进行扩展,大大减少了非闭合序列的产生.首先,论证了闭序列模式只能由闭项集组成;其次,说明了如何利用包含索引来快速发现闭项集;最后,给出了一种深度优先的挖掘频繁闭序列模式的新算法.实验结果表明,该算法具有较高的效率.  相似文献   

8.
基于启发式策略的海量语义数据流划分算法研究   总被引:1,自引:0,他引:1  
海量语义数据的剧烈增长对大数据分布式存储带来了巨大的挑战. 分布式存储的核心技术是图划分,论文介绍了基于图数据流划分的模型和分区启发函数策略,给出了针对RDF文件的图数据流划分算法和实现过程. 实验对几个真实RDF数据集进行划分,并与METIS (一种多层次的图划分算法)方法和哈希分区方法做了实验数据对比,验证了图数据流划分算法的有效性.  相似文献   

9.
针对分布式系统,提出了自适应哈希链结构的频繁模式挖掘算法。该算法首先在每个站点产生局部频繁1-项集,再产生全局频繁1-项集,根据全局频繁1-项集产生各站点的投影数据库,在各个站点分别扫描投影数据库中的交易,并根据站点可用内存情况形成相应大小的哈希链结构。通过挖掘各站点的哈希链结构得到全局频繁项集。给出了基本步骤和挖掘算法。研究表明该算法不但效率高,而且适应性强。  相似文献   

10.
为提高关联规则挖掘算法的效率及其对大型数据集的适应性,提出了基于划分的带项目约束的频繁项集挖掘算法Partition CHS Miner。算法按照约束条件裁减数据集,并采用基于约束的超结构CHS(con-straint-based hyper-structure)存储数据。对大型数据集,先将其划分为多个不相交的数据子集,使子集的大小适合主存,然后在子集上采用基于超结构的带项目约束的挖掘算法挖掘出局部频繁项集,最后合并所有子集中的频繁项集形成全局的带约束的候选项集,计算出全局频繁项集。实验证明了算法的有效性。  相似文献   

11.
提出了一个基于频繁模式树即FP-tree和支持度数组相结合的最大频繁项集挖掘算法,首先建立FP-tree,同时建立支持度数组,然后在此基础上建立最大频繁项集树MAXFP-tree,MAXFP-tree中包含了所有最大频繁项集,缩小了搜索空间,提高了算法的效率。算法分析和实验表明,该算法对稠密型数据集和稀疏型数据集均适用,并且特别适于挖掘具有长频繁项集的数据集。  相似文献   

12.
用户在一定区域内的长期移动行为与某些物理位置相关,如家和办公室等.为了从用户的日常移动轨迹中找出这些位置与轨迹的关系,本文提出一种新的基于移动位置扰动的端点划分与聚类方法.该方法首先将GPS轨迹划分为成组的线段集,然后运用聚类方法将地理上相似的端点进行聚类以检测用户的个性化兴趣点,最后利用原始轨迹来映射个性化兴趣点之间连接关系,生成用户在区域内的移动路径网络.理论与实验结果表明,本文提出的方法可有效地从大量GPS轨迹中发现用户的频繁路径及个性化兴趣点,从而能够为其提供更好的个性化地理信息服务.  相似文献   

13.
针对雷达特征子空间距离像识别中存在的如何选择特征基的困难,提出了一种基于最优特征矢量子空间的雷达距离像识别方法。该方法首先对原数据样本进行特征提取变换,再采用遗传算法选取最优特征矢量,由此组成最优子空间。通过对三种不同类型飞机实测回波数据进行识别,并与经典特征子空间法的对比实验,表明该方法的有效性。  相似文献   

14.
将MAIDs在时间上进行扩展,提出一种新决策模型——多Agent动态影响图(MADIDs),对动态环境中的协作关系进行建模;给出MADIDs的一种分层分解的分布近似方法,进而通过将决策结点和效用结点的推理引入到BK算法中,给出MADIDs环境模型的一种扩展BK(EBK)近似推理算法;引入一种BP神经网络学习MADIDs的局部效用函数。最后,针对一个表示协作关系的MADID模型,进行算法比较和仿真实验,实验结果显示了MADIDs模型的有效性。  相似文献   

15.
将进化算法与爬山算法的混合进化算法引入图数据挖掘,以克服贪婪式查找易陷入局部极值的问题.针对子图结构发现问题中实例易丢失的特点,提出了一种新的遗传操作--个体协同算子,使得代表同一子结构的不同个体能够以协同的方式进行查找.另外,还提出了一种基于年龄段和个体生成方式的多样性保持方案,以从种群的组成和个体的生成两个方面保持和提高种群的多样性,同时还有助于个体协同算子的执行.在进化过程中随时以新生成的单边子结构替换当前种群中没有潜力的个体的机制在缩小查找空间的同时还使得进化过程成为一个更为完全的查找过程.实验结果表明,以上措施增强了算法的寻优能力,能够获得更优的解.  相似文献   

16.
傅立叶描述子是分析和识别物体形状的重要方法之一.基于雷达图表示多维数据的原理,提出了一种利用傅立叶描述子识别雷达图形的可视化数据分类新方法.该方法采用多元统计中的雷达图表示多维数据,不同模式类别的多维数据构成不同形状的雷达图多边形.在此基础上,给出基于极半径函数的傅立叶描述子来描述和识别雷达图的边界曲线特征.运用概率神经网络,以傅立叶描述子为输入特征向量完成自动识别雷达图形.实验结果表明这种分类方法有良好的分类精度,可与传统分类器性能相比.  相似文献   

17.
针对体系结构动态行为的语义一致性验证问题,提出了基于生成图的验证方法.首先根据体系结构的动态行为模型构建生成图,然后对生成图的逻辑结构和时间信息进行分析,来完成动态行为模型的逻辑关系和时序关系一致性验证.该方法不但能够有效解决动态行为的语义一致性验证问题,而且还能准确定位模型中出现问题的地方,指导用户进行模型不一致处理和优化动态模型.同时,生成图可供多个模型间的动态行为一致性验证,实用性更强,且在可理解性、可分析性等方面上相比传统方法具有较大改善.  相似文献   

18.
针对体系结构动态行为的语义一致性验证问题,提出了基于生成图的验证方法. 首先根据体系结构的动态行为模型构建生成图,然后对生成图的逻辑结构和时间信息进行分析,来完成动态行为模型的逻辑关系和时序关系一致性验证. 该方法不但能够有效解决动态行为的语义一致性验证问题,而且还能准确定位模型中出现问题的地方,指导用户进行模型不一致处理和优化动态模型. 同时,生成图可供多个模型间的动态行为一致性验证,实用性更强,且在可理解性、可分析性等方面上相比传统方法具有较大改善.  相似文献   

19.
基于KL距离的交互式动态影响图近似算法   总被引:1,自引:0,他引:1  
交互式动态影响图(interactive dynamic influence diagrams, I-DIDs)状态空间太大,候选模型的数量随时间变化而呈指数倍增长。针对其备受计算量困扰的问题,提出一种利用近似行为等价原理与区别模型更新算法(discriminative model updates,DMU)相结合的近似算法。首先给出了基于Kullback-Leibler (KL)距离模型行为等价和近似行为等价的定义,然后基于KL 距离和候选模型的动作对候选模型聚类,自上而下合并策略树形成策略图,最后利用DMU算法进行求解。仿真结果表明,相对于传统的DMU算法,所提近似算法能显著降低候选模型的数量,提高I-DIDs的效率,对I-DIDs的理论及应用研究具有参考价值。  相似文献   

20.
独立元分析(ICA)是近年来盲信号分离领域的热点问题,传统的ICA方法只能寻找信号与信号间的独立元,对信号组与信号组之间的独立性分析却无能为力.独立子空间分析法(ISA)则通过寻求矢量峭度最大化,对信号组之间进行独立性研究.根据这一理论提出动态独立子空间分析过程监控方法,针对过程变量自相关问题,构建时间序列子空间,随采样时间动态更新子空间数据,对其进行独立性研究,达到过程监控的目的.以TE过程为背景的仿真研究,验证了该方法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号