首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
提出了一种基于模式增长的频繁模式挖掘算法(简称为PGMiner算法).这种算法是一种深度挖掘的算法,不产生任选项集,便于发现较长的模式,避免了Apriori和FP-growth方法存在的问题.通过一种简单的索引结构在映射数据库中不断地增加模式长度.这种索引结构占用较少的内存,使得这种基于内存的算法有很高的执行效率.采用现实数据集以及IBM人工数据集对PGMiner算法进行测试.试验结果显示,对于一般类型的特别是较为稀疏的数据集,PGMiner算法比Apriori和FP-growth方法有更好的性能.  相似文献   

2.
在图形挖掘研究领域对大图数据进行挖掘方法很多,尽管云计算在解决传统计算问题上十分有效,但对大图形的频繁挖掘中图形分割;信息不对称;模式保留合并仍存在问题。研究提出一种全新的基于云的SpinderMine挖掘法即 c-SpinderMine 方法。首先利用云计算来对大图形数据的大模式进行挖掘,解决大图形数据挖掘算法在云环境下面临的上述问题。然后进行三组真实的数据集实验,有效地缩短执行时间,且对处理云上的大数据表现出很高的可扩展性能。最后实验证明在不同数据大小和最小支持度时具有优越的内存使用和执行时间,对应付云环境下的大图形数据表现出优越的能力。
  相似文献   

3.
针对PrefixSpan算法在产生频繁序列模式(特别是挖掘密数据集和长序列模式)时会产生大量的投影数据库,使得算法性能下降的问题,提出一种基于投影位置的序列模式挖掘(PSPM)算法.该算法利用Apriori性质舍弃对非频繁项存储,节省了存储空间和扫描不可能出现序列的挖掘时间;在递归挖掘过程中,利用投影位置表直接定位投影序列位置进行挖掘局部频繁项,避免了构造投影数据库,从而提高执行效率.实验结果表明:与PrefixSpan(with pseudo-pro)算法相比,PSPM具有更好的执行效率和可伸缩性.  相似文献   

4.
将无候选序列的最大序列模式挖掘思想应用到多步攻击场景的构建中,改变了以往利用序列模式挖掘思想产生较多攻击序列模式、耗费大量内存和时间、不利于实时在线攻击意图识别、挖掘结果难以理解的现状,并根据算法的特点提出3种可以提高算法性能的策略。为验证算法的有效性,使用DARPA 2000数据集进行测试,结果表明该方法可以有效构建攻击者的多步攻击场景,在时间、内存消耗以及挖掘结果上比BIDE算法更优。  相似文献   

5.
研究了奇数阶幻方构造算法及其数据依赖性.通过对现有算法内存访问顺序和相关性进行分析,找出了限制现有算法并行性的主要因素,并通过改变内存访问模式和算法重构消除了数据依赖性.新的并行算法可以将原有算法的时间复杂度降为O(n),并且该算法可以达到成本最优.给出了该算法在不同存储系统下的实现方法.  相似文献   

6.
高频独立模式对无相关属性选择有一定意义.给出挖掘频繁独立模式算法,并在标准数据挖掘数据集蘑菇数据上测试,得到蘑菇数据在一定度量下的所有频繁独立模式,实验结果表明了挖掘算法的有效性.  相似文献   

7.
在一般的带时间窗的集配货一体化问题研究的基础上增加了对装卸货产生的服务费的研究。通过推理计算求出包括服务费在内的各部分费用在总费用中所占权重,建立含服务费的带时间窗的集配货一体化车辆路径问题(VRPPDTW)模型。在求解时基于遗传算法并对算子做出修正,通过动态自适应技术修正交叉算子和引入2-opt操作修正变异算子,通过修正确保种群的多样性和稳定性并提高算法的求解效率。最后,通过数值例子对文章的模型和计算策略进行验证。结果显示:执行修正遗传算法(MGA)的最优成本为246.136;执行自适应规则确定交叉概率遗传算法(AGA)的最优成本为275.944 3;执行标准遗传算法(SGA)的最优成本为304.188 6;经过多次反复执行验证,使用修正遗传算法较其余两种算法更适合求解此模型。  相似文献   

8.
对基于顾客化大量生产模式下的产品投产计划模型的算法进行了研究,提出了最优算法,优化了产品循环期,实现了计划平准化,满足了市场多样化需求,并在理论上推导和证明了混流生产线上加工机器的空闲时间的计算公式。  相似文献   

9.
谱聚类算法建立在谱图划分理论基础上,与传统的聚类算法相比,它具有能在任意形状的样本空间上聚类且收敛于全局最优解的优点。然而,谱聚类算法涉及如何选取合适的尺度参数σ构造相似度矩阵的问题。并且,在处理大规模数据集时,聚类的过程需要较大的时间和内存开销。研究从构造相似度矩阵入手,以传统NJW算法为基础,提出一种基于K近邻的自适应谱聚类快速算法FA-SC。该算法能自动确定尺度参数σ;同时,对输入数据集分块处理,并用基于K近邻的稀疏相似度矩阵保存样本信息,减少计算的内存开销,提高了运行速度。通过实验,与传统谱聚类算法比较,FA-SC算法在人工数据集和UCI数据集上能够取得更好的聚类效果。  相似文献   

10.
基于FP-tree最大频繁模式超集挖掘算法   总被引:1,自引:0,他引:1  
数据挖掘应用中的最大频繁项集挖掘算法大多存在候选项目集冗余问题,造成时间和空间的浪费.针对此问题,通过构造条件FP-tree,对不符合要求的项目进行剪除并对MFIT算法进行改进,提出一种基于FP-tree的最大频繁模式超集挖掘算法.此算法无需产生大量的候选集,同时减少数据集扫描次数,降低数据库遍历时间,提高算法效率.实验证明,此算法在降低候选项目集冗余度的同时有效减少了算法运行时间.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号