首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 437 毫秒
1.
基于FP-tree的最大频繁项集挖掘算法   总被引:1,自引:0,他引:1  
现有的最大频繁项集挖掘算法在支持度阈值较大情况下已达到较高性能,但在支持度阈值较小时,由于候选项集的快速增长,其性能往往不理想。文章提出了一种基于频繁模式树(FP-tree)存储结构的最大频繁项集挖掘算法——DMFIF算法,将FP-tree各分枝作为初始候选项集,并按维数和支持度递减排序,结合子集剪枝策略,自顶向下搜索挖掘最大频繁项集。实验结果表明,该算法在低支持度阈值下稠密数据集中挖掘长模式具有较好性能。  相似文献   

2.
针对Apriori和AprioriTid算法中存在的项集生成瓶颈问题,提出了一种基于事务集压缩、候选项集压缩和支持度布尔矩阵的改进AprioriTid算法.该算法中通过删去不必比较的事务来有效缩减数据集;优化频繁项集的自连接方式来减少生成的候选项集个数;使用支持度布尔矩阵来加快候选项集的验证速度.实验结果表明改进算法比原算法执行效率明显提高,同时也验证了该算法在油液监测故障诊断中的有效性.  相似文献   

3.
针对Apriori算法在第二次迭代过程中产生大量候选集的弊端,在Spark大数据框架下,将Apriori算法进行并行化处理。提出一种基于Spark平台的改进Apriori算法——I-Apriori;该算法利用Spark基于内存计算的抽象对象(RDD)存储频繁项集,在第二次迭代中,通过使用改进的布隆过滤器存储频繁1项集,消除候选集生成,减少数据库扫描次数,提高算法效率。实验结果表明,相比基于Spark平台的Apriori算法进行性能评估,I-Apriori算法具有更优的性能,能够较大程度地提高大数据关联规则挖掘的效率。  相似文献   

4.
常见的基于Hadoop框架的Apriori改进算法在统计支持度时有扫描数据集、候选项集剪枝等方面效率低下且集群间的数据传输有较大的时间开销的问题,提出了一种Apriori的改进算法Apriori_Ind.算法运用Hadoop集群,使用先按事务对数据集分块,再将数据集的格式转换为项,事务集的分块处理策略,使算法充分利用分布式计算优势,实现各节点并行的实现候选项集生成与剪枝操作.并利用前项与后项的新结构表示频繁项集,新结构在各节点进行候选项集生成和剪枝时提高算法效率.Apriori_Ind具有减小集群传输代价、加速剪枝等优势.实验表明新算法适合大规模数据挖掘,特别是项的数量较大的情况下,算法性能有明显的提高.  相似文献   

5.
针对Apriori算法的不足,提出了一种新的优化算法——IApriori.该算法应用散列技术优化产生频繁-2项集,优化连接操作减少连接判断的次数,通过对候选项集编码来减少扫描数据库的次数,优化逻辑"与"运算减少不必要的"与"操作次数,缩短生成频繁项集的时间.IApriori算法仅需3次扫描数据库.研究结果表明,该算法具有快速、直观、节省内存等优点.  相似文献   

6.
覆盖算法和支持向量机是两种重要的机器学习分类方法,但长期以来一直缺少基于覆盖算法的通用分类器,在一定程度上阻碍了覆盖算法的推广.论文设计和实现了基于覆盖算法的通用分类器J Cover,该分类器有友好的人机交互界面,能对数值型数据集进行有效分类,并给出详细的实验结果.通过与LIBSVM的对比实验表明J Cover在识别率、泛化能力和性能上具有优越性.  相似文献   

7.
通过对Apriori和1-k-Apriori两种算法进行细致分析和深入研究,结合这两种算法的优点,提出了I1-k-Apriori算法.1-k-Apriori算法中利用Lk-1与L1相连接来得到候选项目集,但是,有些情况下,用这种方法生成的候选k项集数量过大,导致k项集的筛选代价太大.I1-k-Apriori算法根据k-1项集的特性和事务数据库中数据的特性来决定产生k项集的方法,可以有效避免由于Lk项数过多而影响运算效率.实验结果表明,I1-k-Apriori算法较大提高了运算效率.  相似文献   

8.
频繁项目集挖掘是多种数据挖掘应用研究的一个重要方面,频繁项目集的快速挖掘算法研究是当前研究的热点,传统Apriori及其改进算法,要多遍扫描数据库并产生大量的候选项目集,针对Apriori算法的缺陷,Han JW(韩家炜)提出FP-growth算法,该算法仅须扫描数据库两遍且无须生成候选项目集,避免了产生“知识的组合爆炸”,提高了频繁项目集的挖掘效率,但FP-growth算法是通过逐步生成条件模式基和条件频繁模式树来挖掘频繁项目集,因而影响了频繁项目集的挖掘效率,为此,在引入F-矩阵概念之后,提出了FP-growth的一种改进算法—IFP-growth,并对改进算法的性能进行了测试,实验结果表明,IFP-growth算法优于FP-growth。  相似文献   

9.
负选择算法是人工免疫系统中的核心算法之一,其性能对整个系统具有重要意义。负选择算法在选择过程中通常使用的是k连续位匹配规则,由于该匹配规则所固有的特殊性质,无法避免生成互相匹配的检测器。这些互相匹配的检测器在其覆盖空间(对非自体集合)存在非空交集,从而降低了负选择算法所产生的检测器的整体覆盖空间。本文为了避免负选择算法生成互相匹配的检测器,提出一种改进的负选择算法。与传统的负选择算法相比,该算法提高了成熟检测器的整体覆盖空间,使系统的检测能力有所提升。  相似文献   

10.
一种改进的Apriori算法   总被引:2,自引:0,他引:2  
分析Apriori算法的不知,提出从先删减后连接的新角度来生成频繁项集,达到减少无用连接,进而减少剪枝步骤候选项集判断数量来改进Apriori算法。改进后的Apriori算法在时间效率上优于传统的算法,而且所获得的关联规则质量与传统算法相当。  相似文献   

11.
针对相似性连接问题, 提出了动态双重前缀的模糊相似性连接算法.与之前的算法不同的是,本文采用双重前缀,即在查找候选以及构建索引时使用不同的前缀来提高过滤效率,并在此基础上进行了优化.首先通过取各个前缀生成的候选集合的交集来缩小候选集合;其次提出最大区分任选前缀,利用此前缀进行预验证来减少最终进入到验证过程的候选对,以此来减少连接时间.并且在三个真实数据集上进行实验,将本文算法与Silkmoth算法以及MF-Join算法进行比较,结果表明所提算法可以生成更小的候选集集合并且需要更少的连接时间.  相似文献   

12.
挖掘关联规则中Apriori算法的一种改进   总被引:3,自引:0,他引:3  
算法减少连接次数以及扫描数据库的次数从而缩短数据库扫描时间,利用项集有序性改进判断是否进行连接的策略,并利用标志位变化逐步消除无用事务,从而实现了事务压缩和项目压缩, 同时减少了判断时间。实验结果表明,经过优化了的Apriori算法在运行效率上有一定的提高。  相似文献   

13.
利用Lagrange插值和Hermite插值对Alefeld,Potra的3种算法作了改进,构造了求解非线性方程f(x)=0在区间[a,b]中单根x^*的两个区间套算法。与Alefeld,Potra的3种算法相比,这两个新算法的Q收敛阶和效率指数更高。证明了算法的收敛性,给出了收敛阶和效率指数。数值实验验证了算法是可靠和有效的。  相似文献   

14.
NPSP:一种高效的序列模式增量挖掘算法   总被引:4,自引:3,他引:1  
提出了一种称为“异构树”的数据结构,采用一套编号规则对异构树的分支进行编号,使具有相同编号的分支代表相同的候选序列,编号不同的分支代表不同的候选序列,极大地简化了候选集计数过程,在此基础上提出了具有增量挖掘功能的序列模式高效挖掘算法NPSP,并从理论分析和实验两方面证明了其挖掘结果集的完备性和算法的高效性.  相似文献   

15.
针对现有的测向算法测相干信号源会损失天线阵列孔径的问题,在引入广义导向矢量和广义导向矩阵的基础上,建立了一种通用的阵列数据模型,提出了一种基于四阶累积量的广义MUSIC测向算法。为求解所提的广义MUSIC测向算法,在文化算法中使用人工鱼群进化机制,引入了一种多维搜索的文化鱼群算法。仿真结果证明了所设计的测向算法在不损失四阶累积量所扩展阵列孔径的情形下,可有效测相干信源与独立信源的方向,与现有一些经典算法相比,所提算法有较大的优势和较广的应用范围。  相似文献   

16.
李晓晴  于海征 《科学技术与工程》2022,22(24):10602-10610
贝叶斯网络源于人们对人工智能领域不确定性问题的研究,是进行不确定问题推理和数据分析的重要工具。结构学习是贝叶斯网络研究的核心内容,K2算法是结构学习的经典算法之一。为解决K2算法学习效果强烈依赖于节点序的问题,本文提出一种新的混合结构学习算法:双重K2算法。该算法首先将节点信息作为初始节点序,通过K2算法的搜索策略得到初始网络结构;然后在初始网络结构上利用拓扑排序得到修正后的节点序;最后K2算法通过修正后的节点序学习得到最优的网络结构。通过实验验证,在精度和效率上,双重K2算法效果优于其它经典算法。  相似文献   

17.
空间调制(SM)系统的最大似然(ML)最优检测算法的计算复杂度很高,具有较低计算复杂度的M-ML检测算法受到了人们的关注.M-ML算法按照接收天线序号由小到大的顺序进行检测,从误比特率性能角度考虑并不是最佳的.通过研究不同检测顺序对算法性能的影响,提出了两个改进的M-ML算法,仿真结果表明改进的M-ML算法在误比特率性能上优于M-ML算法.由于M-ML算法在不同的信噪比下每层保留固定的节点数M,尤其在高信噪比时会造成计算资源的浪费,因此提出一种动态M-ML算法,即通过门限值自适应选择每层保留的节点数.仿真结果表明动态M-ML算法降低了M-ML算法的计算复杂度,同时性能逼近M-ML算法.  相似文献   

18.
自适应逃逸动量粒子群算法的数据库多连接查询优化   总被引:1,自引:0,他引:1  
为了提高数据库多连接查询的优化效率,针对粒子群算法存在的早熟、局部最优等缺陷,提出一种自适应逃逸动量粒子群算法的数据库多连接查询优化方法.该算法首先将遗传算法的交叉机制引入粒子群算法中,以保持粒子群的多样性,避免早熟现象出现;然后,引入动量算法平滑粒子搜索轨迹,加快粒子群的收敛速度;最后,将该算法应用于数据库多连接查询优化求解,以获得最优的数据库多连接查询方案.仿真结果表明,该算法提高了数据库查询效率,缩短了查询响应时间.  相似文献   

19.
针对Range partition算法不能优化数据集严重倾斜情形下的两表连接效率问题, 提出一种改进的数据倾斜连接算法. 该算法将倾斜数据和非倾斜数据区别处理, 利用复制、 广播方法将数据发送到每个Reduce节点, 通过一轮Map/Reduce任务完成所有的连接操作, 可有效均衡每个Reduce处理量, 解决了数据严重倾斜对两表连接性能的影响. 与传统的分区连接算法比较结果表明, 该算法有效.  相似文献   

20.
基于网格法的遗传算法及其应用   总被引:8,自引:0,他引:8  
在基本的遗传算法(sGA)中,初始群体是随机产生的.为了增加个体的遍历性和多样性提出-种用网格法来产生遗传算法的初始群体,并对网格法的遗传算法的优化效率进行了定量的评价.同时与基本的遗传算法一起应用在DeJong的测试函数F1上便于进行对比.评价结果和实验结果表明网格法在提高遗传算法的优化效率上是可行的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号