首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 234 毫秒
1.
一种改进的Apriori算法   总被引:2,自引:0,他引:2  
分析Apriori算法的不知,提出从先删减后连接的新角度来生成频繁项集,达到减少无用连接,进而减少剪枝步骤候选项集判断数量来改进Apriori算法。改进后的Apriori算法在时间效率上优于传统的算法,而且所获得的关联规则质量与传统算法相当。  相似文献   

2.
介绍数据挖掘中关联规则的情况.在分析关联规则挖掘算法的基础上,对经典Apriori算法进行改进,改进算法意在通过减少生成候选频繁项集的数量和扫描数据库次数.从而,加快算法的执行效率和节省空间.  相似文献   

3.
针对Apriori和AprioriTid算法中存在的项集生成瓶颈问题,提出了一种基于事务集压缩、候选项集压缩和支持度布尔矩阵的改进AprioriTid算法.该算法中通过删去不必比较的事务来有效缩减数据集;优化频繁项集的自连接方式来减少生成的候选项集个数;使用支持度布尔矩阵来加快候选项集的验证速度.实验结果表明改进算法比原算法执行效率明显提高,同时也验证了该算法在油液监测故障诊断中的有效性.  相似文献   

4.
目的解决在关联规则挖掘中存在大量无用的候选项集和频繁项集以及效率不高的问题。方法提出了一种基于十字链表的关联规则改进算法。结果利用用户给定的条件和剪枝算法减少了候选项集的数量,再遍历十字链表确定频繁项集,结果表明算法提高了挖掘效率。结论基于十字链表的关联规则改进算法避免了重复扫描数据库,提高了挖掘效率。  相似文献   

5.
利用项集有序特性改进Apriori算法   总被引:4,自引:2,他引:4  
Apriori算法是挖掘关联规则的一个经典算法,通过分析、研究该算法的基本思想,并利用项集的有序特性对其进行改进,减少了生成的候选集数量,从而提高算法的效率.  相似文献   

6.
挖掘关联规则中Apriori算法的一种改进   总被引:3,自引:0,他引:3  
算法减少连接次数以及扫描数据库的次数从而缩短数据库扫描时间,利用项集有序性改进判断是否进行连接的策略,并利用标志位变化逐步消除无用事务,从而实现了事务压缩和项目压缩, 同时减少了判断时间。实验结果表明,经过优化了的Apriori算法在运行效率上有一定的提高。  相似文献   

7.
在研究已有算法的基础上提出了一种频繁序列挖掘算法IDSG.该算法通过在频繁项(而不是频繁项集,即无需先求出所有频繁项集)间建立关联图,并在垂直数据库表达的基础上,借助简单的时态连接得到频繁序列完全集.整个过程只需扫描原始数据库两遍,有效减少磁盘I/O.另外,优化策略的正确运用,有助于减少候选序列的个数.分析及实验表明,较之同类算法,算法IDSG在效率上有了明显提高.  相似文献   

8.
为提高网络告警数据的处理效率,迅速找出故障根源,以保证整个电信网络的正常运行。针对告警数据的特点对传统的关联规则算法进行了相应的改进,提供了优先剪枝策略,避免了生成没有意义的频繁项集;k-1-项集通过连接操作生成k项集,避免了反复扫描数据库所带来的压力。结果表明,改进算法提高了挖掘效率,达到快速诊断网络故障的目的。  相似文献   

9.
在现有的关联规则算法的基础上,深入分析了经典算法的内涵,提出了剪枝候选二项集的改进算法,有效的控制候选二项集的生成,得到传统算法中部分候选二项集,从而减少扫描数据库的运算量.与Apriori算法相比,效率明显提高.  相似文献   

10.
基于数据库划分的高效关联规则挖掘算法研究   总被引:4,自引:4,他引:0  
在现有的关联规则改进算法的基础上,深入分析了经典算法的内涵,提出了不产生候选二项集的改进算法,而且减少了扫描数据库的大小.与Apriori算法相比,在较大型的交易数据库中,效率明显提高.  相似文献   

11.
用户对项目的评分数据是传统协同过滤算法进行项目或用户推荐的唯一依据,项目或用户本身的属性特征并未进行过多考虑。为此,在计算项目之间的相似度时融合了项目标签属性,提高了项目推荐的准确率。具体方法是首先通过创建项目属性分类表,得到项目属性之间的差异度,然后将项目属性差异度融入pearson 相关系数公式中,计算项目之间的相似度。通过实验验证,改进后的方法比传统的基于项目的协同过滤算法的推荐结果平均偏差小,命中率高,推荐结果更加准确。  相似文献   

12.
应用特征项分布信息的信息增益改进方法研究   总被引:3,自引:0,他引:3  
在特征项分布不平衡的情况下,传统信息增益算法的分类性能会急剧下降,针对此缺陷提出了一种利用特征项分布信息来改进信息增益公式的计算方法。通过计算特征项分布信息来判定特征项是否存在不平衡性,并利用此信息来平衡特征项不出现时对分类精度的影响。通过实验验证,改进后的计算方法整体上比传统的信息增益算法具有更好的性能。  相似文献   

13.
基于遗传算法的模糊逻辑控制器优化设计   总被引:11,自引:0,他引:11  
设计了一种新的用于模糊逻辑控制器优化的遗传算法,实现了模糊逻辑控制器参数和结构的同步快速优化。该算法对经典的简单遗传算法进行了改良,设计了一种带区间限制的十进制编码方案,实现了模糊控制器隶属度函数和控制规则的联合编码;并设计了受限分步一致交叉和变异算子,改进了经典赌轮选择法,避免了病态个体产生,加快了收敛速度。通过对典型的一阶和二阶工业对象控制器优化的仿真研究表明,相对于一般的遗传算法,该算法在群体规模较小(20或40)的情况下,能够在20代左右快速收敛到理想结果,并且在进化过程中很少产生病态个体,因此能够在小群体规模下,实现模糊控制器参数和结构的快速同步优化。  相似文献   

14.
针对Apriori 关联规则算法中的瓶颈问题,提出了一种Apriori_improve 算法.该算法根据组合元素的计数结果排除一些不符合组合条件的元素,并在扫描数据库后"删除"一些不能支持频繁集的记录,迅速减小了数据库规模.实例表明:对于大型数据库的挖掘,该算法比Apriori算法的效率有明显地提高.  相似文献   

15.
目的针对改进的Candy模型,建立一种简单有效的求解方法。方法采用模拟退火算法中镶嵌可逆跳转马尔科夫链蒙特卡罗算法(RJMCMC)进行求解。结果提出新的数据项、结构项和基于预处理数据转移核,加快了计算速度,使该方法更趋于实用化。结论通过图像处理,验证了该算法的有效性:该算法求解简单,线特征提取结果精确。  相似文献   

16.
一种基于十字链表的频繁项集挖掘算法   总被引:1,自引:0,他引:1  
在Apriori算法的基础上,提出一种基于十字链表的关联规则挖掘算法。该算法能够快速得到每个候选项的支持度,从而有效的发现频繁项集。通过与经典算法分析对比表明,该算法具有明显的优势。  相似文献   

17.
通过研究网络结构上的观点传播与协同过滤算法,基于对观点传播算法的优化,提出了基于用户相似和物品相似推荐系统评分预测算法.设计的算法修正了现有相似研究中在目标比较相似时,相似性结果为零的问题,将用户(或物品)的相似度定义为用户(或物品)间的观点数目和差异在相应复杂网络中的传播结果,并提出了相应的推荐算法.在MovieLens数据集上的实验结果证明,提出的算法与几种典型的现有方法相比较,具有更高的准确性,并且优于观点传播算法.  相似文献   

18.
针对文本分类存在的高维文本问题,提出文档频率(DF)-卡方统计量特征提取方式,对特征项进行有效约减,降低文本维度,提高分类精度.在K最近邻(KNN)算法的基础上,针对待分类文本需要和大量训练集样本进行相似度计算的问题,提出一种基于分组中心向量的KNN算法,对类别内的样本集分组求出各组中心向量,使其重新代表训练库计算相似度,降低计算复杂度,提升算法的分类性能.通过实验表明:相较传统KNN算法,改进的算法在准确率、召回率及F值方面都有提升,与其他分类算法相比,具有一定的优势.  相似文献   

19.
为解决在挖掘频繁项集过程中,因忽略不同项目间的重要程度而导致的挖掘有效性低以及忽略数据的动态更新而造成的挖掘效率低的问题,通过引入新的加权规则,从权值与频数两方面去体现项目间的重要性差异,并通过引入树形结构与关系矩阵提高数据动态变化时频繁项集的挖掘效率。创新性地提出基于动态数据的加权频繁项集挖掘算法weighted dynamic date mining (WDDM)。实验结果表明,WDDM算法较以往算法挖掘效率与有效性显著提高,有利于发现更多有研究价值的信息。  相似文献   

20.
刘志刚 《科学技术与工程》2011,11(13):2949-2952
为解决过程神经元网络训练涉及的时域聚合运算问题,提出了过程神经元网络的一种学习算法。算法在网络的输入函数空间引入Legendre正交函数基,将输入函数和网络连接权函数表示为该组正交基的有限项展开形式,利用Legendre函数基的正交性,避免复杂的积分过程,降低过程神经元在时间聚合运算中的复杂性,提高学习效率。仿真实验结果证明了算法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号