首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
为了减少无用候选序列的生成,并使挖掘得到的序列模式符合用户要求,约束条件下的频繁序列模式挖掘已成为数据挖掘领域的一个新的重要研究方向.作为强约束形式的一种,均值约束目前仍然是基于约束的频繁序列模式挖掘的一个困难问题,其主要原因在于很难利用均值约束来进行序列模式挖掘中的剪枝.为此,提出了一种基于均值约束满足度剪枝策略,并且以前缀增长方法为基础设计了一个有效的频繁序列模式挖掘算法.通过分析并实验验证了该算法的时间效率和剪枝性能,结果表明,该方法是有效的.  相似文献   

2.
为求解蛋白质折叠结构预测问题提出一种基于剪枝策略的启发式搜索算法.剪枝算法用一棵搜索树描述蛋白质构形的生长过程,通过定义权重、上下门槛制定一套有效的控制分支繁殖的规则,从而极大地提高了搜索的效率.采用国际文献公认的10个算例作为剪枝算法的实验测试集,并与目前国际上4个著名的算法进行比较,实验比较结果表明剪枝算法是一个高效的求解算法.  相似文献   

3.
最大频繁项集挖掘可以广泛应用在多种重要的Web挖掘工作中.为了有效地削减搜索空间,提出了一种新的最大频繁项集挖掘中的搜索空间剪枝策略.这种策略基于深度优先遍历词典序子集枚举树,利用树中子节点与父节点扩展集中相同项的扩展支持度相等的特性,对搜索空间进行剪枝.应用该策略,对MAFIA算法进行改进优化.实验结果表明,该剪枝策略可以有效削减搜索空间,尤其在稀疏但包含长频繁项集的数据集上,搜索空间削减掉2/3,算法的时间效率比原MAFIA算法提高3~5倍.  相似文献   

4.
由于在现有的闭频繁项集挖掘算法中,剪枝策略相对单一,大都是针对1-项集进行剪枝,对2-项集和n-项集(n≥3)的剪枝策略相对匮乏,而有效的剪枝策略可以提前发现并剪掉大量没有希望的项集,因此改进闭频繁项集的剪枝策略对此类算法效率的提升具有很大的帮助。为此在ESCS(Estimated Support Co-occurrence Structure)结构基础上,提出针对2-项集的ESCS剪枝策略,并应用其将经典闭频繁项集挖掘算法DCI_Closed(Direct Count Intersect Closed)改进为DCI_ESCS(Direct Count Intersect Estimated Support Co-occurrence Structure)算法,同时对ESCS剪枝策略的效果加以验证。在多个公开数据集上、不同最小支持度阈值下,对改进前后算法时间性能进行比较实验。实验结果表明,改进的DCI_ESCS算法在事务和项集较长的、较稠密的数据集上表现良好,时间效率均有一定程度的提高。  相似文献   

5.
图数据的挖掘工作是数据挖掘工作中的重要组成部分,已经有许多人在这个领域进行了深入的研究.由于数据获取不可避免噪音数据,故在挖掘频繁图时考虑近似十分重要.然而许多此前的工作只考虑了子图间编辑距离(Graph Edit Distance,GED)的绝对值,而没有考虑子图间编辑距离与子图大小的相对关系.提出了一种在单图中进行近似频繁子图挖掘的新算法,并在计算近似程度时考虑当前子图的大小.该算法通过对近似频繁子图的大小上限进行预测,并通过局部反单调性进行剪枝,提高了算法的效率.实验表明,该算法能够挖掘出传统算法无法发现的近似频繁子图,且相比对比算法具有更好的时间性能.  相似文献   

6.
人工神经网络混合剪枝算法   总被引:4,自引:0,他引:4  
目前人工神经网络(ANN)应用中所遇到的挑战之一就是如何针对特定问题确定相应网络。基于进化算法和局部搜索算法两类策略的特点和不足,文中提出了混合剪枝算法HAP(HybridAlgorithmofPruning)。算法首先联合进化算法代表之一遗传算法(GA)和反向传播算法BP的不同优势完成ANN网络结构和权重进化的初步阶段;然后应用多权重剪枝策略(MW-OBS)进一步简化、确定网络结构。结合案例与以往的混合策略算法进行对比研究,结果表明HAP在寻优能力、简化网络结构、保证稳定性等方面均有明显优势,更加适合大规模ANN的优化问题。  相似文献   

7.
随着互联网技术的快速发展与普及,尤其是Web2.0时代的来临,网络数据量与日俱增.对新增数据进行挖掘成为数据挖掘领域研究的热点之一.基于存在全局站点的分布式数据挖掘思想,提出了一种存在全局站点的分布式增量挖掘算法.首先对局部站点的增量数据进行全局挖掘,有效减少了局部站点对原有数据的扫描次数;然后在全局站点采用新的剪枝策略,极大地降低了产生的候选集数量;最后通过实例验证了所给算法切实可行,并具有较好的挖掘效率.  相似文献   

8.
关联规则挖掘的一种多剪枝概念格方法   总被引:1,自引:0,他引:1  
多数据源上关联规则挖掘方法,由于各数据节点间相互通信的候选项集数目过于庞大或者挖掘过程需要对数据库进行多次扫描,导致挖掘算法效率不高。研究剪枝概念格(pruned con-cept laffice,PCL)中概念与频繁项集表示关系,定义剪枝格上的导出频繁项集,设计了一个利用多剪枝概念格从多数据源上挖掘近似所有关联规则的算法UMPCL(union algorithm of multiplepruned concept lattice)。利用一个频繁概念表示一些频繁项集以减少挖掘过程中产生的侯选项集数,使用与全局支持度相等的局部支持度对各子概念格进行剪枝,最后融合、剪枝各子剪枝格并提取全局关联规则。理论分析和实验验证表明该算法是有效的。  相似文献   

9.
基于ZigBee网络的自适应剪枝能耗均衡路由算法   总被引:1,自引:0,他引:1  
在ZigBee网络中建立两个节点的通信时,为了既保证路径中总的能量耗费最低,又令路径中不包括剩余能量较少的节点,尽量延长网络的寿命,提出了基于ZigBee网络的自适应剪枝能耗均衡(AP-ECB)路由算法.该算法包括两个改进的策略:自适应剪枝策略和能耗均衡策略.自适应剪枝策略采用有效的剪枝策略令更多的节点进入休眠状态,节约了能耗;能耗均衡策略规避了将剩余能量较少的节点选入路径,保证了ZigBee网络的可用性.对AODVjr和AP-ECB路由算法进行了仿真验证,结果表明:AP-ECB路由算法选择的路径能耗更少,同时遇到的死亡节点更少.  相似文献   

10.
决策树剪枝是决策树分类学习中的重要步骤,可降低决策树复杂程度和提高决策树泛化能力,从而提高决策树识别精度和效率。通过利用系数函数综合决策树的错误率和规模,形成决策树剪枝标准,在系数函数的参数合适选取,采用自底向上遍历过程逐一进行判断剪枝。实验结果表明,综合考虑决策树的分类预测准确率和决策树的规模大小,BASP剪枝算法能够获得更好的剪枝效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号