首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
频繁项目集的快速增量式更新算法   总被引:7,自引:0,他引:7  
提出了频繁项目集的快速增量式更新算法(FIUA),主要考虑最小支持度发生变化时频繁项目集的更新情况.FIUA在最坏的情况下仅需扫描数据库一遍,且无需生成候选项目集,有效地节约了存储空间,提高了频繁项目集的更新效率.  相似文献   

2.
针对FP-growth算法存在的不能进行增量更新,以及已有基于FP-growth的增量更新算法效率不高、不支持连续更新等问题,在FP-tree基础上,提出了增量更新改进算法FPIUA2,其适用于数据集连续增加的情形,适用于稀疏型数据集和稠密型数据集、支持连续执行.实验表明:该算法的效率远高于FPgrowth和已有的增量更新算法,其执行效率较FP-Growth、FPUA和FIUA2算法提高了1个数量级,并且具有很好的可扩展性.  相似文献   

3.
在Apriori算法的递归链接-剪枝概念上,设计了面向海洋异常事件的关联规则挖掘算法.首先给出事件的相关概念与定义、事件的规则表达及评价指标.根据事件的定义和支持度阈值,生成事件频繁1-项集,并设计面向事件的链接-剪枝算法,实现频繁k-项集到(k+1)-项集的产生.根据事件强关联规则评价指标,提取海洋事件强关联规则.通过太平洋海洋异常事件的关联规则挖掘和典型异常事件间的关联规则分析,验证了该方法的正确性和可行性.  相似文献   

4.
针对集成学习方法在处理大规模数据集时具有计算复杂度高、基分类器数目多、分类精度不理想的问题,提出一种基于频繁模式的选择性集成算法. 该算法利用频繁模式挖掘的原理,将未剪枝的集成分类器和样本空间映射为事务数据库,并利用布尔矩阵存储分类结果,然后从中挖掘频繁基分类器组成最终的集成分类器,达到选择性集成的目的. 实验结果表明,与集成分类算法Bagging、AdaBoost、WAVE 和RFW 相比,该算法减小了集成分类器的规模,提高了集成分类器的分类精度和分类效率.  相似文献   

5.
采用粗糙集的理论思想,将传统数据库转换成更容易处理的基于属性的决策系统.无需产生候选项集,克服了Apriori算法频繁扫描数据库的缺陷,并采用分割思想.大大提高了算法的执行效率.  相似文献   

6.
关联规则是数据挖掘中的重要研究内容之一,国内现有的关联规则算法大多是研究挖掘数据库不变的限定条件下,发现挖掘数据的各属性间的所有关联型知识.而事实上大多数挖掘数据会随时间的变化不断变化.针对数据库中追加数据时,如何有效地更新关联规则的问题,提出了一种新算法———IUAMAR算法.该算法可以有效地利用知识数据库中保留的最小非高频繁项目集产生新的候选项目集,避免了候选项目集的数量太庞大的问题.  相似文献   

7.
本文分析了数据挖掘的经典Apriori算法存在的缺陷:处理规模巨大的候选项目集时需要消耗大量的时间;对候选项目集进行模式匹配时需要多次重复扫描事物数据库,降低算法的速度和效率。针对这些缺陷本文对经典的算法和优化策略进行了剖析,提出一种新的发现频繁项目序列集的算法DISS-DM。本算法是在算法ISS-DM的基础上加以改进,采用了数据分割法将数据库分成多个分片,对每个分片进行一次扫描找出局部频繁项集,对整个数据库扫描发现全局频繁项集。本算法只需要扫描数据库两次,就能发现全局频繁项集,能减少内存需求,有利于大型数据库的数据分割优化。  相似文献   

8.
基于频繁模式树的约束最大频繁项目集挖掘算法研究   总被引:2,自引:0,他引:2  
目前绝大多数频繁项目集(或最大频繁项目集)挖掘算法并没有考虑相关领域知识,其结果会产生许多无关的模式.因此,发现约束频繁(或约束最大频繁)项目集是多种数据挖掘应用中的关键问题,然而,这方面的研究工作却很少.为此该文提出了一种快速的基于频繁模式树(FP-tree:一种扩展前缀树结构)的约束最大频繁项目集挖掘及其更新算法.实验结果表明该算法是快速有效的.  相似文献   

9.
针对如何减少关联分类方法中冗余规则,增加FOIL算法的规则数,以提高分类准确率,提出了一种结合关联与FOIL算法的分类方法,并称之为ACFA.首先,以类支持度和自信度为度量提取长度为1和2的规则,其次,利用Apriori算法挖掘出频繁2-项集F2,然后在频繁2-项集F2申挑选满足条件的频繁项建立候选集,最后在候选集上运用FOIL算法来产生分类规则.实验表明算法ACFA不但有效减少了关联分类方法中冗余的规则,并大大增加了FOIL算法的规则数,提高了分类的准确率.  相似文献   

10.
针对压缩感知中贪婪类信号重构算法精度不高的问题,提出一种多候选集广义正交匹配追踪算法.按照测量矩阵与残差内积的相关性选出多个原子作为多个候选集,然后在迭代时分别将多个原子加入对应候选集,以提高算法收敛速度.从多个候选集中选出残差最小的一个作为最终支撑集,实现信号的精确重构.实验表明,该算法与已有的同类算法相比能更好地重构原始信号,且算法复杂度较低.  相似文献   

11.
为了提高支持向量回归算法的学习能力,提出了一种基于因果网络的特征选择算法.该方法假设目标变量和特征候选集之间符合一个因果网络模型,然后利用基于条件独立性测试的方法对目标变量的直接影响特征进行识别,从候选特征集之中获取与目标变量有着直接因果关系的特征子集.虚拟和真实数据集上的实验结果表明,该特征选择算法适用于支持向量回归算法,优于目前其他算法.  相似文献   

12.
综述了数据挖掘技术在网络入侵检测中的应用,阐述了关联规则分析在网络入侵检测中的应用原理和最新的研究与改进,并指出了目前存在的问题和未来研究的方向。改进由k阶频繁项集生成k+1阶候选频繁项集时的连接和剪枝策略;改进对事务的处理方式,当所有联接完成时只扫描一遍Lk-1,减少Apriori算法中的模式匹配所需的时间开销。实验表明,该算法应用于此系统来提取用户行为特征和入侵模式特征,提高了整个系统的性能。  相似文献   

13.
一种高效相联规则提取算法   总被引:9,自引:0,他引:9  
在Apriori算法基础上,提出改进算法AprioriPro。利用中间结果对数据库进行过滤,从而加快候选项集的计数速度,提高了整个算法的效率。  相似文献   

14.
针对传统关联规则Apriori算法在挖掘关联规则时需多次扫描事务数据库,增加系统I/O、通信的开销等性能问题,进行了算法的改进,改进后的算法D_Apriori通过去除候选集并结合布尔矩阵方式来压缩存储事务数据,从而减少事务数据库的扫描次数,并借助Hadoop平台的MapReduce并行编程模式,实现D_Apriori算法并行化,简化了生成候选项的连接步骤,同时在计算的过程中对事务进行压缩,提高了运算速度,改善了算法的性能,最后通过实验进行对比分析表明改进后的并行算法能较好地降低挖掘频繁项集时的I/O和通信开销,具有高效性与良好的加速比.  相似文献   

15.
为提高异步电动机故障诊断过程中所采集状态信息的传输效率及诊断结果的可靠性,提出了一种采用奇异值分解的压缩感知优化方法.该方法首先对测量矩阵进行奇异值分解,然后将优化后的测量矩阵和测量向量用于压缩感知贪婪类迭代算法中,再通过精确的夹角余弦法筛选出与残差最为匹配的候选集原子,并将此原子用于稀疏信号的重构,最后得到估计的故障诊断数据信号.仿真结果表明:在相同的信号稀疏度或测量数目下,提出的优化算法相比传统的压缩感知算法能极大提高远程故障诊断数据信号的重构精度,这对实际工程中后期故障的有效去除具有重要意义.  相似文献   

16.
一种改进的粗集综合评价方法   总被引:3,自引:0,他引:3  
基于区分矩阵的粗集综合评价方法由于存在对评价对象的反复比较,因此影响了求解指标约简及权重的效率.利用区分矩阵的变形———广义信息表提出的一种改进的粗集综合评价方法,能够减少对对象的重复比较,更快地进行指标约简和权重设置.此外,通过将该方法应用于政府效率评估来验证了方法的可行性和有效性.  相似文献   

17.
多维数据仓库系统中高性能DCA-Tree Cube的研究   总被引:1,自引:0,他引:1  
提出了利用R^*—tree改进的DCA—tree(data cube aggregate—tree)来创建高性能的DCA—tree cube聚集cube,阐述了创建DCA—tree cube、DCA—tree cube增量更新和MOLAP快速查询等关键技术.算法分析表明,所提出的DCA—tree cube在查询和更新效率方面要比以往DDC等方法创建的cube要高,解决了在插入新维数据时cube增量的更新维护.  相似文献   

18.
基于数据挖掘思想的故障模式分析   总被引:1,自引:0,他引:1  
提出了一种新型的基于数据挖掘思想的故障模式分析.通过收集故障现象并整理形成故障信息维度表,产品技术参数、故障原因等组成的关系规则维度表;基于故障信息维度表与关系规则维度表应用Apriori算法的频繁项集方法对故障信息进行分析,通过故障匹配、生成候选集、过滤候选集,最后确定故障原因,优选出排除故障方案.  相似文献   

19.
为了提高异构计算机系统中任务调度的节能水平,提出了融合剪枝优化的多变邻域节能调度算法.算法构建处理机约束和时间约束两个邻域结构,借助处理机约束邻域减少冗余处理机量,从而降低整体能耗;利用时间约束邻域有效缩减关键路径长度,实现了任务调度对时间的要求.提出了基于时间和能耗的剪枝优化策略,以提高局部寻优效率.通过仿真实验和实...  相似文献   

20.
在决策表中,为了评价某条件属性的重要性,不但要考虑这个属性(单一属性)相对于决策属性的重要性,还要考虑该条件属性与其他条件属性构成的属性集的重要性.在属性集依赖度比单一属性依赖度更加可信的事实基础上,提出了一个基于可分辨矩阵的属性集依赖度计算方法.该方法能够较快地获得可分辨矩阵,并直接求出属性集的依赖度,从而大大降低了算法的时间复杂度.实例验证了该方法具有较好的有效性和较低的时间复杂度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号