共查询到20条相似文献,搜索用时 46 毫秒
1.
2.
针对FP-growth算法存在的不能进行增量更新,以及已有基于FP-growth的增量更新算法效率不高、不支持连续更新等问题,在FP-tree基础上,提出了增量更新改进算法FPIUA2,其适用于数据集连续增加的情形,适用于稀疏型数据集和稠密型数据集、支持连续执行.实验表明:该算法的效率远高于FPgrowth和已有的增量更新算法,其执行效率较FP-Growth、FPUA和FIUA2算法提高了1个数量级,并且具有很好的可扩展性. 相似文献
3.
4.
5.
采用粗糙集的理论思想,将传统数据库转换成更容易处理的基于属性的决策系统.无需产生候选项集,克服了Apriori算法频繁扫描数据库的缺陷,并采用分割思想.大大提高了算法的执行效率. 相似文献
6.
关联规则是数据挖掘中的重要研究内容之一,国内现有的关联规则算法大多是研究挖掘数据库不变的限定条件下,发现挖掘数据的各属性间的所有关联型知识.而事实上大多数挖掘数据会随时间的变化不断变化.针对数据库中追加数据时,如何有效地更新关联规则的问题,提出了一种新算法———IUAMAR算法.该算法可以有效地利用知识数据库中保留的最小非高频繁项目集产生新的候选项目集,避免了候选项目集的数量太庞大的问题. 相似文献
7.
本文分析了数据挖掘的经典Apriori算法存在的缺陷:处理规模巨大的候选项目集时需要消耗大量的时间;对候选项目集进行模式匹配时需要多次重复扫描事物数据库,降低算法的速度和效率。针对这些缺陷本文对经典的算法和优化策略进行了剖析,提出一种新的发现频繁项目序列集的算法DISS-DM。本算法是在算法ISS-DM的基础上加以改进,采用了数据分割法将数据库分成多个分片,对每个分片进行一次扫描找出局部频繁项集,对整个数据库扫描发现全局频繁项集。本算法只需要扫描数据库两次,就能发现全局频繁项集,能减少内存需求,有利于大型数据库的数据分割优化。 相似文献
8.
9.
针对如何减少关联分类方法中冗余规则,增加FOIL算法的规则数,以提高分类准确率,提出了一种结合关联与FOIL算法的分类方法,并称之为ACFA.首先,以类支持度和自信度为度量提取长度为1和2的规则,其次,利用Apriori算法挖掘出频繁2-项集F2,然后在频繁2-项集F2申挑选满足条件的频繁项建立候选集,最后在候选集上运用FOIL算法来产生分类规则.实验表明算法ACFA不但有效减少了关联分类方法中冗余的规则,并大大增加了FOIL算法的规则数,提高了分类的准确率. 相似文献
10.
11.
《湖南师范大学自然科学学报》2015,(4)
为了提高支持向量回归算法的学习能力,提出了一种基于因果网络的特征选择算法.该方法假设目标变量和特征候选集之间符合一个因果网络模型,然后利用基于条件独立性测试的方法对目标变量的直接影响特征进行识别,从候选特征集之中获取与目标变量有着直接因果关系的特征子集.虚拟和真实数据集上的实验结果表明,该特征选择算法适用于支持向量回归算法,优于目前其他算法. 相似文献
12.
综述了数据挖掘技术在网络入侵检测中的应用,阐述了关联规则分析在网络入侵检测中的应用原理和最新的研究与改进,并指出了目前存在的问题和未来研究的方向。改进由k阶频繁项集生成k+1阶候选频繁项集时的连接和剪枝策略;改进对事务的处理方式,当所有联接完成时只扫描一遍Lk-1,减少Apriori算法中的模式匹配所需的时间开销。实验表明,该算法应用于此系统来提取用户行为特征和入侵模式特征,提高了整个系统的性能。 相似文献
13.
一种高效相联规则提取算法 总被引:9,自引:0,他引:9
在Apriori算法基础上,提出改进算法AprioriPro。利用中间结果对数据库进行过滤,从而加快候选项集的计数速度,提高了整个算法的效率。 相似文献
14.
《哈尔滨师范大学自然科学学报》2017,(5)
针对传统关联规则Apriori算法在挖掘关联规则时需多次扫描事务数据库,增加系统I/O、通信的开销等性能问题,进行了算法的改进,改进后的算法D_Apriori通过去除候选集并结合布尔矩阵方式来压缩存储事务数据,从而减少事务数据库的扫描次数,并借助Hadoop平台的MapReduce并行编程模式,实现D_Apriori算法并行化,简化了生成候选项的连接步骤,同时在计算的过程中对事务进行压缩,提高了运算速度,改善了算法的性能,最后通过实验进行对比分析表明改进后的并行算法能较好地降低挖掘频繁项集时的I/O和通信开销,具有高效性与良好的加速比. 相似文献
15.
《湖南师范大学自然科学学报》2018,(5)
为提高异步电动机故障诊断过程中所采集状态信息的传输效率及诊断结果的可靠性,提出了一种采用奇异值分解的压缩感知优化方法.该方法首先对测量矩阵进行奇异值分解,然后将优化后的测量矩阵和测量向量用于压缩感知贪婪类迭代算法中,再通过精确的夹角余弦法筛选出与残差最为匹配的候选集原子,并将此原子用于稀疏信号的重构,最后得到估计的故障诊断数据信号.仿真结果表明:在相同的信号稀疏度或测量数目下,提出的优化算法相比传统的压缩感知算法能极大提高远程故障诊断数据信号的重构精度,这对实际工程中后期故障的有效去除具有重要意义. 相似文献
16.
一种改进的粗集综合评价方法 总被引:3,自引:0,他引:3
陈自洁 《海南师范大学学报(自然科学版)》2005,18(4):324-329
基于区分矩阵的粗集综合评价方法由于存在对评价对象的反复比较,因此影响了求解指标约简及权重的效率.利用区分矩阵的变形———广义信息表提出的一种改进的粗集综合评价方法,能够减少对对象的重复比较,更快地进行指标约简和权重设置.此外,通过将该方法应用于政府效率评估来验证了方法的可行性和有效性. 相似文献
17.
多维数据仓库系统中高性能DCA-Tree Cube的研究 总被引:1,自引:0,他引:1
提出了利用R^*—tree改进的DCA—tree(data cube aggregate—tree)来创建高性能的DCA—tree cube聚集cube,阐述了创建DCA—tree cube、DCA—tree cube增量更新和MOLAP快速查询等关键技术.算法分析表明,所提出的DCA—tree cube在查询和更新效率方面要比以往DDC等方法创建的cube要高,解决了在插入新维数据时cube增量的更新维护. 相似文献
18.
基于数据挖掘思想的故障模式分析 总被引:1,自引:0,他引:1
提出了一种新型的基于数据挖掘思想的故障模式分析.通过收集故障现象并整理形成故障信息维度表,产品技术参数、故障原因等组成的关系规则维度表;基于故障信息维度表与关系规则维度表应用Apriori算法的频繁项集方法对故障信息进行分析,通过故障匹配、生成候选集、过滤候选集,最后确定故障原因,优选出排除故障方案. 相似文献
19.
20.
谢科 《湖南师范大学自然科学学报》2013,(2):24-27
在决策表中,为了评价某条件属性的重要性,不但要考虑这个属性(单一属性)相对于决策属性的重要性,还要考虑该条件属性与其他条件属性构成的属性集的重要性.在属性集依赖度比单一属性依赖度更加可信的事实基础上,提出了一个基于可分辨矩阵的属性集依赖度计算方法.该方法能够较快地获得可分辨矩阵,并直接求出属性集的依赖度,从而大大降低了算法的时间复杂度.实例验证了该方法具有较好的有效性和较低的时间复杂度. 相似文献