共查询到20条相似文献,搜索用时 46 毫秒
1.
2.
3.
本文分析了数据挖掘的经典Apriori算法存在的缺陷:处理规模巨大的候选项目集时需要消耗大量的时间;对候选项目集进行模式匹配时需要多次重复扫描事物数据库,降低算法的速度和效率。针对这些缺陷本文对经典的算法和优化策略进行了剖析,提出一种新的发现频繁项目序列集的算法DISS-DM。本算法是在算法ISS-DM的基础上加以改进,采用了数据分割法将数据库分成多个分片,对每个分片进行一次扫描找出局部频繁项集,对整个数据库扫描发现全局频繁项集。本算法只需要扫描数据库两次,就能发现全局频繁项集,能减少内存需求,有利于大型数据库的数据分割优化。 相似文献
4.
《哈尔滨师范大学自然科学学报》2016,(2)
针对FUP算法在频繁集增量更新时,剪枝效率低下以及候选集验证速度慢的缺陷,提出了基于支持矩阵的频繁集增量更新的高效挖掘算法—SMFUP算法.该算法不仅采用支持矩阵进行整体剪枝来提高剪枝效率,而且进一步结合频繁2项集矩阵加快候选频繁集的验证速度,从而使算法的增量更新效率大大提高.最后通过实验证明了算法改进的有效性. 相似文献
5.
关联规则是数据挖掘中的重要研究内容之一,国内现有的关联规则算法大多是研究挖掘数据库不变的限定条件下,发现挖掘数据的各属性间的所有关联型知识.而事实上大多数挖掘数据会随时间的变化不断变化.针对数据库中追加数据时,如何有效地更新关联规则的问题,提出了一种新算法———IUAMAR算法.该算法可以有效地利用知识数据库中保留的最小非高频繁项目集产生新的候选项目集,避免了候选项目集的数量太庞大的问题. 相似文献
6.
针对如何减少关联分类方法中冗余规则,增加FOIL算法的规则数,以提高分类准确率,提出了一种结合关联与FOIL算法的分类方法,并称之为ACFA.首先,以类支持度和自信度为度量提取长度为1和2的规则,其次,利用Apriori算法挖掘出频繁2-项集F2,然后在频繁2-项集F2申挑选满足条件的频繁项建立候选集,最后在候选集上运用FOIL算法来产生分类规则.实验表明算法ACFA不但有效减少了关联分类方法中冗余的规则,并大大增加了FOIL算法的规则数,提高了分类的准确率. 相似文献
7.
属性核的确定对于求属性约简具有重要的意义,利用协调信息系统中条件属性的划分相对于决策属性划分的概率分布为单点分布的性质,提出一种新的求核算法.采用多个UCI数据集进行实验,结果表明该算法的效率高于基于辨识矩阵和基于信息熵的求核算法. 相似文献
8.
9.
在数据采掘中,运用传统的粗略集模型能对完整的数据库进行所需的规则抽取。在此基础上研究了广义粗略集模型对不完整数据库的数据采掘问题。 相似文献
10.
提出了一种基于多分类-关联规则的快速分类算法——FCMAR,该算法在建立频繁模式树(FP-tree)时裁减掉不能生成频繁规则的项目,因而可减少FP-tree的节点数目,有效地降低时间和空间复杂度,实验结果表明该算法是有效可行的. 相似文献
11.
采用粗糙集的理论思想,将传统数据库转换成更容易处理的基于属性的决策系统.无需产生候选项集,克服了Apriori算法频繁扫描数据库的缺陷,并采用分割思想.大大提高了算法的执行效率. 相似文献
12.
13.
14.
王文章 《湘潭大学自然科学学报》1983,(2)
本文了在[1]的基础上引入了逻辑电路C的实质变量和实质故障的概念,给出了构造实质半复盖矩阵的方法,从而得到了求单输出逻辑电路C的最小测试集的一个方法。用这个方法求最小集时可以节省大量的存储空间,并且产生最小集的效率也有所提高。如果用算法[2][3][4]对实质故障产生测试码,那么不仅避免了对非实质故障产生不必要的测试码,而且还不损失整个电路的故障复盍率。 相似文献
15.
16.
关联规则(Association Rules)挖掘是数据挖掘研究领域的一个重要研究方向,1993年,美国IBM Almaden Research Center的Agrawal等人首先提出了从交易数据库中发现用户模式的相关性问题,并且提出了基于频繁集的Apriori算法。 相似文献
17.
18.
针对基于网络结构的推荐算法在资源分配过程中采用平均分配方式,产生的推荐结果个性化程度低的问题,提出了一种结合用户偏好和项目属性的网络结构推荐算法。通过用户评分数据和用户对项目属性偏好程度计算用户偏好相似度,在资源分配过程中根据用户偏好相似度调整资源分配方式,使其更加合理,产生更好的个性化推荐结果。Movie Lens数据集上的实验表明,所提出的推荐算法相比于其它算法,显著提高了准确率、召回率、多样性,降低了推荐项目的流行度。 相似文献
19.
为了获得流格式数据集的规则挖掘以及降低挖掘过程中的计算开销,提出一种基于动态模糊频繁模式的数据挖掘方法 .首先,确定一种滑动窗口区分新旧事务,以处理连续产生的数据流;然后构建动态模糊频繁模式树(DFFMT),随着滑动窗口的变化,给每个删除的旧窗格添加相应算法,且插入新窗格;最后,当DFFMT构建完成之后,根据当前窗口推理模糊关联规则.两个公开数据集的实验验证了提出方法的有效性.与其他同类方法相比,提出的方法只需要检索数据库一次,可以处理大量的流格式数据集.同时,运行复杂度和存储复杂度表现也较优. 相似文献