首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到14条相似文献,搜索用时 121 毫秒
1.
频繁项目集的快速增量式更新算法   总被引:7,自引:0,他引:7  
提出了频繁项目集的快速增量式更新算法(FIUA),主要考虑最小支持度发生变化时频繁项目集的更新情况.FIUA在最坏的情况下仅需扫描数据库一遍,且无需生成候选项目集,有效地节约了存储空间,提高了频繁项目集的更新效率.  相似文献   

2.
高频独立模式对无相关属性选择有一定意义.给出挖掘频繁独立模式算法,并在标准数据挖掘数据集蘑菇数据上测试,得到蘑菇数据在一定度量下的所有频繁独立模式,实验结果表明了挖掘算法的有效性.  相似文献   

3.
应用最大频繁项集信息熵来进行数据流变化检测.采用了一种新的数据流差异度度量方法;提出了一种新的有效挖掘最大频繁项集的算法;给出了应用最大频繁项集信息熵进行数据流变化检测的算法.最后,对算法的时间效率和空间效率进行了分析.  相似文献   

4.
针对集成学习方法在处理大规模数据集时具有计算复杂度高、基分类器数目多、分类精度不理想的问题,提出一种基于频繁模式的选择性集成算法. 该算法利用频繁模式挖掘的原理,将未剪枝的集成分类器和样本空间映射为事务数据库,并利用布尔矩阵存储分类结果,然后从中挖掘频繁基分类器组成最终的集成分类器,达到选择性集成的目的. 实验结果表明,与集成分类算法Bagging、AdaBoost、WAVE 和RFW 相比,该算法减小了集成分类器的规模,提高了集成分类器的分类精度和分类效率.  相似文献   

5.
一个基于频繁项集的时态数据挖掘算法   总被引:5,自引:0,他引:5  
研究了基于频繁项集的一个时态效据挖掘算法。首先,引进了基于频繁项集关联规则的概念,性质,然后,给出了基于时态约束关联规则的相关概念的定义和性质分析。最后,给出了在时态效据库中挖掘具有时态约束的最大频繁项集,并在此频繁项集生成时态关联规则的算法,由此导出了一种具有一定意义的时态关联规则挖掘方法,这种方法可以崩于商品销售。股票价格等问题的知识发现,最后讨论了该算法在股票效据分析上的一个应用。  相似文献   

6.
针对传统闭频繁项集(CFI)挖掘方法耗时长、效率低的问题,提出一种基于数据变换与并行运算(DTPC)的新型挖掘方法:设计基于质数对数运算的数据变换方法,将大量数据转换成简单的数字;利用Spark并行框架中的平方/开方运算将这些数字转换成频繁项集.3 000万篇文章的大数据集实验结果表明,提出的DTPC算法可以大幅度提升数据挖掘效率,同时减少计算资源的不必要浪费.  相似文献   

7.
关联规则是数据挖掘中的重要研究内容之一,国内现有的关联规则算法大多是研究挖掘数据库不变的限定条件下,发现挖掘数据的各属性间的所有关联型知识.而事实上大多数挖掘数据会随时间的变化不断变化.针对数据库中追加数据时,如何有效地更新关联规则的问题,提出了一种新算法———IUAMAR算法.该算法可以有效地利用知识数据库中保留的最小非高频繁项目集产生新的候选项目集,避免了候选项目集的数量太庞大的问题.  相似文献   

8.
提出了一种基于多分类-关联规则的快速分类算法——FCMAR,该算法在建立频繁模式树(FP-tree)时裁减掉不能生成频繁规则的项目,因而可减少FP-tree的节点数目,有效地降低时间和空间复杂度,实验结果表明该算法是有效可行的.  相似文献   

9.
在Fp-growth算法的基础上,提出了一种新颖的关联规则挖掘算法.该算法将大型数据库分解成频繁1-项集的项总数个子集,然后对分解得到的各个数据库子集用Fp-growth算法进行约束项数据挖掘,待所有数据库子集的约束项数据挖掘进行完毕后,再合并这些约束频繁项得到大型数据库的频繁项集.实验结果表明新算法所采用的数据库划分策略克服了FP-growth算法对大型数据库进行挖掘时,占用内存大,运行速度慢的不足,是一种适合于大型数据库的关联规则挖掘算法.  相似文献   

10.
在数据流上挖掘频繁闭项集是数据挖掘中关联性挖掘的重要研究课题之一.该文提出了一种高效的数据流频繁闭项挖掘算法——CFMoment,通过使用滑动窗口不断维护数据流中的频繁闭项集,可适用于实时性要求较高的多种数据流处理应用环境.该算法利用项目的有效比特序列表示来减少滑动窗口所需的时间和内存,进一步提升了在数据流中挖掘频繁闭项集的效率并有效降低了运行过程中的内存需求.实验表明,该算法不仅获得了高精度的挖掘结果,而且其运算速度明显快于现有的Moment算法,在数据流上挖掘频繁闭项集的内存消耗更少.  相似文献   

11.
负关联规则挖掘算法研究   总被引:5,自引:0,他引:5  
典型的正关联规则仅考虑事务中所列举的项目.负关联规则不但要考虑事务中所包含的项目,还必须考虑事务中所不包含的项目,它包含了非常有价值的信息.然而,对于负关联规则挖掘的研究却很少,仅有的几种算法也存在一定的局限性.为此,文中提出了一种快速有效的负关联规则挖掘算法MNAR,并给出了一种基于二进制形式的支持数计算方法.理论和实验结果表明算法MNAR是有效和可行的.  相似文献   

12.
针对分类中如何有效利用负关联模式提高分类准确率,提出了一种基于正负关联模式的分类算法.利用类Apriori算法挖掘包含正项或/和负项且项与项之间互相关联的正负关联模式来产生分类规则.为提高挖掘效率,先找出能覆盖训练集的信息熵最小k个正,负项.然后,把这k个正/负项分别与其他项进行连接得到相应的正负关联模式.实验表明,该算法有效减少了挖掘的规则数,极大减少了挖掘时间,并提高了分类准确率.  相似文献   

13.
基于数据挖掘思想的故障模式分析   总被引:1,自引:0,他引:1  
提出了一种新型的基于数据挖掘思想的故障模式分析.通过收集故障现象并整理形成故障信息维度表,产品技术参数、故障原因等组成的关系规则维度表;基于故障信息维度表与关系规则维度表应用Apriori算法的频繁项集方法对故障信息进行分析,通过故障匹配、生成候选集、过滤候选集,最后确定故障原因,优选出排除故障方案.  相似文献   

14.
综述了数据挖掘技术在网络入侵检测中的应用,阐述了关联规则分析在网络入侵检测中的应用原理和最新的研究与改进,并指出了目前存在的问题和未来研究的方向。改进由k阶频繁项集生成k+1阶候选频繁项集时的连接和剪枝策略;改进对事务的处理方式,当所有联接完成时只扫描一遍Lk-1,减少Apriori算法中的模式匹配所需的时间开销。实验表明,该算法应用于此系统来提取用户行为特征和入侵模式特征,提高了整个系统的性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号