首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
在数据流上挖掘频繁闭项集是数据挖掘中关联性挖掘的重要研究课题之一.该文提出了一种高效的数据流频繁闭项挖掘算法——CFMoment,通过使用滑动窗口不断维护数据流中的频繁闭项集,可适用于实时性要求较高的多种数据流处理应用环境.该算法利用项目的有效比特序列表示来减少滑动窗口所需的时间和内存,进一步提升了在数据流中挖掘频繁闭项集的效率并有效降低了运行过程中的内存需求.实验表明,该算法不仅获得了高精度的挖掘结果,而且其运算速度明显快于现有的Moment算法,在数据流上挖掘频繁闭项集的内存消耗更少.  相似文献   

2.
针对集成学习方法在处理大规模数据集时具有计算复杂度高、基分类器数目多、分类精度不理想的问题,提出一种基于频繁模式的选择性集成算法. 该算法利用频繁模式挖掘的原理,将未剪枝的集成分类器和样本空间映射为事务数据库,并利用布尔矩阵存储分类结果,然后从中挖掘频繁基分类器组成最终的集成分类器,达到选择性集成的目的. 实验结果表明,与集成分类算法Bagging、AdaBoost、WAVE 和RFW 相比,该算法减小了集成分类器的规模,提高了集成分类器的分类精度和分类效率.  相似文献   

3.
提出一种基于最优样本子集的在线模糊最小二乘支持向量机(least squares support vector machine,LSSVM) 混沌时间序列预测方法. 算法选择与预测样本时间上以及欧氏距离最近的样本点构成最优样本子集,并采用" 不敏感函数对其进行模糊化处理,通过模糊LSSVM 训练获得预测模型. 随着时间窗口的滑动,最优样本子
集和预测模型实时更新,模型更新采用分块矩阵方法降低运算复杂度. 实验中对时变Ikeda 序列进行预测,表明所提出的方法与离线和在线LSSVM 相比,训练速度更快,预测精度更高.  相似文献   

4.
关联规则是数据挖掘中的重要研究内容之一,国内现有的关联规则算法大多是研究挖掘数据库不变的限定条件下,发现挖掘数据的各属性间的所有关联型知识.而事实上大多数挖掘数据会随时间的变化不断变化.针对数据库中追加数据时,如何有效地更新关联规则的问题,提出了一种新算法———IUAMAR算法.该算法可以有效地利用知识数据库中保留的最小非高频繁项目集产生新的候选项目集,避免了候选项目集的数量太庞大的问题.  相似文献   

5.
基于频繁模式树的约束最大频繁项目集挖掘算法研究   总被引:2,自引:0,他引:2  
目前绝大多数频繁项目集(或最大频繁项目集)挖掘算法并没有考虑相关领域知识,其结果会产生许多无关的模式.因此,发现约束频繁(或约束最大频繁)项目集是多种数据挖掘应用中的关键问题,然而,这方面的研究工作却很少.为此该文提出了一种快速的基于频繁模式树(FP-tree:一种扩展前缀树结构)的约束最大频繁项目集挖掘及其更新算法.实验结果表明该算法是快速有效的.  相似文献   

6.
针对传统闭频繁项集(CFI)挖掘方法耗时长、效率低的问题,提出一种基于数据变换与并行运算(DTPC)的新型挖掘方法:设计基于质数对数运算的数据变换方法,将大量数据转换成简单的数字;利用Spark并行框架中的平方/开方运算将这些数字转换成频繁项集.3 000万篇文章的大数据集实验结果表明,提出的DTPC算法可以大幅度提升数据挖掘效率,同时减少计算资源的不必要浪费.  相似文献   

7.
提出了一种基于多分类-关联规则的快速分类算法——FCMAR,该算法在建立频繁模式树(FP-tree)时裁减掉不能生成频繁规则的项目,因而可减少FP-tree的节点数目,有效地降低时间和空间复杂度,实验结果表明该算法是有效可行的.  相似文献   

8.
模糊时间序列预测模型在对不确定数据集的模糊趋势描述和论域划分方面有局限性,对此文中规范了直觉模糊时间序列的定义,应用直觉模糊C均值聚类算法优化论域区间划分,通过加入回溯机制构建确定性转换直觉模糊规则库,在此基础上提出一种直觉模糊时间序列预测方法,较好地反映了不确定系统数据的特征分布,提高了复杂环境下时间序列的预测精度. 通过典型实例验证了该方法的有效性和优越性.  相似文献   

9.
采掘关联规则是数据采掘领域的一个重要问题,探讨了Apriori算法,基于该算法,提出了1种用Visual Foxpro求频繁项目集的方法,并编写了求频繁项目集的程序。  相似文献   

10.
<正>关联规则(Association Rules)挖掘是数据挖掘研究领域的一个重要研究方向,1993年,美国IBM Almaden Research Center的Agrawal等人首先提出了从交易数据库中发现用户模式的相关性问题,并且提出了基于频繁集的Apriori算法。  相似文献   

11.
高频独立模式对无相关属性选择有一定意义.给出挖掘频繁独立模式算法,并在标准数据挖掘数据集蘑菇数据上测试,得到蘑菇数据在一定度量下的所有频繁独立模式,实验结果表明了挖掘算法的有效性.  相似文献   

12.
把基于数据垂直分布的模糊关联规则挖掘算法引入到网络的入侵检测,利用该算法从网络数据集中对采集到的数据进行模糊化的处理,并将数据垂直分布于位图中.利用k-means聚类算法建立属性的模糊集和模糊隶属函数,该算法克服了传统的离散分区法的不足,同时改进了已有模糊关联规则,提取出具有较高可信性和完备性的模糊关联规则.  相似文献   

13.
常用多元时间序列相似性匹配方法难以在高效刻画局部形态特征的同时考虑各变量间的相关信息. 针对此问题,提出一种动态窗口内多维拟合分段方法. 基于序列的局部形态特征抽象出各变量维度上拟合线段的倾斜角及持续时间,组成模式表示矩阵,并借助一种多元模式距离实现序列的相似性模式匹配. 与主成分分析法、基于点分布特征的匹配法对不同数据规模的数据集进行对比,验证了该方法的有效性,特别对于多变量、不等时间跨度的中等规模多元时间序列相似性匹配具有较好的效果.  相似文献   

14.
数据的挖掘是一门综合的学科,涵盖计算机数据库以及高等数学等诸多学科,对于如何更好地利用分析数据库,学者一直在探索。本文从关联规则基本理论入手,进一步对关联规则挖掘的经典算法Apriori算法和FP-growth(频繁模式增长)算法进行了详尽描述,并提出了两个算法不同的针对点,有助于使用者在应用时根据环境做出适当选择。  相似文献   

15.
尤磊  兰洋 《河南科技》2010,(6):50-51
关联规则(Association Rules)挖掘是数据挖掘研究领域的一个重要研究方向,1993年,美国IBM Almaden Research Center的Agrawal等人首先提出了从交易数据库中发现用户模式的相关性问题,并且提出了基于频繁集的Apriori算法。  相似文献   

16.
在Fp-growth算法的基础上,提出了一种新颖的关联规则挖掘算法.该算法将大型数据库分解成频繁1-项集的项总数个子集,然后对分解得到的各个数据库子集用Fp-growth算法进行约束项数据挖掘,待所有数据库子集的约束项数据挖掘进行完毕后,再合并这些约束频繁项得到大型数据库的频繁项集.实验结果表明新算法所采用的数据库划分策略克服了FP-growth算法对大型数据库进行挖掘时,占用内存大,运行速度慢的不足,是一种适合于大型数据库的关联规则挖掘算法.  相似文献   

17.
首先将事务数据库压缩存储到一棵事务线索树(TT-tree)的结点上,并建立这些结点的索引表,然后寻找结点索引表的最后结点到根结点的全部路径,这些路径及路径的交集包含了用于挖掘关联规则的频繁集,该算法只需扫描事务数据库一次,由于采用了逆向搜索TT-tree的方法,搜索的时间开销非常少,该算法可以挖掘中短模式的海量数据,具有很好的伸缩性,同时该算法具有增量挖掘的功能,通过大量的实验数据进行比较。该算法的速度约是Apriori算法的10倍。  相似文献   

18.
在Apriori算法的递归链接-剪枝概念上,设计了面向海洋异常事件的关联规则挖掘算法.首先给出事件的相关概念与定义、事件的规则表达及评价指标.根据事件的定义和支持度阈值,生成事件频繁1-项集,并设计面向事件的链接-剪枝算法,实现频繁k-项集到(k+1)-项集的产生.根据事件强关联规则评价指标,提取海洋事件强关联规则.通过太平洋海洋异常事件的关联规则挖掘和典型异常事件间的关联规则分析,验证了该方法的正确性和可行性.  相似文献   

19.
链接预测是大规模社会网络分析挖掘的重要研究内容之一,具有非常重要的应用前景.社会网络种类繁多,不同的网络链接类型往往需要不同的链接预测方法 .为了满足用户的个性化需求并提高链接预测的性能,该文提出了一种基于排序学习的社会网络链接预测算法.该算法以传统的链接预测方法为基础,通过排序学习方法对不同的排序结果进行学习,从而得到具有最大准确性的综合排序列表.在综合排序列表的构建中,在每个排序列表中设置一个滑动窗口,通过对滑动窗口的维护每次迭代选出一个全局最优值,从而使得最终的排序列表是最优的.实验表明,该文提出的算法与相关的链接预测算法相比较具有更高的预测性能,能找出一个预测最准确的排序结果 .  相似文献   

20.
模糊关联规则及其挖掘算法   总被引:3,自引:1,他引:2  
通过定义模糊事务数据库,用模糊概念表示事务数据之间的关联关系,提出并定义了模糊关联规则的概念,研究了模糊关联的性质,并给出了一种模糊关联规则的数据挖掘算法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号