首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
张军舰  李玲玲 《广西科学》2009,16(2):113-116,123
讨论上界型修正Berk-Jones(RBJ)拟合优度检验统计量在简单零假设下的极限分布后,给出一种新的积分型RBJ检验统计量,并研究这种统计量在简单零假设下的极限分布,然后对这两种RBJ型检验与其他常用检验的功效进行模拟比较。模拟结果显示,两种RBJ型检验在我们所作的大多数模拟情况下不比常用的拟合优度检验差。  相似文献   

2.
基于FP-tree的最大频繁项集挖掘算法   总被引:1,自引:0,他引:1  
现有的最大频繁项集挖掘算法在支持度阈值较大情况下已达到较高性能,但在支持度阈值较小时,由于候选项集的快速增长,其性能往往不理想。文章提出了一种基于频繁模式树(FP-tree)存储结构的最大频繁项集挖掘算法——DMFIF算法,将FP-tree各分枝作为初始候选项集,并按维数和支持度递减排序,结合子集剪枝策略,自顶向下搜索挖掘最大频繁项集。实验结果表明,该算法在低支持度阈值下稠密数据集中挖掘长模式具有较好性能。  相似文献   

3.
Fp-growth算法是当前挖掘频繁项目集算法中速度最快,应用最广,并且不需要候选集的一种挖掘关联规则的算法.但是,Fp-growth算法也存在着算法结构复杂和空间利用率低等缺点.在FP-tree结构的基础上提出了密集型数据最大频繁模式挖掘算法FP-DMax.算法FP-DMax只需要2次扫描数据库,在挖掘过程中不产生候选项集,大大提高了算法的时空效率.实验表明,算法FP-DMax在挖掘密集型数据最大频繁模式方面是高效的.  相似文献   

4.
在挖掘最大频繁项目集的过程中,通过改变最小支持度阈值可以挖掘更有用的最大频繁项目集,为此提出了一种最大频繁项目集更新挖掘算法UAMMFI(Updating Algorithm for Mining Maximal Frequent Itemsets)。算法基于改进后的频繁模式树结构,在更新挖掘过程中,不需产生候选项目集和条件模式树,并且充分利用先前已挖掘的最大频繁项目集中包含的信息,快速更新挖掘出最小支持度阈值变化后的最大频繁项目集。实验结果表明,算法能够高效更新挖掘最大频繁项目集。  相似文献   

5.
时空轨迹频繁模式挖掘旨在从大规模轨迹数据中发现频繁时序模式,其过程主要包括数据处理和频繁行为发现2个阶段。综述了近年时空轨迹频繁模式挖掘的研究进展,首先对挖掘的过程进行概述;然后将挖掘算法按照轨迹维度特征分为基于位置的轨迹频繁模式挖掘、基于活动周期的轨迹频繁模式挖掘和基于语义的轨迹频繁模式挖掘3类,并分别展开论述;最后讨论了这些算法的基本思想和优缺点,并从挖掘方式、适用范围等方面进行对比分析。  相似文献   

6.
文章提出了一种基于交集关系原理的算法叫做交集算法,它与类Apriori算法本质上互补。这种算法的最大优势是不需要产生大量的候选频繁访问模式,就可以直接生成最大频繁访问模式,因此在挖掘过程中也就不需要反复扫描原始数据库来计算各个候选频繁访问模式的支持度计数;经理论分析和试验证明,交集算法具有一定的理论意义和应用价值。  相似文献   

7.
本文借助经验欧氏似然构造一类新的拟合优度检验,并讨论在简单零假设下,检验统计量的极限分布;然后利用极大似然估计所得的参数估计量构造复合零假设下的检验函数,并讨论其极限性质;最后把所得的检验与已有的Pearson x2检验和KS检验进行模拟比较,模拟结果显示基于经验欧氏似然的检验比其他的检验有相对的优势:功效较高、计算简单等,在应用上更具有推广价值.  相似文献   

8.
目前采用博弈分析和流量预测等模型,对未来时间段道路网货运车辆超限行为进行提前识别,取得一定的检测效果,但对具有时空动态性和迁移性的超限车辆分布挖掘仍具有局限性.根据道路网超限车辆数据特点,提出一种基于弱关联频繁模式的超限行为的挖掘优化算法,该算法采用空间弱关联频繁模式构建的超限频繁模式树,建立时间弱关联的状态转移模型,得到频繁模式的预测值.在FP-growth频繁模式挖掘算法的基础上,首次建立了超限模式挖掘与货运车辆行为数据的时空弱关联,使超限行为预测算法误差率降至6%以下,有效提高了超限行为的检测效率.  相似文献   

9.
DMBIT:一种有效的序列模式挖掘算法   总被引:1,自引:0,他引:1  
大量候选序列模式支持度的计算所带来的时间消耗是序列模式挖掘主要问题之一,为此提出了一种有效的序列模式挖掘算法:DMBIT(Data Mining Bitmap),该算法根据位索引表和Seq-list表的结构,采用渐进的事件扩展,事务扩展方法,通过有效的剪枝策略和"与"逻辑运算操作进一步缩小了频繁序列的搜索范围,同时通过序列列表ListX的生成加快了相应候选项支持度的计算,算法分析和实验结果表明,在大数据集环境下的DMBIT算法性能优越,能够明显加速数据库中最大频繁序列的生成.  相似文献   

10.
应用模式输出统计作海雾出现判别预报   总被引:1,自引:0,他引:1  
应用模式输出统计的逐步判别方法,对山东南部沿海4-7月海雾出现作24h的判别预报。候选预报因子包括:日本数值预报传真图,近岸台站的观测,经验设计因子及其一些组合因子。  相似文献   

11.
为了减少无用候选序列的生成,并使挖掘得到的序列模式符合用户要求,约束条件下的频繁序列模式挖掘已成为数据挖掘领域的一个新的重要研究方向.作为强约束形式的一种,均值约束目前仍然是基于约束的频繁序列模式挖掘的一个困难问题,其主要原因在于很难利用均值约束来进行序列模式挖掘中的剪枝.为此,提出了一种基于均值约束满足度剪枝策略,并且以前缀增长方法为基础设计了一个有效的频繁序列模式挖掘算法.通过分析并实验验证了该算法的时间效率和剪枝性能,结果表明,该方法是有效的.  相似文献   

12.
为了解决最大频繁项目集算法DMFIA(discover maximum frequent itemsets algorithm)在挖掘候选项目集维数较大而最大频繁项目集维数较小的情况下产生大量候选项目集的问题,提出一种改进的基于FP-Tree(frequent pattern tree)的最大频繁项目集挖掘的FP-EMFIA算法;该算法在挖掘过程中根据项目头表,采用自上而下和自下而上的双向搜索策略,并通过条件模式基中的频繁项目和较小维数的非频繁项目集对候选项目集进行降维和剪枝,以减少候选项目集的数量,加速对候选集计数的操作。在经典数据集mushroom、chess和connect上的实验结果表明,FP-EMFIA算法在支持度较小时的时间效率优于DMFIA、IDMFIA(improved algorithm of DMFIA)和BDRFI(algorithm for mining frequent itemsets based on decreasing dimensionality reduction of frequent itemsets)算法的,说明FP-EMFIA算法在候选项目集维数较大时有相对优势。  相似文献   

13.
有序树的频繁子树挖掘研究   总被引:1,自引:0,他引:1  
对各种主要的频繁子树挖掘算法进行综述与分析,主要包括频繁Induced子树挖掘与频繁Embedded予树挖掘;讨论了挖掘算法中使用的两种技术:基于候选生成一测试的方法和基于模式一增长的方法;对各典型算法的性能进行了实验分析比较。  相似文献   

14.
针对FBCM(基于矩阵压缩FUP(fast update algorithm))算法在项集挖掘过程中存在频繁扫描原频繁项集库,并生成大量候选集的问题,提出一种通过提取数据库中最频繁项的方法,以降低对原频繁项集库的扫描次数;并通过候选集剪枝思想,减少算法整体运行过程中的候选集生成,以提高频繁项集的挖掘速度.实验结果表明,...  相似文献   

15.
为了降低Web日志频繁序列模式挖掘误差,提出基于支持向量机的Web日志频繁序列模式挖掘方法。构建Web日志频繁序列模式检测序列,采用自相关特征分布式融合方法进行序列重组,提取序列模式的统计特征量,对其特征分布值进行信息融合。建立Web日志频繁序列模式融合式调度模型,采用支持向量机分析方法进行Web日志频繁序列模式挖掘的自适应学习与寻优控制,实现Web日志频繁序列模式挖掘。仿真结果表明,采用该方法进行Web日志频繁序列模式挖掘的误差较低,收敛性较好。  相似文献   

16.
提出了在分布式环境下对于每一层使用不同支持度的时态关联规则挖掘问题及其算法DMARM。该算法使用轮询方法处理分布式系统中各个节点间的通讯问题,在各个节点上利用集合“或”和“与”运算,在求候选频繁模式的同时求出了模式的支持度,减少了数据库的扫描次数。  相似文献   

17.
基于条件模式树的最大频繁模式挖掘算法在挖掘过程中将扫描事务数据库两次,且产生了大量的候选项目集,产生最大频繁模式过程中比较次数较多,总体效率较低.提出改进后的最大频繁模式挖掘策略,利用二维表保存事务出现项目的情况,通过最大频繁模式的相关性质减少了挖掘的项数及产生的频繁模式集,减少比较的次数.  相似文献   

18.
为了降低Web日志频繁序列模式挖掘误差,提出基于支持向量机的Web日志频繁序列模式挖掘方法.构建Web日志频繁序列模式检测序列,采用自相关特征分布式融合方法进行序列重组,提取序列模式的统计特征量,对其特征分布值进行信息融合.建立Web日志频繁序列模式融合式调度模型,采用支持向量机分析方法进行Web日志频繁序列模式挖掘的...  相似文献   

19.
为了从大量的时空数据集中挖掘类似于星型和序列型的多元关联规则模式,首先,针对要素同类和关系同质,提出多元关联模式的概念,即多类别和多要素下的多规则的关联组合;其次,用图论的方法构建常见的星型和序列型等多元关联模式;再次,提出多元关联模式的挖掘算法,引入等价类,搭建多元关联模式。合成实例(城市规划)说明多元关联模式的时空数据挖掘模式及其挖掘算法具有可用性。  相似文献   

20.
基于改进FP-树挖掘最大频繁模式   总被引:3,自引:1,他引:3  
由于挖掘密集型数据的频繁模式完全集非常困难 ,因而改进了传统的FP -树结构并提出了一种基于改进FP -树的最大频繁模式挖掘算法IFP -MAX ;通过引入后缀子树的概念 ,在挖掘过程中不用生成最大频繁模式候选集 ,大大提高了算法的时空效率。实验表明 ,IFP -MAX的挖掘速度比Miafia和GenMax快得多  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号