首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 218 毫秒
1.
针对分布式系统,提出了自适应哈希链结构的频繁模式挖掘算法。该算法首先在每个站点产生局部频繁1-项集,再产生全局频繁1-项集,根据全局频繁1-项集产生各站点的投影数据库,在各个站点分别扫描投影数据库中的交易,并根据站点可用内存情况形成相应大小的哈希链结构。通过挖掘各站点的哈希链结构得到全局频繁项集。给出了基本步骤和挖掘算法。研究表明该算法不但效率高,而且适应性强。  相似文献   

2.
为提高关联规则挖掘算法的效率及其对大型数据集的适应性,提出了基于划分的带项目约束的频繁项集挖掘算法Partition CHS Miner。算法按照约束条件裁减数据集,并采用基于约束的超结构CHS(con-straint-based hyper-structure)存储数据。对大型数据集,先将其划分为多个不相交的数据子集,使子集的大小适合主存,然后在子集上采用基于超结构的带项目约束的挖掘算法挖掘出局部频繁项集,最后合并所有子集中的频繁项集形成全局的带约束的候选项集,计算出全局频繁项集。实验证明了算法的有效性。  相似文献   

3.
一种关联规则增量更新算法   总被引:6,自引:0,他引:6  
针对一个新的事物数据库加到原有的事务数据库中,在最小支持度和最小置信度都不变的情况下相应关联规则的更新问题,提出了一种简单高效的增量式关联规则挖掘算法。该算法从集合的角度出发,将事物数据库分为频繁项集集合和非频繁项集集合,从而在两个事务数据库可能出现的关系中,准确找出能够生成新的频繁项集的集合。在此基础上,利用给出的算法能够较为容易地发现新的关联规则。最后,分析了此算法的优越性。  相似文献   

4.
在分析和研究诸多经典关联规则挖掘算法或最大频繁项目集挖掘算法的基础上,提出了一种新的极大频繁项目集挖掘算法BOFPV_MMFIA算法.该算法引入频繁项目集向量FP-V,将极大频繁项目集的挖掘过程转化为频繁项目集向量FP-V的与运算过程.算法只需扫描数据库一次,克服了Apriori及其相关算法产生大量候选集和需多次扫描数据库的缺点.又不同于BOM算法,挖掘频繁k_项目集时,需要进行 次k个向量的与运算.因此,BOFPV_MMFIA算法的效率明显高于Apriori、DMFIA及BOM算法.  相似文献   

5.
提出了一个基于频繁模式树即FP-tree和支持度数组相结合的最大频繁项集挖掘算法,首先建立FP-tree,同时建立支持度数组,然后在此基础上建立最大频繁项集树MAXFP-tree,MAXFP-tree中包含了所有最大频繁项集,缩小了搜索空间,提高了算法的效率。算法分析和实验表明,该算法对稠密型数据集和稀疏型数据集均适用,并且特别适于挖掘具有长频繁项集的数据集。  相似文献   

6.
针对关联规则数据挖掘中频繁项目集的二次挖掘问题,提出了一种能够解决当最小支持度发生变化而交易数据库不变情况下进行二次挖掘的改进算法(UMSA)。该算法充分利用频繁项目集的特性,通过新的拼接方法来减少候选项目集的生成,在扫描交易数据库确定k维频繁项目集时,采用在交易数据库中剔除无用的交易,达到不断减小交易数据库规模的目的,克服了一些算法中存在的漏采现象,并在一定程度上解决了非确定性问题。通过举例说明该算法的执行过程及其算法的正确性和有效性,并对其性能进行了分析。  相似文献   

7.
提出了通过逻辑蕴涵的演绎规则来构建频繁项集的简洁表示,而不是挖掘所有的频繁项,来降低频繁项集中的冗余性,并利用演绎规则来构建所有频繁项集的简洁表示,从而减少存取数据库和对项集进行计数的次数,最终提供一个更加紧凑的频繁项集输出.最后,通过试验说明了该方法的有效性.  相似文献   

8.
针对信用分类数据集中常见的高维性特征,本文基于特征袋装法和关联规则挖掘算法,构建了新的赋权特征选择集成模型AR-WSAB.该模型能根据频繁项集的支持度和置信度,对各特征的重要度进行测度,进而选择出各特征子集,训练子分类器,再通过集成得到最终结果.通过在贷款违约预测数据集上进行实证分析,结果表明该模型分类正确率相对于Bagging集成模型和PCA算法都有显著优势,所提方法能够有效处理高维性特征,并且在各分类算法上都具有普适性.  相似文献   

9.
在大型数据库中 ,数据不是静止的 ,新的记录需要不断地增加到旧的数据库中 ,而从旧的数据库中挖掘出来的关联规则必须加以维护 ,为此提出了一种关联规则更新算法。该算法既能有效地利用已经发现的知识 ,又能减少数据库的扫描次数 ,同时只需产生少量候选集。实验表明 ,该算法的执行效率比现有的典型更新算法高 ,是一种有实际应用价值的、高铲的关联规则更新算法。  相似文献   

10.
在线挖掘数据流滑动窗口中最大频繁项集   总被引:1,自引:0,他引:1  
相对于频繁项集,最大频繁项集的数目较少,挖掘最大频繁项集的算法具有较高的时空效率.提出了一种新的基于文法顺序FP-Tree的最大频繁项集单遍挖掘算法FPMFI-DS.该算法采用了一种混合搜索空间项顺序策略,并利用我们所提出的一种新的剪枝技术-"子集等价剪枝技术",有效缩小搜索空间的大小.基于该算法,提出了一种能够在线更新挖掘数据流滑动窗口中最大频繁项集的算法FPMFI-DS+.FPMFI-DS+算法能够在任意时刻都维护数据流当前窗口中的最大频繁项集.仿真实验表明,FPMFI-DS算法的效率接近于多遍挖掘算法FPMax*,并具有良好的可扩展性,FPMFI-DS+算法更新挖掘速度快.  相似文献   

11.
采用北京市可变信息板(variable message signs, VMS)系统近三年发布的交通诱导信息数据, 研究了交通诱导信息发布策略的空间关联规则. 首先基于系统聚类算法分析事件点与上游VMS的关联度, 根据其强弱将上游路段的影响空间分级, 并确定不同影响等级空间范围的大小; 然后采用基于关系代数理论的关联规则挖掘算法, 计算位置相邻的VMS集合的支持度和置信度, 确定不同影响等级空间范围内、相邻影响等级空间范围VMS集合的 依存关系. 实证分析表明: 空间关联规则能将事件点上游的影响空间分级, 并确定VMS间的依存关系, 从而锁定诱导信息发布的各级影响 空间以及相应的VMS, 具有实际的应用价值, 将应用于北京市交通诱导信息发布专家辅助决策系统.  相似文献   

12.
针对异步不等速率下局部节点航迹关联复杂问题, 提出了基于k近邻平均距离的异步航迹直接关联算法。首先, 给出不等长航迹序列间的k近邻平均距离计算规则, 进而计算得到不等长航迹序列间的灰色关联度, 再利用经典分配法进行航迹关联判定。算法无需时间同步, 避免估值误差传播积累。仿真数据表明, 算法正确关联率高、耗时较短、局部节点采样周期和开机时机不一致等异步因素对算法影响不明显, 并且算法不受噪声分布形式和目标数目变化的影响。  相似文献   

13.
为了向驾驶者自动提供个性化的交通服务信息,需要对车辆行驶路径进行分析和预测.面向基于RFID的个性化交通服务系统,提出改进的车辆行驶路径关联规则挖掘方法,挖掘车辆历史行驶路径数据中的频繁序列模式,由频繁序列模式产生序列关联规则,根据当前行程车辆已行驶的路径,实现对车辆未来行驶路径的预测.本方法主要通过0-N数据结构和候选2-序列产生方法的改进,提高车辆行驶路径序列模式挖掘的效率.最后,通过数据测试验证了改进算法在运行效率上与GSP相比的性能优越性.  相似文献   

14.
This paper proposes a two-piece update of projected reduced Hessian algorithm with nonmonotonic trust region strategy for solving nonlinear equality constrained optimization problems. In order to deal with large problems, a two-piece update of twoside projected reduced Hessian is used to replace full Hessian matrix. By adopting the Fletcher's penalty function as the merit function, a nonmonotonic trust region strategy is suggested which does not require the merit function to reduce its value in every iteration. The two-piece update of projected reduced Hessian algorithm which switches to nonmonotonic trust region technique possesses global convergence while maintaining a two-step Q-superlinear local convergence rate under some reasonable conditions. Furthermore, one step Q-superlinear local convergence rate can be obtained if at least one of the update formulas is updated at each iteration by an alternative update rule. The numerical experiment results are reported to show the effectiveness of the propo  相似文献   

15.
A Multiple Model Approach to Modeling Based on LPF Algorithm   总被引:5,自引:0,他引:5  
CONTROL THEORY AND APPLICATION1. INTRODUCTIONMost complex industrial processes may be characterized as non-linear and non-stationary. The colltrol methodsbased on linear models have then been challenged. Modeling and control of complex nonlinear systems becomesone of the difficult problems, which persecute control theory research and application. Several methods havebeen developed for known-structure system identification, including NARMAX, Hammerstein, Wiener or alsoHammers…  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号