首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 359 毫秒
1.
考虑事务数据库D不变,项目集I发生变化时的关联规则挖掘问题.提出了两种关联规则更新算法,解决增加项目或减少项目时的关联规则更新问题.与重新运行一遍Apriori算法相比较,其运行效率有显著提高.  相似文献   

2.
基于PSO的加权关联规则挖掘算法   总被引:1,自引:0,他引:1  
简要描述了加权关联规则问题及离散粒子群优化算法,提出了一种基于粒子群优化(PSO)算法的加权关联规则挖掘算法(PSO-WMAR).实验证明,本算法运行时间更省,产生的规则数更少且更有效.该算法具有以下特点:1)把关联规则挖掘的两个阶段结合在一起,无须先挖掘出全部频繁项目集然后再提取规则;2)只需要扫描一次数据库;3)把兴趣度引入适合度函数之中,挖掘出的规则数量更少、更有效;4)求加权频繁项目集无须查找所有候选加权频繁项目集,或者求频繁项目集的高序子集或非频繁项目集的低序超集.  相似文献   

3.
具有动态加权特性的关联规则算法   总被引:8,自引:1,他引:7  
基于FP_growth关联规则, 提出一种具有动态加权特性 的改进算法. 把事务数据库中的项目按其重要程度划分为5个等级; 运用层次分析(AHP)算法 构造判断矩阵, 计算特征向量; 将得到的向量作为权值, 与项目在事务数据库中出现的次数 综合考虑作为衡量重要程度的标准, 生成FP_tree; 最后得到频繁项目集和关联规则. 由于 权重的赋予过程可以由领域专家动态地改变, 这样不但能挖掘出更有意义的规则, 而且在算 法的运行初期就大量剔除了那些权重小的无用项目集, 从而大大提高了算法的运行效率.  相似文献   

4.
给出了一个基于约束的关联规则挖掘算法,首先依赖加权支持度产生频繁项目集,然后利用兴趣度产生关联规则,并对过滤掉的频繁项目集进一步分析发现包含负项集的关联规则。  相似文献   

5.
关联规则算法是数据挖掘中的核心技术 ,本文给出了数据库中挖掘关系规则的一种新算法 ,该算法通过二次扫描 ,第一次将可能出现的频繁项目集加入到ISC中 ,第二次扫描采用逐步求精算法将频繁项目集加到项目集中 ,减少了数据库的扫描次数  相似文献   

6.
为减少关联规则挖掘中数据库扫描次数,提出了一种基于准频繁项目集的关联规则挖掘算法———SupposedFrequent,同时给出了候选频繁项目集的产生函数———BGen.最后通过实验证明:在给定最好的准频繁项目集的条件下,只需扫描数据库两次就能产生全部的频繁项目集。  相似文献   

7.
针对模糊属性事务数据库提取模糊关联规则的问题,采用模糊概念格与模糊关联规则相结合的方法,实现格节点与属性项集的对应关系,提出模糊关联规则格理论,在渐进式建格算法基础上对格节点相应修改,给出了适用于动态数据库的模糊关联规则格的构建思想.利用模糊关联规则格挖掘关联规则,与采用Apriori算法计算频繁项目集获取规则相比较,容易获得用户感兴趣的关联规则,同时减少冗余规则的生成,使挖掘算法得到优化.  相似文献   

8.
关联规则算法是数据挖掘中的核心技术,本文给出了数据库中挖掘关系规则的一种新算法,该算法通过二次扫描,第一次将可能出现的频繁项目集加入到ISC中,第二次扫描采用逐步求精算法将频繁项目集加到项目集中,减少了数据库的扫描次数.  相似文献   

9.
为提高挖掘大项目集的速度,有效建立给定数据集中各项集之间的关联规则,提出了一种0-1矩阵关联规则数据挖掘算法.算法将事务数据库转化成M×N的矩阵,构造一个矩阵关联图表示频繁1-项目集中每两个项目之间的关联关系,通过遍历构造的关联矩阵有效地缩减事务数据库的大小,产生所有的频繁项集.利用模拟实验结果证明了所提算法可行性及有效性.  相似文献   

10.
张争龙 《科学技术与工程》2013,13(19):5687-5691
针对实际交易数据库中,不同项目的重要性和出现概率各不相同的两个问题,提出一种基于等价类和多最小支持度的加权关联规则算法,从而挖掘出那些覆盖较少数据但却有意义、用户可能更感兴趣的关联规则。算法按照项目的最小支持度升序对交易记录进行等价类划分,然后按照项目的最小支持度降序依次求出每一等价类内的加权频繁项集。算法采用垂直数据库的数据表示形式,挖掘过程中避免了对数据库的重复扫描。对比实验结果证明,改进算法具有良好的挖掘性能。  相似文献   

11.
针对传统的关联规则在试卷评估中应用出现的问题:由于试题的难易程度不同,被答对的概率也不一样,即数据集中数据项发生的概率不一样,数据项具有倾斜支持度分布的特征,选择合适的支持度阈值挖掘这样的数据集相当棘手。文章提出了基于试题难度系数加权的关联规则挖掘算法,从而解决因试题难度不同而导致数据项出现的概率不均的问题,发现更多有趣的关联规则,并且理论上证明了基于难度系数的加权关联规则算法保持频繁项集向下封闭的重要特性。  相似文献   

12.
关联规则挖掘主要用来发现数据库中存在的频繁项集.利用权值标识项目的重要程度,提出一种新的关联规则——加权关联规则的挖掘.由于项目权值的引入,Apriori性质不再成立,频繁项集的子集不再一定是频繁的.为此,提出k-最小支持数的概念,对原有Apriori算法进行改进.该算法能够挖掘出现频率小但是带来更大利润的项目,使得挖掘出的关联规则更加满足决策者的需求,也更加符合实际需要.  相似文献   

13.
关联规则挖掘寻找给定数据集中项之间的有趣关系,是数据挖掘的主要研究方面.传统的关联规则挖掘算法仅能挖掘正关联规则,事实上,负关联规则也包含了非常有价值的信息,对于决策的作用也是不容忽视的.  相似文献   

14.
基于有权重支持度框架的关联规则挖掘算法和超图分割算法, 给出一种新的基于有权重超图模型的离群点检测算法WHOT(Weighted Hypergraph based Outlier Test). WHOT算法根据有权重支持度的定义, 重新设计了基于有权重支持度框架的关联规则挖掘算法, 并挖掘出数据集中的重要关联规则, 形成超图. 在超图上应用超图分割算法, 得到聚类集合, 再结合项权重和事务权重的定义, 判断一条记录是否为离群数据.  相似文献   

15.
传统方法实现过程复杂、历史复杂时态数据的片面性,导致其无法全面地描述时态数据;且相似性计算无法准确匹配具有动态性与复杂性的时态数据,造成提取精度低。为此,提出一种新的分布式多空间数据库复杂时态数据提取技术。设计动态RBF神经网络,对分布式多空间数据库中未知动态进行识别和建模;通过建模结果完成对复杂时态数据的描述。依据加权关联规则与时态关联规则对支持度和置信度的定义,获取T-FS-tree加权时态关联规则中支持度和置信度。将复杂时态数据描述序列、最小支持度、最小置信度作为输入,将加权时态关联规则作为输出,建立T-FS-tree加权时态关联规则挖掘算法。按照向量计算获取加权时态频繁1项集以及频繁2项集,依据获取的加权时态频繁项集建立初始频繁项集树;依据初始频繁项集树获取全部时态频繁项集;通过获取的频繁项集产生加权时态关联规则。从所有关联规则中选择优先度高的规则,构建的复杂时态数据提取器,实现复杂时态数据提取。实验结果表明,所提方法复杂性低,提取结果更加全面、可靠,有很高的准确性。  相似文献   

16.
由于在实际的数据挖掘过程中容易出现无用的频集和冗余的规则,所以降低频集和规则的冗余度可大大提高挖掘的质量,这也是数据挖掘中一直被关注的问题,提出了一个用等价类生成关联规则的方法,算法主要在频集的基础上建立项集的等价关系,进而对项集划分等价类,同时将得到的关联规则划分为精确关联规则和近似关联规则两个集合,通过等价类,不但可以很容易地生成所需要的关系规则,同时可以方便地判断数据之间依赖关系的强弱,同时,项集的等价关系在实际应用中也很有利用价值,算法最后的规则结果集剔除了由来自同一等价类中的面集的重复出现构成的冗余规则,从而得到了较小的关联规则集合。  相似文献   

17.
数据库中标准加权关联规则挖掘算法   总被引:1,自引:0,他引:1       下载免费PDF全文
在原有的关联规则挖掘算法的研究中,认为所有的属性的重要程度相同,提出标准加权关联规则的挖掘算法,能够解决因属性重要程度不一样带来的问题。  相似文献   

18.
基于多支持度的挖掘加权关联规则算法   总被引:6,自引:0,他引:6  
关联规则挖掘是数据挖掘中一个重要的模型.在其挖掘算法中,如果最小支持度很高,则出现频率比较低的规则就不能发现;如果最小支持度太低,因为频繁项的相互关联,则会出现组合爆炸.为此,提出了允许用户设定多个最小支持度、给定数据各项的权重来解决这一问题.理论、实验数据和实际应用证明,该新算法可行且符合实际情况,比同类算法用时更少,对大型数据库的关联规则挖掘非常有效.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号