期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

高峰谢剑英《上海交通大学学报》2001,35(2):256-258

关联规则是数据挖掘的重要研究内容之一,而传统算法生成的关联规则之间存在着大量的冗余规则。本文提出了一种通用的由量大频繁项目集生成无冗余关联规则的GNRR算法,利用规则之间的冗余关系,按一定顺序挖掘不同的规则,消除了规则之间的冗余性,使发现的规则数目呈指数倍减少。相似文献

2.

一种基于闭项集的无冗余关联规则挖掘方法 总被引：1，自引：0，他引：1

宋威高磊李晋宏《北京交通大学学报(自然科学版)》2009,33(6):91-96

针对关联规则挖掘中存在的规则数量过多,难于理解和应用的问题,提出了一种基于闭项集的无冗余关联规则挖掘算法.首先,给出了无冗余关联规则的定义,并基于规则信任度的概念说明了该定义的合理性;其次,在生成子、闭项集和无冗余关联规则的基础上,给出了无冗余最小-最大精确规则基和无冗余最小-最大近似规则基的定义,并讨论了它们的剪枝策略.最后,讨论了生成子的性质及连接策略,并在包含索引的基础上,给出了一种宽度优先的无冗余关联规则挖掘算法.实验结果表明,本文提出的算法不仅可以发现规模较小的无冗余关联规则,提高了挖掘结果的可理解性,而且具有较高的挖掘效率. 相似文献

3.

关联规则的哈希修剪算法研究

朱小栋郑诚舒坚陈振《安徽大学学报(自然科学版)》2005,29(4):20-23

关联规则是数据挖掘的一个基本方法,本文首先介绍传统的Apriori算法的过程,分析它在处理大数据集时存在的问题.提出关联规则的一种改进算法,称为哈希修剪算法.然后比较改进的算法与传统的Apriori算法在算法时间复杂度、性能上的差异.通过实验得出,哈希修剪算法在数据挖掘中能够更加有效的处理数据. 相似文献

4.

Carma关联规则算法的一种改进

左映华高居泰李晋宏《韶关学院学报》2004,25(3):51-55

首先介绍了由Christian Hidber提出的在线挖掘关联规则算法Carma，然后提出了对该算法的若干改进．减弱了原算法第一步中当前交易的子集v被插入集合V的条件，同时改进了maxMissed的计算公式，使其计算更为简单．实验表明，以上改进提高了算法的速度．相似文献

5.

关联规则挖掘方法的改进 总被引：3，自引：2，他引：3

伊卫国卫金茂王名扬《东北师大学报(自然科学版)》2006,38(2):15-18

分析了关联规则的衡量标准,针对其中的缺点和不足,提出了一种匹配度方法用以取代置信度,并将匹配度方法生成的规则与支持度-置信度框架生成的规则进行了比较.结果表明:用匹配度方法生成的规则不仅前件和后件具有较高的相关性,而且减少了冗余规则的生成. 相似文献

6.

基于领域知识的冗余关联规则消除算法 总被引：1，自引：0，他引：1

张晶张斌胡学钢《合肥工业大学学报(自然科学版)》2011,34(2)

关联规则挖掘算法用于从大型数据库中提取感兴趣的规则,然而,在领域知识中已经能清晰表示的知识并没有被充分考虑,关联规则挖掘算法提取的规则中包含了大量已知的关联性,从而产生了很多冗余规则.文章提出一种算法DKARM,同时考虑了数据本身以及相关的领域知识,以消除在领域知识中清晰表示的已知关联性.实验表明,该算法合理消除了冗余规则,有效降低了规则数目. 相似文献

7.

一种自适应快速关联规则挖掘算法

张海英浦磊潘永湘《西安理工大学学报》2004,20(4):404-407

提出一种从大型数据库中挖掘关联规则的快速算法——自适应快速关联规则提取算法。该算法以经典的Apriori算法及其他各种优化算法为基础，引入了自适应步长和扫描树的概念，并采用修剪法对Apriori算法进行了改进。理论分析与实验结果表明，该算法比Apriori算法的应用效率高，同时也证实了其有效性。相似文献

8.

隐私保护关联规则挖掘的一种改进方法

下载免费PDF全文

朱思征陈世平《上海理工大学学报》2009,31(1)

VSS-MASK算法使用数据随机化方法对原始数据进行数据变换,采用纵向结构组织数据与只提交变换后为'1'的数据组成的数据表的方法,克服了原MASK算法中横向组织数据造成的数据稀疏性强、通用性差的缺点,并通过试验证明了VSS-MASK算法效率的提升. 相似文献

9.

一种更新关联规则的方法

杨梅娟陈亚军陈小娟《西华师范大学学报(哲学社会科学版)》2007,28(4):328-332

数据挖掘中IUA算法存在遗漏频繁项目集致使有的关联规则挖掘不出来的问题，本文对其产生的原因进行了分析和讨论，提出了改进的方法，同时给出一种更为高效的关联规则更新算法HIUA。相似文献

10.

一种时序关联规则改进算法的研究

王果何晓华骆晓艳胡志波陈素《科技咨询导报》2009,(9):249-249

对海量的时间序列进行处理,挖掘其背后蕴涵的价值信息具有重要的意义。本文结合了时序逻辑和数据挖掘的知识对基于FP_树的时序关联规则展开了研究,并在传统的算法基础上提出了一种改进算法。该方法不用生成大量的频繁模式候选集,从而提高了时序关联规则的挖掘效率。相似文献

11.

一种挖掘负关联规则的有效方法 总被引：1，自引：1，他引：1

张雅芬王新《云南民族大学学报(自然科学版)》2011,20(4):301-304

负关联规则表示2个项集之间的互斥或否定关系,往往隐藏在数量庞大的非频繁项集中,有很强的相关性且包含了重要的信息.提出了一种基于相关系数和最小兴趣度的挖掘负关联规则的方法,并给出了相应的算法,实验表明该算法能有效提高挖掘效率. 相似文献

12.

基于Apriori算法的改进关联规则的算法研究

谢美萍芮廷先《泰山学院学报》2012,(3):10-12

关联规则是数据挖掘的一个重要研究内容,主要用于从大量数据集中挖掘出有价值的数据项之间的关联关系.典型案例是超市的购物篮分析,主要对顾客的购买记录数据库进行关联规则挖掘,可以发现顾客的购买行为.本文依据Apriori算法的两个基本性质,即任何大项集的子集一定是大项集,非大项集的超集一定是非大项集,对经典的Apriori算法要多次扫面事务数据库的问题,作了一些改进,并进行仿真计算,结果表明,改进的算法确实减少了扫描次数. 相似文献

13.

一种高效相联规则提取算法 总被引：3，自引：0，他引：3

黄艳王延章苑森淼《吉林大学学报(理学版)》1999,(2):36-38

在Ａｐｒｉｏｒｉ算法基础上, 提出改进算法ＡｐｒｉｏｒｉＰｒｏ．利用中间结果对数据库进行过滤,从而加快候选项集的计数速度, 提高了整个算法的效率．相似文献

14.

一种改进的关联规则挖掘算法

吴江红周长英于秀丽《天津科技大学学报》2005,20(2):57-60

在Apriori算法基础上，给出一个改进的关联规则挖掘算法。改进的算法只需对数据库进行一次搜索，能大量减少L／O次数，且内存开销适中。通过一组实验对两种算法进行比较，本算法尤其对大型数据库的性能优于先前已有的一些关联规则算法。相似文献

15.

一种改进的关联规则增量式更新算法 总被引：1，自引：0，他引：1

付长贺赵传立唐恒永《沈阳师范大学学报(自然科学版)》2006,24(1):51-54

在支持度和置信度不变的情况下,随机或偶然向数据集添加数据记录会导致关联规则的变化.在FUP算法的基础上给出了一个改进的增量式更新算法,本算法在充分利用先前关联规则的基础上极大的减少了扫描原数据集的次数,与FUP算法相比极大的减少了算法运行时间,并实验验证了算法的优越性. 相似文献

16.

基于支持格的关联规则挖掘算法 总被引：1，自引：0，他引：1

李乃乾沈钧毅田絮资《西安交通大学学报》2002,36(4):361-364

提出了一种基于支持格的关联规则挖掘算法（ARSL），该算法连续扫描数据库事务序列，逐步构造支持格，对数据库扫描不超过2遍即可求得所有大项目集。首次扫描数据库时，能提供反馈信息，允许用户对最小支持率进行调整。该算法能连续处理事务序列，可用于网上在线数据挖掘。相似文献

17.

对数据挖掘关联分析的剪裁 总被引：1，自引：0，他引：1

秦敏李治柱《上海交通大学学报》2001,35(9):1373-1376

利用属性间的相互关系对关联分析进行剪裁,针对关联分析会得到过多的属性间关系这一问题,分析了影响关联分析结果的诸多因素,提出了对包容关系,递推关系以及互递关系的剪裁算法,经实例运算表明,新算法能有效地剪裁关联分析所得到的结果关系集合,在此基础上,对几种关系剪裁算法进行了比较和讨论,并提出了一些改进设想。相似文献

18.

时态关联规则挖掘综述

董研邵良杉《科技情报开发与经济》2006,16(10):241-242

交易数据库中的关联规则挖掘是一个很有价值的问题。现在已有不少关联规则模型,挖掘关联规则的算法也在不断改进。然而,在真正的数据库中,一些特殊的问题还没有被解决。一个主要的未解决的问题就是处理包含时态信息的数据。近几年来,为了解决这个问题,已经提出了基于某些方法的研究。相似文献

19.

一种改进的分布式关联规则挖掘算法

曹文梁《东莞理工学院学报》2014,(3):35-40

数据挖掘本质上是一种新的商业信息处理技术,通过对数据进行统计、分析、综合和推理,发现数据间的关联性、未来趋势以及一般性的概括知识,用以指导高级商务活动。由于需要,对数据间的关联性的数据挖掘算法模型已成为数据库及相关领域的一个研究热点,给出了一种基于分布式数据库的挖掘模型及其相应的一种有效的挖掘算法,其由若干个站点集合而成,各个站点拥有各自的数据库、中央处理机、客户端,以及各自的局部数据库管理系统,依靠通讯网络连接。采用购物篮分析式关联规则,将各个数据库文件的数据合成,从而得到挖掘结果,对挖掘的方法又进一步挖掘,即将不满足条件的规则重新传送到各分布式站点上进行更加精确的挖掘处理,从而避免了频繁的网络通讯。该算法在减轻网络频繁的通讯负担,体现并行计算以及异构数据挖掘方面具有独特优点。相似文献