首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
为解决经典Apriori算法中最小支持度设定不当和数据库中各项目的重要程度不易给出的问题,采用区间量化方法计算出最小支持度满足的一个区间,用区间值代替单一的最小支持度.并根据引入的可能度概念对改进算法进行剪枝的策略,提出项目权重和最小支持度都为区间值的加权关联规则挖掘算法.通过UCI上的数据集对比改进算法和经典算法的性能.研究结果表明:改进算法解决了最小支持度设定过高或过低所带来的问题,并提高了算法的运行速度及有效率.  相似文献   

2.
关联规则Apriori算法自提出以来,有很多的改进算法,但大多是在改变最小支持度的大小,这样虽可提高Apriori算法的速度,但会漏掉一些有用的项集.本文结合以上问题,用一种科学的方法求出最小支持度,并在提取频繁项集的过程中动态地改变最小支持度的值,有效地解决了以上问题,提高了Apriori算法的效率.  相似文献   

3.
可以从读者的图书借阅记录中挖掘有价值的数据,识别读书佦好,提供个性化的图书借阅推荐服务.Apriori算法存在单一用户的单一借阅记录在整体数据集中变成离群点,导致分析时间和内存开销显著增加的问题.通过设定置信度、支持度和过滤度的阈值,对原数据集进行过滤;再使用Apriori算法对新的数据集进行关联规则分析.带有数据过滤...  相似文献   

4.
为了解决在关联规则挖掘Apriori算法中最小支持度阀值设定难或设定不适当的问题,基于事务普遍具有统计规律性,设计了平均值调优的方法。为支持度和预选率划分不同区间,利用平均值进行最小支持度阀值的调优。对于不同分布特征的事务数据库,该方法比原先设定阀值都能取得更好的频繁项集结果,同时不会产生过大的性能开销。  相似文献   

5.
介绍了数据挖掘和MES系统的基本概念,从关联规划的支持度和置信度出发,以Apriori算法为基础,将粗糙集理论引入到算法中去,设计出相应的流程图,有助于企业决策支持系统中的生产数据统计分析.  相似文献   

6.
Apriori算法是经典的数据挖掘算法之一,它根据置信度和支持度对产生的频繁集进行选择,找出强规则.传统的Apriori算法需要产生大量的侯选集和多次数据库的扫描,存储和通信的开销巨大.云计算环境可以解决存储问题,所以针对Mapreduce的编程框架,提出一种适用于此模式的新关联规则算法,解决传统Apriori算法时间和空间上的缺点,提高挖掘效率.  相似文献   

7.
高职院校的人才培养方案中,课程设置是最关键的元素,课程结构的合理与否会直接影响到人才培养的质量。使用关联规则中的Apriori算法,对学生成绩样本数据进行挖掘,利用给定的最小支持度和最小置信度,挖掘出频繁项集,进行课程相关性分析,得到课程的关联规则,有利于在课程设置过程中优化课程结构,提高教学质量。  相似文献   

8.
分析了关联规则的一种特殊情况,即如何提取不大于下限最小支持度阈值的项目集,称这样的项目集为稀缺项目集,提出了相应的类Apriori挖掘算法:Similar-Apriori算法,并将其结合Apriori算法,应用到高校师资评测系统中,从理论和实践上证明了算法的正确性和有效性.  相似文献   

9.
基于概念格提取简洁关联规则   总被引:1,自引:0,他引:1  
从量化封闭项集格所提取的所有最小无冗余规则,虽满足最小前件最大后件的要求,但并不是满足用户设定支持度和置信度的最小规则集.本文提出了一种全局简洁关联规则,使所提取的规则集最小,并给出了基于量化封闭项集格提取全局简洁规则的算法.  相似文献   

10.
在数据库中挖掘关联规则是数据挖掘领域的一个重要的研究课题,在应用中具有非常重要的意义.在分析Apriori算法和IUA算法经典关联规则挖掘算法的基础上,提出了一种基于最近挖掘结果的更新算法称为IIUA.IIUA算法吸收了Apriori算法和IUA算法的优点,在改变最小支持度和基于最近挖掘结果的条件下,从生成尽可能少的候选项集考虑,得到完整的新频繁项集,从而提高算法的效率.  相似文献   

11.
利用关联规则中的Apriori算法,通过设置最小支持度和最小置信度对患者投诉信息进行挖掘.探讨数据挖掘中的关联规则在口腔医院患者投诉行为模式研究中的应用价值,为医院管理提供方法学上的依据.不同年龄、不同性别的患者,其投诉科室、投诉原因存在差异.医生的职称、学历、职业类别、从事口腔专业年限不同,其被投诉的原因不同.关联规则引入到医疗投诉资料的研究中,可以探讨影响患者投诉行为以及医生被投诉事件各种因素间潜在的、有价值的关系.较传统的人工方法或统计学方法具有独特的优势.  相似文献   

12.
通过对Apriori算法进行的分析与研究,发现其在实用中存在两个主要问题:生成的关联规则具有相当大的冗余性;有可能挖掘出一条支持度和置信度均很高,但却是无趣的、甚至是虚假的关联规则,且不能产生带有否定项的规则.鉴于此,给出了关联规则的两个性质和引入兴趣度的第三个度量--相关支持度;利用两个性质消除了一定的冗余,同时利用相关支持度使挖掘出的规则更符合用户的需求,设计了挖掘出有效关联规则算法,在算法中利用导出的性质提高算法效率,较好地解决了上述问题.  相似文献   

13.
频繁项目集是满足最小支持度和最小置信度下的一个项目集合,但随着最小支持度的不同,就会产生不同的频繁项目集,而频繁项目集的发现又是一个高花费的过程.该文提出一个新的维护算法,用来解决关联规则的更新维护问题.  相似文献   

14.
王娟 《科技信息》2011,(33):56-56,45
关联规则是数据挖掘的重要手段,它基于支持度、置信度等对规则进行筛选,生成有用的规则。关联规则反映了大量数据中项集之间的相互依存性和关联性。Apriori算法和FP-Growth算法是关联规则挖掘中的两个典型算法。本文阐述了这两种算法的基本思想、数据挖掘步骤,并讨论了它们的优缺点及差异。  相似文献   

15.
针对使用传统关联规则算法挖掘大数据集时,挖掘过程中效率不高,挖掘出大量冗余规则的问题,提出了基于关联规则和相似度的数据挖掘算法(U-APR):首先,一次性读入数据并构建矩阵,并利用关联规则支持度度量的特性来增加判断属性,以加快结束迭代过程,从而改进了Apriori算法频繁扫描数据库问题;然后,使用相似度算法去除冗余的关联规则;最后,结合置信度、支持度和用户目标匹配度对挖掘结果进行排序输出,从而得到用户感兴趣的关联规则. 同时,应用该算法与目前常用的2种关联规则算法对广东某高校学生财务数据进行数据挖掘. 实验结果表明:与2种常用的关联规则算法相比,U-APR算法缩短了运算时间和提高了存储空间利用率,对用户分析挖掘结果有较好的优化效果.  相似文献   

16.
基于C语言编写出通用的Apriori算法程序,通过挖掘出成绩数据库中所有不低于用户给定的最小支持度的成绩频繁项目集,分析成绩之间的关系,得出具体科目之间的联系.  相似文献   

17.
刘晓蔚 《科学技术与工程》2013,13(26):7667-7674
现实量化交易应用中,传统的模糊数据挖掘算法往往需要针对给定的量化交易设定最小支持度阈值,然而,这些方法中存在的普遍问题是很难找到合适的最小支持度阈值,并且因为推导出的规则通常是常识而没有实际的商业意义。为了解决这个问题,提出了一种无需最小支持度阈值的模糊关联规则(fuzzy coherent rule,FCR)挖掘算法。首先将量化交易转换成模糊集,然后通过收集已经生成的模糊集生成候选模糊关联规则,最后计算出列联表并用其检查这些候选模糊关联规则是否满足四项判断准则。如果满足,则可以确定为模糊关联规则。在Foodmart数据集上的实验验证了所提算法的有效性,相比原始模糊关联规则(fuzzy association rules,FAR)挖掘算法,所提的FCR方法能够推导出更多的规则,并且能够在高置信度时推导出更多有用的规则。  相似文献   

18.
从大量顾客在线购买历史记录中挖掘出有用的关联规则,是一种及时有效的向顾客推出个性化服务的重要技术.对网上书店的顾客在线购买行为进行挖掘分析,采用Apriori算法[1]找到其中的关联规则,采用支持度过滤方法获取频繁的顾客购买行为模式,提出根据用户的兴趣度和规则的置信度产生相应的推荐候选集,实现网上书店的个性化推荐服务.  相似文献   

19.
提出了一种基于数字化的目标关联规则挖掘算法,适合于从大型数据仓库中挖掘出与特定目标相关的隐含规则.其基本原理是用二进制的形式将数据库事务转换成数字事务,并在以数字事务为记录的数据库中,运用二进制的逻辑"与"运算计算出目标的效用度、包含目标的数字事务支持度和置信度,形成数字化的目标关联规则,接着根据数据库中的属性值信息解释关联规则.此算法的原理简单,扫描数据库仅需一次,算法执行效率比基于Apriori和Disjunctive-free的算法有明显提高.  相似文献   

20.
本文将所有基于事务和非基于事务的关联分析称为广义的关联分析.基于事务的关联分析主要依托支持度-置信度框架进行数据挖掘,而非基于事务的关联分析常采用参与度-条件概率框架.首先,在讨论强关联规则的正确性、可靠性和有趣性的基础上,提出了蕴涵-约束框架.其次,提出并论证了最小支持度mni_sup和最小置信度min_conf的合理取值范围,从而将最小置信度由支持度-置信度框架下的(0,1] 缩小为蕴涵-约束框架下的(0.5,1],最小支持度由(0,1] 缩小为(0,min_conf].第三,提出随机顶点极大团划分法,它能将非基于事务的关联分析转化为基于事务的关联分析,从而使广义关联分析问题整合成为基于事务的关联分析问题.第四,基于映射的概念,将约束划分为事前、事中和事后约束,从而形式化地解决了约束的应用及方法.第五,利用稠密维和稀疏维,提出了一种multi-knowledge tree 的树形存储结构,能在无论频繁项集是否满足向下闭合性质时都有效降低算法的空间复杂度;同时,在数据增加、删除、修改后能快速获取新的强关联规则.最后,大量实验验证了所提出理论和算法的效果和效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号