首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对使用传统关联规则算法挖掘大数据集时,挖掘过程中效率不高,挖掘出大量冗余规则的问题,提出了基于关联规则和相似度的数据挖掘算法(U-APR):首先,一次性读入数据并构建矩阵,并利用关联规则支持度度量的特性来增加判断属性,以加快结束迭代过程,从而改进了Apriori算法频繁扫描数据库问题;然后,使用相似度算法去除冗余的关联规则;最后,结合置信度、支持度和用户目标匹配度对挖掘结果进行排序输出,从而得到用户感兴趣的关联规则. 同时,应用该算法与目前常用的2种关联规则算法对广东某高校学生财务数据进行数据挖掘. 实验结果表明:与2种常用的关联规则算法相比,U-APR算法缩短了运算时间和提高了存储空间利用率,对用户分析挖掘结果有较好的优化效果.  相似文献   

2.
Apriori算法是关联规则数据挖掘领域中最重要的挖掘方法,针对Apriori算法中挖掘频繁项集的效率问题和产生关联规则的合理性问题,改进相关定义及其使用,并提出改进的Apriori算法,然后将改进算法用于教学评价仿真系统.仿真结果表明,改进算法可高效、合理地挖掘关联规则,为做好课程安排和教学工作提供支持.  相似文献   

3.
本文将关联规则Apriori算法应用到高校新生公共计算机情况分析中,且在利用关联规则Apriori算法的基础上,加入兴趣度的优化算法,最终挖掘出有趣的关联规则,从而指导高校公共计算机教学。  相似文献   

4.
关联规则是数据挖掘的一个基本方法,本文首先介绍传统的Apriori算法的过程,分析它在处理大数据集时存在的问题.提出关联规则的一种改进算法,称为哈希修剪算法.然后比较改进的算法与传统的Apriori算法在算法时间复杂度、性能上的差异.通过实验得出,哈希修剪算法在数据挖掘中能够更加有效的处理数据.  相似文献   

5.
通过对Apriori算法进行的分析与研究,发现其在实用中存在两个主要问题:生成的关联规则具有相当大的冗余性;有可能挖掘出一条支持度和置信度均很高,但却是无趣的、甚至是虚假的关联规则,且不能产生带有否定项的规则.鉴于此,给出了关联规则的两个性质和引入兴趣度的第三个度量--相关支持度;利用两个性质消除了一定的冗余,同时利用相关支持度使挖掘出的规则更符合用户的需求,设计了挖掘出有效关联规则算法,在算法中利用导出的性质提高算法效率,较好地解决了上述问题.  相似文献   

6.
为探究高速公路交通事故各影响因素间的内在关联,揭示交通事故发生机理,保障高速公路行车安全,基于河北省2018年高速公路事故数据集,应用考虑定向约束的Apriori算法,分别对工作日和休息日的高速公路交通事故进行了关联规则挖掘,得到3类隐藏规则.研究表明:无论是工作日或休息日,事故通常发生在常规外部条件下,但不良道路条件和不利外界环境的耦合作用更容易引发事故;工作日和休息日导致重大事故和一般事故的形态存在一定差异;采用改进Apriori算法的准确度较原始算法提升了92.8%,证实了改进算法适用于高速公路风险因子的识别,有助于提升该领域的交通安全.  相似文献   

7.
针对Apriori算法在实际应用中无法发现关联规则变化趋势的问题,该文根据增量挖掘算法的优点对Apriori算法进行了改进。改进的Apriori算法能够在原算法的基础上,通过关联规则统计量的变化确定强规则与候选规则之间的转换,从而进一步发现关联规则的变化趋势,提高了依靠Apriori算法得到的关联规则对决策分析支持的可靠性。将改进算法应用于冷轧生产过程预测中,试验结果表明,改进算法相对于传统的Apriori算法对产量预测的精度提高了30%。  相似文献   

8.
通过对关联规则兴趣度的度量,在挖掘关联规则时可以避免无意义规则的产生。提出了一种度量关联规则兴趣度的方法,并给出了兴趣关联规则的挖掘算法。  相似文献   

9.
针对传统的关联分析算法Apriori执行效率低、I/O过重、计算量过大等问题,提出了一种通过减少扫描数据库次数来降低候选项集计算复杂度, 在频繁项集求解过程中通过将事务项集转换为行向量,利用“与”操作来提高算法执行效率的Apriori改进算法。利用学生在校行为数据集对Apriori改进算法进行有效性和高效性验证。同时,为了符合算法对样本数据的要求,在样本数据处理过程中对原始数据进行了清洗和离散化处理,定义了分析对象的样本数据离散化处理的规则。通过实验分析比较了Apriori改进算法与经典Apriori算法的性能。结果表明,Apriori改进算法保持了对实际分析对象关联规则挖掘的有效性,同时具有更高的执行效率。  相似文献   

10.
Apriori算法是一种经典的基于关联规则的数据挖掘算法,在研究Apriori算法及其现有改进方法的基础上,提出了一种全新的从高维向低维扫描的Apriori改进算法,并与传统Apriori算法进行比较分析。结果表明该改进算法可有效地减少数据库扫描时间和额外空间占有量。  相似文献   

11.
介绍了一种关联规则挖掘中Apriori算法的改进算法.这种方法允许数据近似匹配模式,从而提高模式的整体支持度.这种方法对含有空缺数据的关联规则挖掘同样有用,使得空缺数据也能增加模式的支持度.最后,用样例数据库来说明了改进算法的效用.  相似文献   

12.
关联规则是数据挖掘和知识发现领域的重要课题,但就判定关联规则是否成立的问题,即兴趣度的度量方法问题,学术界没有一致的标准。既有的兴趣度度量方法包括支持度—置信度方法、提升度方法、卡方分析方法等。这些传统的兴趣度度量方法存在各自的局限,表现为缺乏客观标准,只能度量正向关系等方面。为了克服这些问题,本文提出了一个基于兴趣度的关联规则度量方法的改进,并对该方法与传统方法进行了比较,证明了该度量方法的一些性质,指出了新方法的优点,实证了新方法的特征属性。该方法较之原有方法有一定的优势。  相似文献   

13.
本文介绍了关联规则的概念,关联规则挖掘的方法;分析了Apriori算法的核心方法,以及基于Apriori算法的改进方法,提出关联规则的价值衡量方法和关联规则挖掘今后进一步的研究方向。  相似文献   

14.
针对当前电子商务中关联规则技术的应用,结合电子商务系统的实际需求,在简述关联规则技术与Apriori算法的基础上,提出了一种改进的Apriori算法,并与传统算法进行比较分析,最后将此算法实际引用到电子商务系统中,使其具有更高的效率和准确度.  相似文献   

15.
数据挖掘技术在试题质量评价中的应用   总被引:1,自引:0,他引:1  
介绍了关联规则基本概念及Apriori算法,分析了关联规则挖掘在试题评价中存在的不足,提出了一种基于信息量的关联规则挖掘改进算法ARMABI.实验结果表明,该算法性能明显优于传统的关联规则挖掘算法,具有较高的推广价值.并且,对下一步工作进行了展望.  相似文献   

16.
通过分析传统的关联规则挖掘算法(Apriori算法)不能有效地挖掘出新的增量犯罪行为的问题。提出基于敏感参数的Apriori改进算法,通过实例对改进前后的算法运算结果进行验证,结果充分表明了改进算法在挖掘新的犯罪行为信息中的有效性,为关联规则挖掘方法在公安信息化工作中的应用提供了新的思路。  相似文献   

17.
基于兴趣度的关联规则在选课分析中的应用   总被引:1,自引:0,他引:1  
通过对关联规则经典算法Apriori的分析,并应用到选课分析系统中,发现了存在的问题.通过增加兴趣度阈值以提高关联规则在数据挖掘中的精度,从而有效的减少了无用规则的产生,为学生选课系统的实现提供了较好的支持.  相似文献   

18.
基于SQL的Apriori改进算法研究   总被引:1,自引:0,他引:1  
为了减少传统的Apriori算法在数据库应用中生成错误规则和大量无关项集,造成对空间的浪费而且运算的周期也较长的问题,本文提出了一种基于SQL的Apriori改进算法,通过引入提升度的概念,从根本上大大剪枝关联规则和无关项集.经过算例实际测试表明,在实测运算中缩短了Apriori算法的运算时间,提高了查询精度,减少了大量的无关项集,从而证实了论文所提出的Apriori改进算法是正确与有效的.  相似文献   

19.
可以从读者的图书借阅记录中挖掘有价值的数据,识别读书佦好,提供个性化的图书借阅推荐服务.Apriori算法存在单一用户的单一借阅记录在整体数据集中变成离群点,导致分析时间和内存开销显著增加的问题.通过设定置信度、支持度和过滤度的阈值,对原数据集进行过滤;再使用Apriori算法对新的数据集进行关联规则分析.带有数据过滤...  相似文献   

20.
通过分析关联规则中的经典算法Apriori,针对传统Apriori算法效率上的不足,提出一种基于哈希技术的改进Apriori算法,该算法将频繁项集存储在哈希表中,采用线性直接地址法使得哈希表中存储的频繁项集不冲突,提高算法的效率,具有较好的实用性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号