首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
基于约束的关联规则挖掘是针对特定约束的规则的挖掘,挖掘的结果有着更好的针对性和实用性,Separate算法是现有的效果较好的算法,但有2点不足:未修剪生成的候选集和候选项重复生成。对此该文提出了改进的SeparateP算法,算法中加入了对候选集的修剪,并且利用了项集重复生成的信息,使候选集的修剪更加有效快捷。实验表明,改进算法显著提高了原算法的效率。  相似文献   

2.
正关联规则与负关联规则有着同样重要的作用,而传统的关联规则算法只能挖掘正关联规则.本文对关联规则的相关度进行判断,并在此基础上提出了一个能同时挖掘正负关联规则的算法,实验证明改进算法是有效的.  相似文献   

3.
针对使用传统关联规则算法挖掘大数据集时,挖掘过程中效率不高,挖掘出大量冗余规则的问题,提出了基于关联规则和相似度的数据挖掘算法(U-APR):首先,一次性读入数据并构建矩阵,并利用关联规则支持度度量的特性来增加判断属性,以加快结束迭代过程,从而改进了Apriori算法频繁扫描数据库问题;然后,使用相似度算法去除冗余的关联规则;最后,结合置信度、支持度和用户目标匹配度对挖掘结果进行排序输出,从而得到用户感兴趣的关联规则. 同时,应用该算法与目前常用的2种关联规则算法对广东某高校学生财务数据进行数据挖掘. 实验结果表明:与2种常用的关联规则算法相比,U-APR算法缩短了运算时间和提高了存储空间利用率,对用户分析挖掘结果有较好的优化效果.  相似文献   

4.
传统试卷分析系统一般只是对考试成绩做简单的整体统计,如平均分、等级、不及格率等,用户缺乏对试题知识点掌握情况关联程度的准确了解。针对该问题提出一种基于用户反馈的关联规则挖掘算法。首先对原始数据进行预处理,得到试卷知识点评分权重表和二进制的学生得分率表。然后建立一个根据用户选择层数输出关联规则,以及查询与选定知识点相关的规则的新方案。最后,提出了一个考虑用户反馈、支持度和置信度阈值的关联规则挖掘算法,以过滤无用规则,提高挖掘效率。对VB试卷数据应用该算法,发现了基于用户反馈的有趣关联规则。实验结果表明基于用户反馈的关联规则挖掘优于其他关联规则挖掘算法,更易获得有趣的关联规则。  相似文献   

5.
关联知识挖掘算法中一种广为人知的算法就是Aprior算法,之后所有关联规则挖掘算法的基本思想都是基于频繁项目集发现算法的基础上进行了改进.为了提高关联规则挖掘效率,首先回顾了基于图的关联规则挖掘算法;然后,在此基础上进行了改进,把关联规则挖掘中寻找频繁项集的问题转换为图中寻找完全子图的问题,通过在图中查找完全子图来寻找频繁项集.提出了一种基于图的关联规则挖掘改进算法,并且对原算法和改进的算法从时间和空间的性能进行了比较分析,得出改进的算法是有效可行的.最后从实验结果得出结论GenerateItemsets算法比DGBFIG算法优.  相似文献   

6.
关联规则挖掘方法自提出以来已有很多改进算法,但均局限于布尔关联规则的挖掘.已有的数量关联规则挖掘主要考虑了连续属性值离散化、最优的数量关联规则挖掘等问题,但存在过小支持度和过小置信度问题.研究了这一问题并提出了一个在频繁2-项集的基础上挖掘数量关联规则的改进算法.它不仅可以用于典型的购物篮分析,还可以用于购物篮分析不能完成的关联规则挖掘问题,如带数量的捆绑销售问题.  相似文献   

7.
邹丽霞 《河南科学》2010,28(9):1125-1129
对传统的关联规则挖掘算法FP-Growth方法进行改进,提出FP-Mine算法,并应用该算法对Web日志进行挖掘,探寻用户访问站点页面之间的关联规则,来帮助管理员改善站点的设计和企业改进市场商务决策.实验结果证明FP-Mine算法在生成频繁项集及关联规则的过程中,只需存储i-size和(i+1)-size频繁项集的节点的Freq-Set-Tree,且立即在其之上生成规则,所以缩短规则生成的时间,提高规则生成效率,同时释放i-size项集的节点,有效地节省内存空间.  相似文献   

8.
关联规则是数据挖掘中的一个重要研究方向.经典的Apriori算法是一种最有影响的挖掘布尔型关联规则频繁项集的算法,但其并不适合挖掘近年来兴起的多维数据模型.在改进Apriori算法的基础上,提出了一种"二次剪枝"的算法,此算法适用于挖掘多维关联规则,并且在一定程度上提高了算法效率.  相似文献   

9.
关联规则挖掘是数据挖掘的主要技术之一,现有的关联规则挖掘算法均基于支持度-置信度框架,当用户调整阈值时存在多次遍历数据库和重复计算问题。该文针对支持度阈值变化时的关联规则维护问题,提出了关联规则交互挖掘算法HIUA,该算法改进了原始IUA算法的剪枝过程,并通过Hash结构提高算法运行效率。在UCI数据集及企业实际财务数据集中的实验结果表明:在支持度阈值发生变化的过程中HIUA算法进一步利用已有挖掘结果,有效提高了关联规则挖掘的效率。  相似文献   

10.
基于Web使用挖掘的学生思想动态分析   总被引:1,自引:0,他引:1  
本文借助Web服务产生的大量日志数据,运用Web使用挖掘技术,对点击流数据源进行收集、预处理,并用基于Separate的约束性关联规则挖掘算法对学生的思想进行分析,发现学生的思想动态,为教育管理者管理学生提供决策依据。  相似文献   

11.
基于量化概念格的关联规则挖掘   总被引:4,自引:0,他引:4  
在概念格的内涵中引入等价关系并将其外延量化 ,得到量化概念格。利用量化概念格可以清晰地表示知识 ,从而便于挖掘包括关联规则在内的多种规则 ,与经典的 A priori算法相比较 ,规则表示更简捷、直观 ,尤其重要的是用户可根据自己的兴趣交互地挖掘关联规则 ,不需要计算频繁项目集 ,因而提高了挖掘规则的效率 ,适用于大型数据库中关联规则的挖掘  相似文献   

12.
一种基于可变支持度的缺省规则挖掘算法   总被引:1,自引:0,他引:1  
Rough集方法提供了一种新的处理不精确、不完全与不相容知识的数学工具. MDRBR算法通过规则支持度进行约束,可有效提高缺省规则的挖掘效率.但MDRBR采用单一的规则支持度约束,使得当规则支持度较小时,挖掘出大量的缺省规则,而当规则支持度较大时,一些重要的小概率分布对象对应的缺省规则被过滤掉.为此,提出了一种基于可变支持度的缺省规则挖掘算法--MDRBVSM,可有效地改进MDRBR等传统算法存在的缺陷.实验结果表明,该算法可有效地过滤噪声、提高规则的挖掘效率.  相似文献   

13.
关联规则挖掘在许多数据挖掘中有着广泛的应用。当数据库和支持度阈值发生变化时,现有的挖掘方法普遍存在多次扫描数据库或重复遍历复杂数据结构的问题。该文基于增量式更新算法(IUA)和快速更新算法(FUP),提出在数据库与支持度阈值同时变化情况下的关联规则动态维护算法ARDM,并通过Hash结构与模式增长方法进行优化。实验表明:该算法充分利用了已挖掘结果,在数据库和支持度阈值同时变化时比FP-Growth大幅提高了执行效率。最后,将该算法应用于企业财务指标及财务比率分析。  相似文献   

14.
用关联规则方法挖掘保险业务数据中的投资风险规则   总被引:9,自引:0,他引:9  
如何找出保险业务数据中有关投保和理赔的规律是保险公司能否提高盈利的至关重要的问题。关联规则发现是数据挖掘技术的一种简单又很实用的方法。文章首先介绍了关联规则的定义以及关联规则的 4个属性 :可信度、支持度、期望可信度和作用度。然后讲述了如何用 SGI公司的数据挖掘工具 Mineset在保险业务数据中发现关联规则 ,从而得出一些对保险公司起指导作用的控制投资风险的规则。关联规则还可广泛用于银行、电信、商业等其它领域  相似文献   

15.
基于遥感图像的光谱特征和纹理特征,提出图像关联规则的定义,通过对图像降阶预处理构造图像模板, 采用关联规则挖掘算法对图像纹理的频繁模式进行挖掘,通过联合关联规则来表达纹理。试验表明,挖掘出的关 联规则不仅能够表达规则纹理,而且能够较好表达随机纹理,据此可以进行纹理图像分割。  相似文献   

16.
通过给定的最小支持率和最小信任度来挖掘语言值关联规则往往会得到很多规则,因此用户很难获得真正关注的语言值关联规则.本文提出一种挖掘典型语言值关联规则的算法,此算法将挖掘得到的语言值关联规则按照相同的后件进行分组,然后对每个分组中的语言值关联规则根据规则之间的不相似性进行聚类.最后从每个类中挑选出代表类原型的语言值关联规则作为典型的语言值关联规则.典型的语言值关联规则是语言值关联规则集合中最具有代表意义的规则.  相似文献   

17.
利用关联规则中的Apriori算法,通过设置最小支持度和最小置信度对患者投诉信息进行挖掘.探讨数据挖掘中的关联规则在口腔医院患者投诉行为模式研究中的应用价值,为医院管理提供方法学上的依据.不同年龄、不同性别的患者,其投诉科室、投诉原因存在差异.医生的职称、学历、职业类别、从事口腔专业年限不同,其被投诉的原因不同.关联规则引入到医疗投诉资料的研究中,可以探讨影响患者投诉行为以及医生被投诉事件各种因素间潜在的、有价值的关系.较传统的人工方法或统计学方法具有独特的优势.  相似文献   

18.
关联规则挖掘主要用来发现数据库中存在的频繁项集.利用权值标识项目的重要程度,提出一种新的关联规则——加权关联规则的挖掘.由于项目权值的引入,Apriori性质不再成立,频繁项集的子集不再一定是频繁的.为此,提出k-最小支持数的概念,对原有Apriori算法进行改进.该算法能够挖掘出现频率小但是带来更大利润的项目,使得挖掘出的关联规则更加满足决策者的需求,也更加符合实际需要.  相似文献   

19.
提出了一种分布式关联规则增量更新算法(IUAAR),它可对数据库发生变化的情况进行归类.该算法主要采用改进了的FP树结构,通过传送被约束子树来挖掘全局频繁项目集,并充分利用快速分布式挖掘算法建立的各局部FP树,只对新增加了的全局频繁项目修改相应的改进FP树,挖掘其对应的被约束子树,同时利用已挖掘的全局频繁项目集对原全局频繁项目对应的被约束子树进行有效修剪.实验结果表明,该算法的运算速度比快速分布式挖掘算法提高了1倍,在最坏的情况下,对各局部数据库也仅需要扫描一遍,从而可提高数据库的维护效率.  相似文献   

20.
用数据挖掘方法发现关联规则和进行预测是信息处理领域的两大热点。在文献[1]的基础上对这两个问题进行了进一步的研究,提出了应用竞争聚集臬法确定正态云的两个参数,应用双参数阈值挖掘正态云关联规则,并利用求正态云关联规则的支持率和信任度来进行预测。将这种方法应用于气象数据,结果表明,所提出的关联规则挖掘方法比文献[1]所用的方法更合理,该预测方法简单易懂,更容易被人理解和使用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号