首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
在Apriori算法中,需要多次扫描数据库,并且对候选集的支持度计算比较繁琐,本文利用等价关系的概念,在信息表上计算候选集的支持度计数并寻找频繁项集,且只需扫描数据库1次,提高了挖掘效率,同时保留了包含频繁项集的事务.  相似文献   

2.
股票时间序列模型的关联规则挖掘   总被引:2,自引:0,他引:2  
目前的数据挖掘技术偏重于发现类似于商业销售数据库中不同离散化属性值之间的关系,而对证券投资中数值型数据之间变化趋势的相互影响分析不够.以股票信息的关联规则挖掘为例,大多采用传统的关联规则算法(如Apriori)来发现离散序列数据库中事务间的关系,时间序列关联规则挖掘的  相似文献   

3.
数据挖掘(DataMining)就是从大型数据库或数据仓库中发现人们感兴趣的知识,这些知识是隐含的,事先未知的潜在有价值的知识及信息.大型数据库中关联规则的发现是近期数据库中知识发现(KDD)的一个很重要的问题,由于决策人员或用户往往需要的是一种高层次概念上的关联关系,因而本文就在数据库中关联规则的数据挖掘进行了初步的尝试,并提出其基本的泛化处理过程,和基本数据挖掘思想和处理过程.主要介绍了数据挖掘的基本概念1、对数据类型的泛化处理.2、提取高层次关联规则的方法.及知识发现的基本要素等理论知识.  相似文献   

4.
交易数据库中的关联规则挖掘是一个很有价值的问题。现在已有不少关联规则模型,挖掘关联规则的算法也在不断改进。然而,在真正的数据库中,一些特殊的问题还没有被解决。一个主要的未解决的问题就是处理包含时态信息的数据。近几年来,为了解决这个问题,已经提出了基于某些方法的研究。  相似文献   

5.
根据数据挖掘中关联规则的性质以及高校成绩管理数据库的自身特点,在经典关联规则算法Apriori算法的基础上提出了一种改进的算法——A 算法,并利用该算法对学生成绩管理数据库进行了关联规则挖掘,得到了隐含在数据库中的有用信息.  相似文献   

6.
提出了一种基于数字化的目标关联规则挖掘算法,适合于从大型数据仓库中挖掘出与特定目标相关的隐含规则.其基本原理是用二进制的形式将数据库事务转换成数字事务,并在以数字事务为记录的数据库中,运用二进制的逻辑"与"运算计算出目标的效用度、包含目标的数字事务支持度和置信度,形成数字化的目标关联规则,接着根据数据库中的属性值信息解释关联规则.此算法的原理简单,扫描数据库仅需一次,算法执行效率比基于Apriori和Disjunctive-free的算法有明显提高.  相似文献   

7.
提出了一种基于聚类的时空关联规则的公交犯罪挖掘算法.针对某市一个区的110报警数据库中的大量业务信息进行分析.首先,通过文本挖掘技术从案情信息中提取时间、地点等信息,并利用高德地图API的地理编码服务和POI搜索功能对提取的地址信息进行地址匹配,提取受害人上下车站点、乘坐公交线路等信息.其次,对提取得到的时空数据进行归并处理.最后,根据案发时段、季节以及是否节假日进行聚类分析,然后在簇内进行时空关联规则分析.这种挖掘方法具有以下特点:①在聚类基础上进行关联规则分析,减少扫描数据库次数,大大缩小数据扫描范围,提高算法效率,更加适合海量犯罪数据的挖掘.②聚类后簇内数据具有相似性,特征更加明显,在此基础上进行关联规则分析产生较小的频繁项集,并且提取出置信度较高的规则.③考虑犯罪行为的时空特性,挖掘过程中同时考虑了案发季节、是否节假日等因素.  相似文献   

8.
 关联规则挖掘能使我们发现数据库中大量项目与项目之间的相关关系,但是用传统关联规则生成方法所生成的规则一是数量庞大,二是其中包含许多具有相同意义的规则,这必然对用户理解和提取信息带来干扰.通过求封闭项目集大大消减了频繁项目集数量,再由封闭项目集构造一种新的存储机制——-近似格,基于近似格可以得到冗余度较小的关联规则,从而提供用户简洁紧凑又无信息丢失的关联规则集.  相似文献   

9.
关联规则在股票分析中的应用   总被引:6,自引:0,他引:6  
本文介绍了在数据挖掘中关联规则的基本概念和属性 ,进一步讨论了关联规则在股票信息数据挖掘中的应用 .股票的行情交易数据库在经过一定的预处理后 ,用Aprorio算法挖掘出隐藏在数据背后的有用的规则 ,为投资者提供了有效的决策支持 .  相似文献   

10.
在分析当前Apriori算法及其改进算法的基础上,提出了一种将Apriori算法与物流信息挖掘相结合的Apriori改进算法.通过Apriori改进算法与原Apriori算法挖掘结果的比较,说明了Apriori改进算法不仅缩小了剪枝扫描数据库的规模而且减少了生成频繁项目集的候选项目集.  相似文献   

11.
基于粗糙集理论的分类规则发现   总被引:25,自引:0,他引:25  
研究了利用粗糙集理论中核的概念,求取信息系统的最小简化策略,给出了从数据库中发现分类规则的方法。  相似文献   

12.
数据挖掘就是利用机器学习的方法从大量数据中提取有价值知识的过程.本文以运动员体能测试数据为分析对象,研究应用数据挖掘技术解决运动员体能指标优化分析问题的方法.文中重点介绍了关联规则挖掘的原理与方法,提出并实现了适宜于网球运动员体能指标优化分析的算法,并进行了实际应用,发现了出乎常规的规律.  相似文献   

13.
利用公安系统建立的各类信息库,针对犯罪预防领域研究了关联规则的挖掘技术.系统的实现首先是根据已有的公安系统数据库,通过提取相关信息,找出所有支持度大于最小支持度的项集,产生用户感兴趣的频繁项集.其次,根据频集产生所期望的规则,设计支持度函数,进行设定规则的犯罪行为的数据挖掘研究,得到与之关联的犯罪特征,揭示潜在的犯罪规律,从而对犯罪预防提供数据支持.  相似文献   

14.
自动地从数据库中挖掘关联规则是非常重要且十分有用的,这是因为已开发和研制的数据广泛地遍布于整个世界。关联规则的不确定性由两个因子:支持度和可信度来度量.该文研究和给出已有的度量的性质,为进一步开发数据挖掘软件提供参考。  相似文献   

15.
一个适用于地理信息系统的数据挖掘工具——GISMiner   总被引:6,自引:1,他引:6  
论文将常用于关系型、事务型数据库的面向属性归纳的方法和关联规则挖掘方法扩展至空间数据库,开发了适用于地理信息系统(GIS)的空间数据挖掘工具-GISMiner,并将其应用于从农田GIS中挖掘农田使用情况的空间特征规则,以及从农产品市场GIS中挖掘农产品价格与铁路、国道和河流间的空间关联规则实验。结果表明,GISMiner是一个实用的、能适应于GIS且能挖掘多种知识类型的数据挖掘工具。  相似文献   

16.
关联规则发现的一种改进算法   总被引:7,自引:0,他引:7  
在Apriori算法基础上,给出一个改进的关联规则发现算法·由于这个算法只需对交易数据库进行一次搜索,能大量减少所需的I/O次数,且内存开销适中,因此同其他关联规则发现算法相比具有快速的优点,适合于大型交易数据库·使用合成数据作试验表明这个算法尤其对大型数据库的性能优于先前已有的一些关联规则算法·  相似文献   

17.
分类规则挖掘的免疫算法   总被引:4,自引:0,他引:4  
为了高效地从数据库中挖掘分类规则,提出了一种基于免疫算法的分类算法.该算法的核心思想为:对规则的前件进行固定长度编码,适应度函数的计算由分类规则的较小分类错误率、简洁性、一致性和训练实例的覆盖性构成,通过把适应度最小的个体作为先验知识来修改个体的某些分量的方法进行疫苗接种,并通过检测个体是否出现退化和模拟退火来实现免疫选择,同时还采用了基于信息增益的规则剪枝策略.在美国加州大学标准数据集中的5个数据集上将该算法与RISE和OCEC算法进行了实验比较,结果表明该算法不仅具有更快的收敛速度,而且获得了更高的预测准确率及更小的规则集。  相似文献   

18.
关联规则挖掘算法FP-Growth在挖掘大型数据库时,占用内存大、运行速度慢或根本无法构造基于内存的FP-tree。针对这些问题,文章提出一种适合于挖掘较大型数据库的新的关联规则挖掘算法DFP-Growth,新算法将数据库分解,然后对分解得到的各个数据库子集用FP-Growth算法进行约束频繁项集挖掘,以满足大型数据库挖掘的需求。  相似文献   

19.
Apriori算法是关联规则挖掘中最经典的算法,但它存在两大致命缺陷:需多次扫描数据库和产生海量的候选项目集。从这两个角度出发改进算法,提出了一种基于模式矩阵的高效改进算法(简称P-Matrix算法),使扫描数据库的次数减少为一次,同时不产生候选项目集而直接产生频繁项目集,从而使算法的时间复杂度和空间复杂度大大减少,有效地提高了Apriori算法的效率。  相似文献   

20.
研究分布式环境下约束性关联规则更新问题,包括数据库中事务增加和删除2种情况.引入向导集的概念,提出基于全局局部模式的约束性关联规则增量式更新算法DUCAR,其中包括局部约束性频繁项目集更新算法ULFC和全局约束性频繁项目集更新算法UGFC.该算法充分利用原先的挖掘结果提高更新效率,首先从最高维的频繁n项目集进行更新,在更新过程中考虑约束条件,结合剪枝算法,生成较少数量的满足约束条件的候选项目集.将该算法用Java加以实现,采用多组数据对此算法的性能进行测试,并与其他算法作对比实验,实验结果表明,该算法是高效可行的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号