共查询到20条相似文献,搜索用时 15 毫秒
1.
In data mining from transaction DB, the relationships between the attributes have been focused, but the relationships between the tuples have not been taken into account. In spatial database, there are relationships between the attributes and the tuples, and most of the associations occur between the tuples, such as adjacent, intersection, overlap and other topological relationships. So the tasks of spatial data association rules mining include mining the relationships between attributes of spatial objects, which are called as vertical direction DM, and the relationships between the tuples, which are called as horizontal direction DM. This paper analyzes the storage models of spatial data, uses for reference the technologies of data mining in transaction DB, defines the spatial data association rule, including vertical direction association rule, horizontal direction association rule and two-direction association rule, discusses the measurement of spatial association rule interestingness, and puts forward the work flows of spatial association rule data mining. During two-direction spatial association rules mining, an algorithm is proposed to get non-spatial itemsets. By virtue of spatial analysis, the spatial relations were transferred into non-spatial associations and the non-spatial itemsets were gotten. Based on the non-spatial itemsets, the Apriori algorithm or other algorithms could be used to get the frequent itemsets and then the spatial association rules come into being. Using spatial DB, the spatial association rules were gotten to validate the algorithm, and the test results show that this algorithm is efficient and can mine the interesting spatial rules. 相似文献
2.
基于量化概念格的关联规则挖掘 总被引:4,自引:0,他引:4
在概念格的内涵中引入等价关系并将其外延量化 ,得到量化概念格。利用量化概念格可以清晰地表示知识 ,从而便于挖掘包括关联规则在内的多种规则 ,与经典的 A priori算法相比较 ,规则表示更简捷、直观 ,尤其重要的是用户可根据自己的兴趣交互地挖掘关联规则 ,不需要计算频繁项目集 ,因而提高了挖掘规则的效率 ,适用于大型数据库中关联规则的挖掘 相似文献
3.
为解决审计日志信息利用不充分的问题,通过改进FP-Growth方法研究了审计日志关联规则,提出了基于相互关联规则的KAFP-Growth算法。将现有的审计日志与先进的数据挖掘分析技术结合,在详细研究Apriori算法、PCY算法和FP-Growth算法后,引入了重要属性的概念,对审计日志中的重要属性进行约束,减小了频繁项集,提高了计算性能。实验结果验证KAFP-Growth算法有效提高了审计日志的关联分析效率,相较于FP-Growth算法,在最小支持度相同的情况下,改进算法运行时间速度提升了49.3%,随着数据集规模的增大,改进算法运行时间可提升60%以上。 相似文献
4.
数据挖掘中关联规则的研究与论证 总被引:2,自引:0,他引:2
数据挖掘由一些大型零售机构面临的“决策支持”问题所激发。对数据挖掘中的关联规则的概念和作用进行了探讨,对关联规则中寻找大项集的部分用程序流程的方式加以说明,对自连接操作的提高效率问题加以论证。通过例子说明了数据挖掘关联规则中最大项目集的子集必为最大项目集。 相似文献
5.
关联规则是数据挖掘的一个基本方法,本文首先介绍传统的Apriori算法的过程,分析它在处理大数据集时存在的问题.提出关联规则的一种改进算法,称为哈希修剪算法.然后比较改进的算法与传统的Apriori算法在算法时间复杂度、性能上的差异.通过实验得出,哈希修剪算法在数据挖掘中能够更加有效的处理数据. 相似文献
6.
数据挖掘是计算机科学研究的重要领域之一.文章从主从关系数据集的角度开展关联规则挖掘研究,首先构建了主从关系数据库模型,在此基础上提出一种基于元组ID逆传输的关联规则挖掘算法(TIDRP),避免了挖掘过程中数据的集成过程,减少了资源的消耗,并使挖掘出的规则更符合实际情况. 相似文献
7.
在现有的关联规则改进算法的基础上,深入分析了经典算法的内涵,提出了不产生候选二项集的改进算法,而且减少了扫描数据库的大小.与Apriori算法相比,在较大型的交易数据库中,效率明显提高. 相似文献
8.
关联规则挖掘方法的改进 总被引:3,自引:2,他引:3
分析了关联规则的衡量标准,针对其中的缺点和不足,提出了一种匹配度方法用以取代置信度,并将匹配度方法生成的规则与支持度-置信度框架生成的规则进行了比较.结果表明:用匹配度方法生成的规则不仅前件和后件具有较高的相关性,而且减少了冗余规则的生成. 相似文献
9.
10.
用关联规则方法挖掘保险业务数据中的投资风险规则 总被引:9,自引:0,他引:9
如何找出保险业务数据中有关投保和理赔的规律是保险公司能否提高盈利的至关重要的问题。关联规则发现是数据挖掘技术的一种简单又很实用的方法。文章首先介绍了关联规则的定义以及关联规则的 4个属性 :可信度、支持度、期望可信度和作用度。然后讲述了如何用 SGI公司的数据挖掘工具 Mineset在保险业务数据中发现关联规则 ,从而得出一些对保险公司起指导作用的控制投资风险的规则。关联规则还可广泛用于银行、电信、商业等其它领域 相似文献
11.
李红 《合肥工业大学学报(自然科学版)》2007,30(3):274-277
文章在分析已有并行关联规则挖掘算法的基础上,讨论了多处理器系统中影响并行关联规则挖掘算法性能的主要问题。提出了多数据源在集群系统中的分布策略、在集群系统中进行并行关联规则挖掘的过程与策略、挖掘过程中并行计算的模型与方法以及规则的合并机制。 相似文献
12.
先从理论上证明分布数据库局部频繁集与全局候选频繁集之间存在某种关系 ,利用该关系设计分布数据库关联规则挖掘算法 .该算法的局部频繁集挖掘利用FP -树实现 ,不需生成候选频繁集 ,全局频繁集在局部频繁集基础上直接生成 ,不需重新扫描各局部数据库 ,不会造成过度的网络通信开销 ,具有很好的挖掘效率 相似文献
13.
文章给出了改进的加权关联规则的定义,包括加权关联规则的支持度、信任度、有意义度及支持界等.设计了一套挖掘加权关联规则的行之有效的算法,并通过例子说明了算法的有效性. 相似文献
14.
临床数据中挖掘关联规则算法的选用 总被引:2,自引:0,他引:2
对典型的挖掘关联规则的Apfiori算法和FP-growth算法进行比较分析.然后,结合临床数据的特点,建议在临床数据关联规则挖掘中采用FP-growth算法。 相似文献
15.
基于trie的关联规则发现算法 总被引:2,自引:1,他引:2
郑丽英 《兰州理工大学学报》2004,30(5):90-92
分析了现有的关联规则挖掘算法,总结了当前的研究概况,从数据结构的角度出发,提出了用trie做数据结构存储交易数据库的所有项集,实现快速产生频繁项集,改进关联发现的性能.该方法只需一次扫描数据库,能够支持小的支持度计数和数据库的动态修改. 相似文献
16.
针对现有拓扑关联规则挖掘算法不能够有效地提取长频繁约束拓扑关联规则,提出一种基于区间映射的约束拓扑关联规则挖掘算法,该算法适合挖掘带约束空间布局关系的长频繁拓扑关联规则;该算法用区间映射法的下行搜索策略产生候选频繁拓扑项目集,利用逻辑"与"运算计算拓扑关系事务的支持数.实验证明在挖掘长频繁约束拓扑项目集时,该算法比现有算法更快速更有效. 相似文献
17.
本文针对在事务数据库不变 ,最小支持度和最小可信度发生变化的情况下 ,如何进行关联规则的维护问题进行了研究 ,并提出了一种有效的增量式更新算法 相似文献
18.
一种新的多维关联挖掘智能方法 总被引:1,自引:0,他引:1
关联规则挖掘在数据挖掘中有着重要的作用.本文提出了采用多维模型的架构将维表进行组织,而且利用项目分块和提取感兴趣的个别属性作为多维关联规则挖掘的基本思想,并利用数据库查询语言实现算法,实现了多维的挖掘,经实验表明该算法的效率大大高于Apriori等算法,且易于实现. 相似文献
19.
关联规则挖掘的算法分析 总被引:4,自引:0,他引:4
在分析了关联规则挖掘的算法后,将其应用于某高校科技论文数据库中,挖掘高校教师各职称成次、学历成次与所发表的科研论文数量、档次间的关联规则。掘出该校教师具有博士学位或硕士学位的教授中,在一个聘期内发表在中文核心期刊以上的论文数量为8篇的支持度为15%的置信度是77%等六项强规则。挖掘所得的规则为人事科研部门进行职称考核、评聘、科研管理等工作提供数量依据,便于量化管理。 相似文献