首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
提出了一种基于聚类的时空关联规则的公交犯罪挖掘算法.针对某市一个区的110报警数据库中的大量业务信息进行分析.首先,通过文本挖掘技术从案情信息中提取时间、地点等信息,并利用高德地图API的地理编码服务和POI搜索功能对提取的地址信息进行地址匹配,提取受害人上下车站点、乘坐公交线路等信息.其次,对提取得到的时空数据进行归并处理.最后,根据案发时段、季节以及是否节假日进行聚类分析,然后在簇内进行时空关联规则分析.这种挖掘方法具有以下特点:①在聚类基础上进行关联规则分析,减少扫描数据库次数,大大缩小数据扫描范围,提高算法效率,更加适合海量犯罪数据的挖掘.②聚类后簇内数据具有相似性,特征更加明显,在此基础上进行关联规则分析产生较小的频繁项集,并且提取出置信度较高的规则.③考虑犯罪行为的时空特性,挖掘过程中同时考虑了案发季节、是否节假日等因素.  相似文献   

2.
关联规则技术在数据挖掘中的应用   总被引:1,自引:0,他引:1  
数据挖掘技术的诞生,使我们能从大量的数据中提取对决策者有用的信息,20世纪90年代初,R.Agrawal等提出了关联规则挖掘技术.关联规则挖掘是为了发现大量数据中项目集之间感兴趣的相关性信息.经过十余年的发展,关联规则挖掘已经成为数据挖掘技术中较为成熟并很重要的一种方法.文中系统描述了关联规则挖掘所涉及的概念、关联规则挖掘算法和关联规则应用领域等.  相似文献   

3.
传统漏洞挖掘方法无法研究Android设备驱动与内核间的交互,且需使相关硬件处于工作状态,很难实现Android驱动未知漏洞挖掘。为此,提出基于关联规则的Android驱动未知安全漏洞挖掘方法。对关联规则漏洞挖掘问题进行形式化描述。依据Apriori法对频繁项集进行初寻找。采用RDARF规则筛选器对规则进行进一步筛选,获取强规则。建立待挖掘驱动样本库,对Android驱动进行自动化分析,考虑Android设备驱动与内核间的交互;针对各Android驱动对各自申请的权限信息进行提取,建立权限特征集合,完成格式化操作;挖掘出所有Android驱动漏洞数据的极大频繁项集,建立权限关系特征库,获取关联规则无需执行驱动;针对待挖掘驱动匹配权限关系特征库,实现未知Android驱动安全漏洞的挖掘。实验结果表明,所提方法挖掘准确性高,CPU占用少。  相似文献   

4.
针对经典挖掘算法挖掘效率低、主观性强、生成关联关系过多的问题,从样本筛选和关联规则生成两个方面提出一种面向高维数据关联规则挖掘的新型算法(mining multidimensional association rules by combination, Marc)。所提算法通过计算样本的分布系数和删除阈值,综合自定义支持度在初读数据集时对样本进行双重筛选,在挖掘之初降低弱样本影响。在频繁项和关联规则生成时以样本关系表和样本全关系组合模式挖掘信息,降低挖掘过程的复杂性和资源消耗。试验结果表明:Marc算法挖掘出的频繁项和关联规则数量显著降低,在挖掘效率和内存消耗上均优于Apriori、FP-Growth和Eclat算法,且维度越高,数据集越大,优势越明显,Marc算法频繁项和关联关系挖掘的精度为100%。  相似文献   

5.
关联规则挖掘是数据挖掘领域中一个非常重要的研究课题。本文对压缩数据的关联规则挖掘进行研究,提出了挖掘算法,与传统的关联规则挖掘算法相比,本算法不但效率高,而且具有较好的伸缩性。  相似文献   

6.
使用关联规则的方法来挖掘基因表达数据,在研究分析经典关联规则挖掘算法优缺点的基础上,立足于基因表达数据所呈现的新特征,提出一种基于BSC_tree的分段与运算基因表达数据频繁模式挖掘新算法BSC-AND.实验结果表明,与FP-growth和FIS算法相比,所提出的算法具有更低的时间复杂性.  相似文献   

7.
传统的正关联规则主要考虑事务中所列举的项目,负关联规则不仅要考虑事务中所包含的项目,还要考虑事务中所不包含的项目,它包含了非常有价值的信息。本文对负关联规则的相关定义、支持度及置信度的计算方法进行了分析讨论,并讨论了对负关联规则挖掘中出现的矛盾规则问题及利用规则相关性解决矛盾规则问题,最后给出了其挖掘算法及其实现。  相似文献   

8.
针对多维数据集的关联规则挖掘,提出了一种基于反区分矩阵的方法.首先由数据集同步得出区分矩阵和反区分矩阵,然后根据区分矩阵进行属性约简,再根据反区分矩阵找出约简后的频繁项集,最后给出关联规则.通过区分矩阵和反区分矩阵将属性约简和关联规则挖掘联系起来,减少了计算步骤,且算法只需扫描数据集一次,避免了繁琐的连接操作.应用实例表明该算法是一种合理有效的关联规则挖掘方法.  相似文献   

9.
关联规则的发现对于挖掘数据中的隐含信息非常重要,针对关联规则挖掘算法进行研究,分析了利用FP_Growth算法构建FP-tree和递归挖掘频繁项集的过程,并应用该算法对大学生兴趣爱好问卷调查结果进行分析,通过找出强关联规则,准确了解学生的共同爱好,有助于更好地开展校园文化活动.  相似文献   

10.
智能手机已经成为个人行为的真实记录设备,对APP使用数据进行挖掘可以提取出用户的行为习惯.为了提取APP的使用关联模式,研究并提出基于数据挖掘的APP关联规则提取技术.首先,基于Android平台,开发APP状态数据收集平台;其次,对APP数据进行预处理;再次,基于Apriori算法,提出了APP关联规则挖掘算法;最后,应用真实个人APP使用数据,对提出的方法进行验证,实验结果证明本文提出的方法在APP关联规则挖掘中的可行性.  相似文献   

11.
苏宝莉 《甘肃科技》2006,22(11):67-69,41
传统预处理数据的方法没有很好地利用数据属性之间的相互信息,所得到的预处理结果难免会出现失真,不能准确反映数据之间的更多信息。本文提出了基于关联分类的缺损数据处理的新方法,利用关联分类算法生成的强关联规则对含有决策的信息系统中的缺损数据进行修补。实例表明此方法是行之有效的。  相似文献   

12.
张维梅 《科技信息》2007,(29):110-112
人寿保险行业在激烈的市场竞争中生成了大量的保单业务,如何对这些海量信息进行深层次的分析与挖掘,让其发挥巨大的增值作用。针对这一问题,利用关联规则挖掘技术从人寿保单数据中,分析投保人的各项特征与索赔的内在关系,所得到的结论对保险公司的业务发展具有重要的指导意义。  相似文献   

13.
汪宏海 《科学技术与工程》2012,12(35):9537-9539,9551
针对数据关联规则挖掘的不足,提出了一种基于免疫记忆克隆算法的关联规则挖掘方法。算法利用了免疫记忆特性,把挖掘的关联规则存入记忆库,加快了挖掘速度。在克隆扩增过程中,设计了一种基于矢量距的抗体浓度计算方法,保证克隆扩增过程中解的多样性。仿真实验结果表明,现算法具有较快的运行速度,提高了所得关联规则的准确性。  相似文献   

14.
分析稀少数据的相关性是一种重要的、有价值的数据挖掘任务。运用面向关联规则的FP树构造方法,提出了一种特异关联规则挖掘算法RSFPA。该算法将包含特异模式的数据集压缩成一棵FP树,通过挖掘FP树来提取特异模式集,从而进一步提高了特异模式的挖掘效率。最后,利用恒星光谱作为数据集,实验验证了RSFPA算法的正确性和有效性。  相似文献   

15.
多层次关联规则的快速挖掘算法   总被引:1,自引:0,他引:1  
数据挖掘被认为是解决“数据爆炸”和“数据丰富,信息贫乏”的一种有效方法。关联规则是数据挖掘的重要研究方向。本文提出了多层次关联规则的一种快速挖掘算法,利用抽样从概念层次树的中间开始挖掘,以提高挖掘的速度。  相似文献   

16.
一种基于关联规则的缺省规则挖掘算法   总被引:2,自引:1,他引:2  
传统的基于Rough集的缺省规则挖掘算法须计算差别矩阵并生成大量的条件属性类,挖掘效率低.为此,本文引入相容关联规则和决策关联规则的概念,提出基于关联规则的缺省规则挖掘算法——DRMBAR,该算法借助FP-tree存储结构挖掘出决策关联规则,并用相容关联规则性质对决策关联规则进行有效修剪后生成相应的缺省规则,DRMBAR可有效地过滤噪声、提高缺省规则挖掘效率,且克服了传统算法依赖于主存的限制,为缺省规则的挖掘提供了一种新的框架。实验结果表明该算法是有效且可行的。  相似文献   

17.
教学评价信息数据挖掘中数据的转化和分析研究   总被引:2,自引:0,他引:2  
数据挖掘就是从大量数据中,抽取隐含的,但又是潜在有用的关联信息和知识发现过程。其中关联规则(Association Rules)的挖掘是一个重要的问题,是大量数据中项集之间有趣的关联或相关联系。介绍了关联规则的概念,并将数据挖掘中的关联规则挖掘应用到教学评价中,从而得到一些对提高教学质量或水平的有用知识。  相似文献   

18.
关联规则的挖掘往往会产生大量的关联规则,"规则爆炸"的问题会使用户很难得到自己所需要的重要信息.极大布尔关联规则集因其包含的规则数量少且不丢失规则信息的优点提高了用户分析关联规则结果的效率,且节省了规则存储空间.在分析频繁闭项集、频繁基项集和极大布尔关联规则性质的基础上提出了一种挖掘极大布尔关联规则的算法,利用此算法可以得到极大布尔关联规则集,还通过实例验证了算法的正确性.  相似文献   

19.
交易数据库中的关联规则挖掘是一个很有价值的问题。现在已有不少关联规则模型,挖掘关联规则的算法也在不断改进。然而,在真正的数据库中,一些特殊的问题还没有被解决。一个主要的未解决的问题就是处理包含时态信息的数据。近几年来,为了解决这个问题,已经提出了基于某些方法的研究。  相似文献   

20.
利用模糊集理论, 结合数据库模糊查询、 规则模板及语言量词等概念和方法, 通过数值信息对规则做进一步约束, 解决了关联规则挖掘中未考虑与项目相关数值信息的缺陷, 提出了基于模糊数值约束的关联规则挖掘, 实验结果表明, 所提出的挖掘方法具有良好的伸缩性, 挖掘效果更具有针对性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号