首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 375 毫秒
1.
首先将事务数据库压缩存储到一棵事务线索树(TT-tree)的结点上,并建立这些结点的索引表,然后寻找结点索引表的最后结点到根结点的全部路径,这些路径及路径的交集包含了用于挖掘关联规则的频繁集,该算法只需扫描事务数据库一次,由于采用了逆向搜索TT-tree的方法,搜索的时间开销非常少,该算法可以挖掘中短模式的海量数据,具有很好的伸缩性,同时该算法具有增量挖掘的功能,通过大量的实验数据进行比较。该算法的速度约是Apriori算法的10倍。  相似文献   

2.
通过对传统决策树算法的介绍,阐述了改进后的C4.5算法将在挖掘时间上用时更少.通过对学生成绩进行预处理后,利用改进后的算法挖掘学生成绩之间的关联规则,分析并解释关联规则的结果.  相似文献   

3.
综述了数据挖掘技术在网络入侵检测中的应用,阐述了关联规则分析在网络入侵检测中的应用原理和最新的研究与改进,并指出了目前存在的问题和未来研究的方向。改进由k阶频繁项集生成k+1阶候选频繁项集时的连接和剪枝策略;改进对事务的处理方式,当所有联接完成时只扫描一遍Lk-1,减少Apriori算法中的模式匹配所需的时间开销。实验表明,该算法应用于此系统来提取用户行为特征和入侵模式特征,提高了整个系统的性能。  相似文献   

4.
模糊关联规则及其挖掘算法   总被引:3,自引:1,他引:2  
通过定义模糊事务数据库,用模糊概念表示事务数据之间的关联关系,提出并定义了模糊关联规则的概念,研究了模糊关联的性质,并给出了一种模糊关联规则的数据挖掘算法.  相似文献   

5.
针对当前关联规则挖掘存在的不足,在充分利用本体特点的基础上,对关联规则挖掘方法进行了改进。提出了一种面向领域的噪音清除算法,结合Apriori算法优点,又提出了一种改进的关联规则挖掘算法,采用领域本体技术来优化规则,从而去除冗余规则。通过实验验证所提方法的有效性。  相似文献   

6.
负关联规则挖掘算法研究   总被引:5,自引:0,他引:5  
典型的正关联规则仅考虑事务中所列举的项目.负关联规则不但要考虑事务中所包含的项目,还必须考虑事务中所不包含的项目,它包含了非常有价值的信息.然而,对于负关联规则挖掘的研究却很少,仅有的几种算法也存在一定的局限性.为此,文中提出了一种快速有效的负关联规则挖掘算法MNAR,并给出了一种基于二进制形式的支持数计算方法.理论和实验结果表明算法MNAR是有效和可行的.  相似文献   

7.
在Fp-growth算法的基础上,提出了一种新颖的关联规则挖掘算法.该算法将大型数据库分解成频繁1-项集的项总数个子集,然后对分解得到的各个数据库子集用Fp-growth算法进行约束项数据挖掘,待所有数据库子集的约束项数据挖掘进行完毕后,再合并这些约束频繁项得到大型数据库的频繁项集.实验结果表明新算法所采用的数据库划分策略克服了FP-growth算法对大型数据库进行挖掘时,占用内存大,运行速度慢的不足,是一种适合于大型数据库的关联规则挖掘算法.  相似文献   

8.
针对传统关联规则各项目具有着相似的出现频率和相同的重要性两个前提假设,提出了加权关联规则的概念,重点研究了水平加权关联规则MINWAL(O)算法的基本思想,指出该算法的不足及优化算法,旨在对加权关联规则挖掘算法的扩展和改进奠定基础.  相似文献   

9.
数据的挖掘是一门综合的学科,涵盖计算机数据库以及高等数学等诸多学科,对于如何更好地利用分析数据库,学者一直在探索。本文从关联规则基本理论入手,进一步对关联规则挖掘的经典算法Apriori算法和FP-growth(频繁模式增长)算法进行了详尽描述,并提出了两个算法不同的针对点,有助于使用者在应用时根据环境做出适当选择。  相似文献   

10.
关联规则是数据挖掘中的重要研究内容之一,国内现有的关联规则算法大多是研究挖掘数据库不变的限定条件下,发现挖掘数据的各属性间的所有关联型知识.而事实上大多数挖掘数据会随时间的变化不断变化.针对数据库中追加数据时,如何有效地更新关联规则的问题,提出了一种新算法———IUAMAR算法.该算法可以有效地利用知识数据库中保留的最小非高频繁项目集产生新的候选项目集,避免了候选项目集的数量太庞大的问题.  相似文献   

11.
为了获得流格式数据集的规则挖掘以及降低挖掘过程中的计算开销,提出一种基于动态模糊频繁模式的数据挖掘方法 .首先,确定一种滑动窗口区分新旧事务,以处理连续产生的数据流;然后构建动态模糊频繁模式树(DFFMT),随着滑动窗口的变化,给每个删除的旧窗格添加相应算法,且插入新窗格;最后,当DFFMT构建完成之后,根据当前窗口推理模糊关联规则.两个公开数据集的实验验证了提出方法的有效性.与其他同类方法相比,提出的方法只需要检索数据库一次,可以处理大量的流格式数据集.同时,运行复杂度和存储复杂度表现也较优.  相似文献   

12.
把基于数据垂直分布的模糊关联规则挖掘算法引入到网络的入侵检测,利用该算法从网络数据集中对采集到的数据进行模糊化的处理,并将数据垂直分布于位图中.利用k-means聚类算法建立属性的模糊集和模糊隶属函数,该算法克服了传统的离散分区法的不足,同时改进了已有模糊关联规则,提取出具有较高可信性和完备性的模糊关联规则.  相似文献   

13.
本文重点研究了关联规则经典算法Apriori算法的基本思想,并通过实例说明发现频繁项集的方法,提出了Apriori算法的不足,并结合spss clementine软件将关联挖掘应用于某超市的销售数据,从大类及二级类商品之间两个方面进行挖掘,针对挖掘结果进行了分析,同时提出建议,为超市提供辅助决策信息.  相似文献   

14.
在数据挖掘研究领域中,数据的关联规则占有重要研究地位和突出现实作用。本文论述了关联规则产生的背景,描述了关联规则的相关概念,并对Apriori挖掘算法进行了详细分析。  相似文献   

15.
在Apriori算法的递归链接-剪枝概念上,设计了面向海洋异常事件的关联规则挖掘算法.首先给出事件的相关概念与定义、事件的规则表达及评价指标.根据事件的定义和支持度阈值,生成事件频繁1-项集,并设计面向事件的链接-剪枝算法,实现频繁k-项集到(k+1)-项集的产生.根据事件强关联规则评价指标,提取海洋事件强关联规则.通过太平洋海洋异常事件的关联规则挖掘和典型异常事件间的关联规则分析,验证了该方法的正确性和可行性.  相似文献   

16.
关联规则挖掘可以发现大量数据中项集之间相关联系的知识,隐私保护是当前数据挖掘领域中一个十分重要的研究问题,其目标是要在不精确访问真实原始数据的条件下,得到准确的模型和分析结果.提出了关联规则挖掘形式化定义以及它的基本算法,从关联规则挖掘角度对当前流行的隐私保护关联规则挖掘算法进行了深入浅出的分析和介绍,最后系统回顾了目前人们在数据挖掘领域中对隐私保护关联规则研究的现状,阐述了隐私保护在未来数据挖掘中的发展方向.  相似文献   

17.
本文绍了关联规则挖掘的研究情况,提出了关规则的分类方法,对一些典型算法进行了分析和评价,指出传统关联规则衡量标准的不足,归纳出关联规则的价值衡量方法,展望了关联规则挖掘的未来研究方向。  相似文献   

18.
一个基于频繁项集的时态数据挖掘算法   总被引:5,自引:0,他引:5  
研究了基于频繁项集的一个时态效据挖掘算法。首先,引进了基于频繁项集关联规则的概念,性质,然后,给出了基于时态约束关联规则的相关概念的定义和性质分析。最后,给出了在时态效据库中挖掘具有时态约束的最大频繁项集,并在此频繁项集生成时态关联规则的算法,由此导出了一种具有一定意义的时态关联规则挖掘方法,这种方法可以崩于商品销售。股票价格等问题的知识发现,最后讨论了该算法在股票效据分析上的一个应用。  相似文献   

19.
传统相关性挖掘是在整个事务数据库的时间范围内进行的,但有时用户需得到某一特定时间段(如商品促销活动)内商品的相关性.该文对这类问题进行了详细的讨论,提出了一种基于统计方法的正负时态相关性挖掘算法.在详细讨论了该算法模型的基础上,给出了具体的算法设计,并通过实例检验该算法的有效性和可行性.  相似文献   

20.
较为详细地介绍了关联规则挖掘的基本内容和相关算法,给出了在web个性化网站的建设中,利用关联规则挖掘对用户数据进行分析和预测用户行为的一个实例.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号