首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 466 毫秒
1.
阐述了关联规则挖掘对象事务数据库的特性, 对关联规则挖掘的关键问题频繁项集的几种挖掘方法:Apriori算法、最大频繁项集的挖掘算法、基于频繁链表的频繁项集挖掘算法作了分析研究,并指出了频繁项集挖掘算法优化的必要途径  相似文献   

2.
阐述了关联规则挖掘对象事务数据库的特性,对关联规则挖掘的关键问题频繁项集的几种挖掘方法:Aptiori算法、最大频繁项集的挖掘算法、基于频繁链表的频繁项集挖掘算法作了分析研究,并指出了频繁项集挖掘算法优化的必要途径。  相似文献   

3.
一种快速发现最大频繁项集的挖掘算法   总被引:1,自引:0,他引:1  
文章分析了关联规则发现中关于频繁项集的生成与测试方法,提出一种快速挖掘最大频繁项集的算法MFIA_VTL。该算法针对数据库的垂直事务标识列表结构对项集搜索空间进行基于前缀的划分,来发现最大频繁项集。实验表明,该算法性能稳定,可扩展性好。  相似文献   

4.
基于向量的频繁项集挖掘算法研究   总被引:1,自引:0,他引:1  
针对Apriori算法寻找频繁项集时,需要多次扫描事务数据库和可能产生大量候选项集的问题,提出了一种向量和数组相结合的频繁项集挖掘算法。该算法不仅实现了只扫描事务数据库一次,而且避免了模式匹配,减少了无价值的候选项集的产生。通过与已有算法的比较,验证了本文算法具有较高的挖掘效率,而且数据库的项数越多,此算法的挖掘效果越明显。  相似文献   

5.
为提高挖掘频繁项集的效率,在垂直数据格式下,结合分治思想提出一种基于分治策略与位运算频繁项集挖掘算法DC-FIMBII。利用分治将数据库中的事务划分为多个非重叠部分,对每一部分采用位运算求交计算支持度,从而减少操作时项集的规模和项集的比较次数。在mushroom、pumsb_star和T40I10D100K等数据集上,对DC-FIMBII、Apriori、Eclat、DF-FIMBII等算法进行比较。实验表明,DC-FIMBII具有更高的效率。  相似文献   

6.
研究频繁项集挖掘中的模糊约束问题. 讨论了模糊约束的定义和性质,并根据其性质对项集空间和事务空间进行剪枝,以提高挖掘效率. 使用遗传算法确定模糊集,挖掘最多的满足约束的频繁项集. 仿真结果证明了该方法的有效性.  相似文献   

7.
鉴于高维数据的稀疏性和分类数据特点,探讨了专门针对高维分类数据的聚类方法.首先将原始数据集转换成频繁项集,再通过改造频繁模式树以及给出的剪切策略,挖掘出事务的最大频繁项集,并基于最大频繁项集(MFI)的两个属性,将具有相同MFI的对象归于一类,由此提出了基于最大频繁项集的聚类算法.通过对分类数据集的实验,表明该算法具有相当的稳定性、健壮性和有效性.  相似文献   

8.
基于图的最大频繁项集的生成算法   总被引:1,自引:0,他引:1  
挖掘频繁项集是数据挖掘的重要技术之一,目前已有很多经典算法,如:apriori算法,FP-tree等.挖掘频繁项集主要是寻找最大频繁项集,为了快速寻找最大频繁项集,通常采用削减候选项集、减少扫描数据库次数的方法和将自底向上与自顶向下的搜索方法结合起来(又称双向搜索).双向搜索能有效地缩减搜索空间.本文把基于图的关联规则挖掘和双向搜索的思想结合起来产生最大频繁项集,提出了基于图的最大频繁项集生成算法.此算法用图将数据映射到一个向量上,通过一遍扫描数据库就可以构造整个频繁项集,结合双向搜索,能快速生成频繁项集,对产生较大长度的最大频繁项集也有较好的效果.文末,把基于图的关联规则挖掘算法和基于图的最大频繁项集算法进行了比较,分析出性能差别的原因.  相似文献   

9.
挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,如果采用Apriori类的候选项目集生成一检验方法,则候选项目集生成的代价通常很高.为寻求避免生成大量候选项集或生成频繁模式树的挖掘算法,提出一种从事务项集交集求最大频繁项集的迭代算法DIIP(Datasets Iteration and Intersection Pruning Algorithm),通过不断缩减事务集数据量和尽可能早地对项目集进行修剪实现最大频繁项集的挖掘,该算法有别于已有的最大频繁项集经典算法,实验表明该算法有效可行.  相似文献   

10.
在所有频繁项集挖掘算法中,Apriori算法一直是一个经典的算法,但是该算法存在的最大缺陷是要进行多次的数据库扫描并且在挖掘过程中产生大量的候选频繁项集,因此效率很低.提出了利用基于矩阵的方法挖掘频繁项集,很好地避免了这个缺陷.  相似文献   

11.
提出了一种快速基于约束的医疗图像关联分类算法(CBCPFP-growth算法).算法利用扩展项集表征约束,通过加入最大支持度和项出现位置的约束,并利用最小支持度、最小置信度、关联规则数量的约束有效地在算法执行之初和算法执行过程中删除了冗余模式和规则,通过将频繁项集进行划分并在多个处理器上独立执行,充分利用多处理器协同工作的处理能力,使算法具有并行和分布处理的可扩展性.算法在满足医疗图像领域高精确度,高稳定性要求的同时提高了算法运行效率和医疗图像分类的有效性.  相似文献   

12.
目前金融业客户关系管理(CRM)数据挖掘系统所采用的算法在划分项集数据区段、细节数据挖掘、运算时间效率等方面性能较差。该文分析了CRM系统特性、实施模型、模型挖掘以及CRM数据挖掘系统体系结构;结合时态关联规则挖掘的特点,采取FCQ算法数据转换策略,引入领域知识的泛化层次表;在算法的第二次迭代使用Hash技术连接和剪枝并采用运用候选项集的性质实现压缩数据库规模的技术。该文方法很好地提高了挖掘算法的效率,提高了系统运行的速度与效率,为管理者提供新型商业智能客户关系管理系统。  相似文献   

13.
Apriori算法是关联规则数据挖掘领域中最重要的挖掘方法,针对Apriori算法中挖掘频繁项集的效率问题和产生关联规则的合理性问题,改进相关定义及其使用,并提出改进的Apriori算法,然后将改进算法用于教学评价仿真系统.仿真结果表明,改进算法可高效、合理地挖掘关联规则,为做好课程安排和教学工作提供支持.  相似文献   

14.
基于FP树的FP-Growth关联规则挖掘算法,不需要产生候选项集,是当前频繁项集挖掘算法中应用最为广泛的算法之一.针对该算法在对大型的数据库挖掘的时候,存在运行速度慢,占用资源多的问题,文中发现算法中FP树和条件FP树的构建是最占资源的阶段.为此,提出了一种基于改进的FP树的构造算法.该算法一方面通过节点交换的方式压缩树的规模,提高挖掘的效率;另一方面,利用节点支持度计数的差值作为阈值以限定节点交换的条件,避免了由于交换过于频繁,造成不必要的系统开销,并把这种基于节点交换FP树构造算法称为TFP树算法.经过实验验证和性能分析,结果表明新算法有效,执行时间少,效率高.  相似文献   

15.
针对股评论坛主题发现,提出基于频繁项集与潜在语义相结合的短文本聚类(STC_FL)框架.在基于知网的知识获取后得到概念向量空间,挖掘并筛选出重要频繁项集,然后采用统计和潜在语义相结合的方法进行重要频繁项集的自适应聚类.最后,提出TSC-SN(text soft classifying based on similarity threshold and non-overlapping)算法,通过参数调优策略选择和控制文本软聚类过程.股吧论坛数据实证分析发现:所提出的STC_FL框架和TSC-SN算法可充分挖掘文本潜在语义信息,并有效降低特征空间维度,最终实现对短文本的深层次信息挖掘和主题归类.  相似文献   

16.
江西精神是中华民族优秀传统文化与时代精神的集中体现,主要内涵有:勤劳勇敢的务实精神;母仪天下的贤母精神;重教好学的育才精神;自强不息的改革精神;勤政为民的爱国精神;发明创造的科学精神;互助协作的团结精神;以天下为己任的创新精神;穷本溯源的探索精神;走向世界的开放精神;文章节义并重的精神;"星星之火,可以燎原"的理想信念精神;争创"第一等工作"的进取精神;顾全大局的奉献精神;塑造江西新形象精神;等等。  相似文献   

17.
东北生态类型单雌蓖麻遗传规律研究   总被引:1,自引:0,他引:1  
控制单雌蓖麻单雌性状的基因为4对,其中3对为隐性重叠基因,用符号ai表示,Ai对ai为显性;另外一对为隐性抑制基因,用符号b表示,B对b为显性.纯合隐性基因bb对隐性重叠基因a1a1a2a2a3a3起抑制作用,使得a1a1a2a2a3a3bb(保持株)表现为正常两性株,a1a1a2a2a3a3BB(纯合型)和a1a1a2a2aa3a3Bh(杂合型)表现为单雌株.还有一组控制性转换的修饰基因,当温度过低或极高时,该基因才发生作用,从而使单雌蓖麻出现一些极端分离的比例现象.纯合型单雌株与保持株杂交,可获得全雌系.全雌系与恢复系杂交,F1代全为正常两性株,这样即可用全雌系、保持系、恢复系实现蓖麻三系法制种.  相似文献   

18.
采煤工作面的温度关系到工人的健康、设备的使用性能和煤炭生产的安全。为了研究采煤机运动参数对工作面温升的影响,建立了采煤机设计参数与工作面温升关系的数学模型,分析了采煤机的牵引速度、滚筒转速与工作面温升之间的关系及其影响。模拟结果表明,采煤机的运动参数对工作面的温升有直接的影响,工作面的温度随采煤机牵引速度的提高迅速增加,滚筒转速对工作面的温升影响较大;适当降低采煤机的牵引速度和滚筒转速能降低采煤工作面的温升。该结果为正确选择采煤机的运动参数、减少采煤机工作发热、降低采煤工作面温升、进一步改善采煤工作面的环境提供了依据。  相似文献   

19.
1 IntroductionZn coatedsteelsareusedinvariousindustryfieldsbecauseoflowpricesandhighcorrosionresistance .ItisalsoknownthatZncausesspattersorporosityeasilyinlaserlapwelding[1~ 3] .ItisthusexpectedtounderstandlaserweldingphenomenonofZn coatedsteels,tointe…  相似文献   

20.
连通图G的Wiener指数是指图G中所有点对的距离之和,Harary指数是指图G中所有点对的距离的倒数之和。本文主要研究了单圈图与双圈图的粘合图以及双圈图与双圈图的粘合图的Wiener指数的下界和Harary指数的上界的问题,并刻画了对应的极值图。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号