首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
频繁项目集挖掘是多种数据挖掘应用研究的一个重要方面,频繁项目集的快速挖掘算法研究是当前研究的热点,传统Apriori及其改进算法,要多遍扫描数据库并产生大量的候选项目集,针对Apriori算法的缺陷,Han JW(韩家炜)提出FP-growth算法,该算法仅须扫描数据库两遍且无须生成候选项目集,避免了产生“知识的组合爆炸”,提高了频繁项目集的挖掘效率,但FP-growth算法是通过逐步生成条件模式基和条件频繁模式树来挖掘频繁项目集,因而影响了频繁项目集的挖掘效率,为此,在引入F-矩阵概念之后,提出了FP-growth的一种改进算法—IFP-growth,并对改进算法的性能进行了测试,实验结果表明,IFP-growth算法优于FP-growth。  相似文献   

2.
针对Apriori算法需要多次扫描数据库以及可能产生庞大候选集的瓶颈问题,提出了一种改进的频繁项目集挖掘算法,该算法仅通过一次数据库的扫描生成一个链表,以比特位的方式存储项目在事物数据库中出现的位置,并在不产生候选集的基础上通过逻辑运算与集合运算的直接生成频繁项目集。经过实例分析,结果表明该算法相对于Apriori算法,能够在保证准确率的基础上拥有更低廉的代价。  相似文献   

3.
研究分布式环境下约束性关联规则更新问题,包括数据库中事务增加和删除2种情况.引入向导集的概念,提出基于全局局部模式的约束性关联规则增量式更新算法DUCAR,其中包括局部约束性频繁项目集更新算法ULFC和全局约束性频繁项目集更新算法UGFC.该算法充分利用原先的挖掘结果提高更新效率,首先从最高维的频繁n项目集进行更新,在更新过程中考虑约束条件,结合剪枝算法,生成较少数量的满足约束条件的候选项目集.将该算法用Java加以实现,采用多组数据对此算法的性能进行测试,并与其他算法作对比实验,实验结果表明,该算法是高效可行的.  相似文献   

4.
一种用于加快发现频繁项目集的预处理策略   总被引:2,自引:2,他引:0  
分析了Apriori算法关于发现频繁项目集的方法及其效率,提出了一种基于无向项集图的预处理策略,用于加快频繁项目集的生成过程。采用预处理策略的Apriori算法(UIG-Apriori算法)加快了频繁项目集的发现效率,改善了算法的性能。  相似文献   

5.
基于FP-Tree的最大频繁项目集更新挖掘算法   总被引:5,自引:1,他引:4  
发现最大频繁项目集是多种数据挖掘应用中的重要问题.在应用中用户需要调整最小支持度,以发现更有用的最大频繁项目集.为此提出了一种最大频繁项目集更新算法(UMFPA),该算法通过对频繁模式树(FP-Tree)中的频繁项目头表(H Table)增加两个域,从而将减少在数据库不变而最小支持度变化的情况下的更新挖掘最大频繁项目集的费用.实验结果表明,算法在进行最大频繁项目集更新挖掘时具有很好的性能.  相似文献   

6.
间接关联是数据挖掘领域中一种数据项之间的关联关系,可有效地应用于市场营销及Web日志分析等领域.现有的间接关联挖掘算法采用Apriori算法框架,需挖掘出所有的频繁项目集,因而存在挖掘效率低的缺陷.为此,提出了一种基于前缀广义表的快速间接关联挖掘算法,该算法无须生成所有的频繁项目集且仅须扫描数据库2遍,可有效提高间接关联的挖掘效率.  相似文献   

7.
分布数据库关联规则挖掘   总被引:4,自引:0,他引:4       下载免费PDF全文
先从理论上证明分布数据库局部频繁集与全局候选频繁集之间存在某种关系 ,利用该关系设计分布数据库关联规则挖掘算法 .该算法的局部频繁集挖掘利用FP -树实现 ,不需生成候选频繁集 ,全局频繁集在局部频繁集基础上直接生成 ,不需重新扫描各局部数据库 ,不会造成过度的网络通信开销 ,具有很好的挖掘效率  相似文献   

8.
在分析当前Apriori算法及其改进算法的基础上,提出了一种将Apriori算法与物流信息挖掘相结合的Apriori改进算法.通过Apriori改进算法与原Apriori算法挖掘结果的比较,说明了Apriori改进算法不仅缩小了剪枝扫描数据库的规模而且减少了生成频繁项目集的候选项目集.  相似文献   

9.
分布式数据库的关联规则更新算法   总被引:1,自引:0,他引:1  
提出一种分布式数据库的频繁项目集更新算法.该算法主要考虑分布式数据库记录总数不变,增加新项目集后的频繁项目集更新情况.算法排除原数据库已挖掘的频繁项目集,减少了各站点候选频繁项目集数目,同时减少了各站点之间传送的频繁项目集数目,减少网络流量,提高了频繁项目集挖掘的效率.通过理论分析,该算法比FDM算法效率高,并通过实例和实验证明了算法的有效性和可行性.  相似文献   

10.
挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,如果采用Apriori类的候选项目集生成一检验方法,则候选项目集生成的代价通常很高.为寻求避免生成大量候选项集或生成频繁模式树的挖掘算法,提出一种从事务项集交集求最大频繁项集的迭代算法DIIP(Datasets Iteration and Intersection Pruning Algorithm),通过不断缩减事务集数据量和尽可能早地对项目集进行修剪实现最大频繁项集的挖掘,该算法有别于已有的最大频繁项集经典算法,实验表明该算法有效可行.  相似文献   

11.
An efficient hybrid algorithm for mining Web frequent access patterns   总被引:1,自引:0,他引:1  
We propose an cfficienl hybrid algorithm WDHP in this paper for mining frequent access patterns. WDHP adopts the techniques of DHP optimize its performance, which is using hash the to filter candidate set and trimming database. Whenever the database is trimmed to a size tess than a specified threshold, the algorithm puts the database into main memory By constructing a tree. and finds frequent patterns on the tree. The experiment shows that WDHP outperform algorithm DHP and main memory basedalgorithm WAP in execution efficieucy.  相似文献   

12.
一种提取关联规则的数据挖掘快速算法   总被引:8,自引:0,他引:8  
提出了一种从大型数据库中挖掘关联规则的快速算法。该算法以典型的Apriori和DHP算法为基础,提出了中间检查点、等从项目类等概念,并对Apriori中的Apriori-gen算法进行了改进。结果表明,它较Apriori有明显的提高。  相似文献   

13.
基于自主开发的智能手机App(LAISmart)对针阔混交林、阔叶林和农作物3种植被类型的叶面积指数(leaf area index, LAI)进行测量,并以数字半球摄影(digital hemispherical photography,DHP)的测量结果作为参考值进行对比分析.结果表明,虽然LAISmart与DHP的LAI值总体上具有高度一致性(R2=0.95,RMSE=0.68),但是,LAISmart的性能受到植被叶片密集程度的影响.研究发现:LAI>3.9时,LAISmart的测量结果会明显低于DHP的测量结果;智能手机成像传感器的自动曝光模式,是引起LAISmart在测量LAI高值区域估值偏低的重要影响因素;当对LAI高值区域的LAISmart图像进行降低曝光度处理后,LAISmart和DHP的测量结果偏差得到进一步降低,且LAISmart测量结果的精度可以提高49%左右.此外,LAISmart的较窄视场角几乎不会对其测量结果产生影响,若能在调节智能手机曝光度的条件下使用LAISmart,则具有更高效率和更低成本优势的LAISmart可以成为替代DHP的有效方法.   相似文献   

14.
关联规则是数据挖掘研究领域的重要内容之一,在无向项集图的罐础上,结合RSAA算法,提出了一种新的挖掘关联规则的算法,用以发现数据库中有价值的稀有数据.通过将该算法与RSAA算法的分析比较,证明了其在获得频繁项集的效率上具有更好的性能。  相似文献   

15.
HA (hashing array), a new algorithm, for mining frequent itemsets of large database is proposed. It employs a structure hash array, ItemArray ( ) to store the information of database and then uses it instead of database in later iteration. By this improvement, only twice scanning of the whole database is necessary, thereby the computational cost can be reduced significantly. To overcome the performance bottleneck of frequent 2-itemsets mining, a modified algorithm of HA, DHA (direct-addressing hashing and array) is proposed, which combines HA with direct-addressing hashing technique. The new hybrid algorithm, DHA, not only overcomes the performance bottleneck but also inherits the advantages of HA. Extensive simulations are conducted in this paper to evaluate the performance of the proposed new algorithm, and the results prove the new algorithm is more efficient and reasonable.  相似文献   

16.
T Tanabe  K G Beam  B A Adams  T Niidome  S Numa 《Nature》1990,346(6284):567-569
It is thought that in skeletal muscle excitation-contraction (EC) coupling, the release of Ca2+ from the sarcoplasmic reticulum is controlled by the dihydropyridine (DHP) receptor in the transverse tubular membrane, where it serves as the voltage sensor. We have shown previously that injection of an expression plasmid carrying the skeletal muscle DHP receptor complementary DNA restores EC coupling and L-type calcium current that are missing in skeletal muscle myotubes from mutant mice with muscular dysgenesis. This restored coupling resembles normal skeletal muscle EC coupling, which does not require entry of extracellular Ca2+. By contrast, injection into dysgenic myotubes of an expression plasmid carrying the cardiac DHP receptor cDNA produces L-type calcium current and cardiac-type EC coupling, which does require entry of extracellular Ca2+. To identify the regions responsible for this important functional difference between the two structurally similar DHP receptors, we have expressed various chimaeric DHP receptor cDNAs in dysgenic myotubes. The results obtained indicate that the putative cytoplasmic region between repeats II and III of the skeletal muscle DHP receptor is an important determinant of skeletal-type EC coupling.  相似文献   

17.
几种常用文本分类算法性能比较与分析   总被引:9,自引:0,他引:9  
分析了几种典型的文本分类算法的特点,并基于中文文本数据集和英文文本数据集对算法性能进行了综合评价.实验结果表明:对于英文文本数据,支持向量机具有最优的性能,但时间开销最大,贝叶斯算法速度较快;对于中文文本数据,由于分词的困难,使得算法性能普遍低于同等规模下在英文数据集上的性能.几种算法性能均随训练集规模的增大而有改善.  相似文献   

18.
成卷问题是考试系统中的精华部分,题库设计的合理与否固然重要,但成卷算法的优劣更关系到试题库系统性能的好坏。本文分析了考试系统中成卷的若干问题并给出相应的代码,详细地探讨了其设计思想与设计步骤。  相似文献   

19.
A Mikami  K Imoto  T Tanabe  T Niidome  Y Mori  H Takeshima  S Narumiya  S Numa 《Nature》1989,340(6230):230-233
In cardiac muscle, where Ca2+ influx across the sarcolemma is essential for contraction, the dihydropyridine (DHP)-sensitive L-type calcium channel represents the major entry pathway of extracellular Ca2+. We have previously elucidated the primary structure of the rabbit skeletal muscle DHP receptor by cloning and sequencing the complementary DNA. An expression plasmid carrying this cDNA, microinjected into cultured skeletal muscle cells from mice with muscular dysgenesis, has been shown to restore both excitation-contraction coupling and slow calcium current missing from these cells, so that a dual role for the DHP receptor in skeletal muscle transverse tubules is suggested. We report here the complete amino-acid sequence of the rabbit cardiac DHP receptor, deduced from the cDNA sequence. We also show that messenger RNA derived from the cardiac DHP receptor cDNA is sufficient to direct the formation of a functional DHP-sensitive calcium channel in Xenopus oocytes. Furthermore, higher calcium-channel activity is observed when mRNA specific for the polypeptide of relative molecular mass approximately 140,000 (alpha 2-subunit) associated with skeletal muscle DHP receptor is co-injected.  相似文献   

20.
数据存储是有效提高系统性能的方法之一.由于受带宽和无线传输速度的限制,将频繁出现的数据存储在移动数据库系统中显得尤为重要.本文实现了一个数据存储的算法(HighFrequent Data Caching),并通过模拟的方法实现了HFDC与经典的LRU(Least Recently Used)两个算法在性能上的比较.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号