首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
电力系统中长期负荷预测的改进决策树算法   总被引:1,自引:0,他引:1  
崔旻  顾洁 《上海交通大学学报》2004,38(8):1246-1249,1255
以不完备数据分析(ROUSTIDA)补全算法为数据处理前导,将其与属性组合法相结合,提出应用于电力系统中长期负荷预测的改进决策树算法.算例的计算结果表明,该算法弥补了决策树算法的固有缺陷,具有计算速度快、预测精度高、预测误差变化小等优点.尤其在候选属性繁多,原始数据不完整或不准确时,改进算法更具优越性.  相似文献   

2.
基于模式矩阵的FP-growth改进算法   总被引:10,自引:0,他引:10  
数据挖掘中关联挖掘算法比较典型的有Apriori和FP—growth算法.实验和研究证明FP—growth算法优于Apriori算法.但是针对大型数据库这两种算法都存在着较大缺陷,不仅要两次或多次扫描数据库,而且很难处理支持度和数据变化等关联规则更新问题.作者提出了基于模式矩阵的FP—growth改进算法,它至多扫描数据库一次,特别在更新问题上不用重新扫描数据库.通过实验结果分析,验证了这种改进算法相对于原有FP—growth算法的优势,特别在大数据集下,大大降低了挖掘的时间复杂度.  相似文献   

3.
分析了并行序列自身特色,提出了一种并行序列的挖掘算法PSMA,PSMA在hash树的基础上对并行序列事件反复挖掘,产生频繁有效序列模式,它是对传统序列模式挖掘算法的改进.PSMA算法针对并行序列,能更有效地发现所有频繁并行序列模式.  相似文献   

4.
粒子群算法的改进及其在文本分类上的应用   总被引:3,自引:0,他引:3  
本文首先从加强全局搜索能力、提高种群多样性的角度对经典粒子群算法提出二点改进方案,并将改进后的粒子群算法用来作为训练文本分类的分类算法,实现了文本资源的自动分类.  相似文献   

5.
在分析Arning算法和其改进算法的基础上,提出一种新的发现偏离模式的线性算法.该算法将使数据序列突然发生大幅度波动的数据认作例外.已发现的例外被用数据序列平均值代替,在此基础上进行下一例外的发现.实验证明,该算法克服了例外集对数据次序的敏感性,并且下一例外发现不受上一例外发现的影响,从而可以重加有效的发现数据序列中的例外集.  相似文献   

6.
模糊k-prototypes聚类算法的一种改进算法   总被引:6,自引:1,他引:6  
模糊k-prototypes算法是当前聚类分析中最有效算法之一.简述了模糊k-prototypes算法的发展进程和主要性质;并在此基础上.指出它在处理数值型和分类型混合数据时的不足,进而提出一种改进算法;最后,将算法应用到英语借词之中,给出计算结果.结果表明,改进算法具有较好的稳定性和较高的精确度.  相似文献   

7.
随着计算机技术和通信技术的不断发展,用户存储了越来越多、具有很高使用价值的信息,不断涌现的大量信息在给人们带来方便的同时也带来了问题,怎样提取有用信息使得数据挖掘技术应运而生.关联分析是数据挖掘的本质,关联规则挖掘是进行关联分析最常用的方法.在关联规则的Apriori算法的基础上,指出了该算法的不足之处,提出了一种新的改进算法,从而增强了算法的适应性.  相似文献   

8.
关联规则挖掘的AprioriTid算法的改进   总被引:1,自引:0,他引:1  
关联规则挖掘是数据挖掘中常见的一种形式。高效地找出频繁项目集是关联规则挖掘的中心问题.文章在分析生成频繁项目集的AprioriTid算法的基础上,指出了算法中存在由于项目的重复存储而使数据量偏大的问题,提出并证明了“Ck—l中支持率小于minsupport的项目集在Ck-1中是无用的”的定理。并以此为依据改进了算法.实验表明,改进算法在缩小数据规模方面是行之有效的.  相似文献   

9.
在介绍数据挖掘、分类算法有关概念的基础上,介绍了决策树的具体生成算法.为了减少数据量,改进决策树算法实现时的数据结构,详细描述了基于SPRINT(scalable paraUehzable induction of decision trees)分类算法的实现,给出了SPRINT算法的性能评估。  相似文献   

10.
关联规则挖掘是目前数据挖掘的研究难点之一,介绍了关联规则的划分情况,对频集算法进行了改进,提出了处理数值型字段的基本方法,展望了关联规则挖掘的未来研究方向.  相似文献   

11.
介绍了由ChristianHidber提出的在线挖掘关联规则算法Carma,提出了该算法的若干改进,减弱了原算法第一步有交易的子集v被插入集合V的条件,同时改进了maxMissed的计算公式,使其计算更为简单。实验证明,以上改进提高了算法的速度。  相似文献   

12.
以k-means算法为基础,对入侵检测技术和聚类分析技术进行了研究和分析,指出了传统k-means算法的不足,给出了针对性的改进方法.采用KDDCUP99数据集作为源数据集,对k-means以及改进后的算法进行了仿真实验,实验结果表明,改进后的k-means算法在入侵检测系统中,能够有效地提高入侵检测系统的检测率,降低误报率.  相似文献   

13.
关联规则挖掘是从事务数据库中发现大量数据中项集之间存在的有意义的隐藏关系。本文探讨了关联规则挖掘如何应用于医保稽查工作,并论述了对Apriori算法进行的具有针对性的改进。  相似文献   

14.
关联规则是数据挖掘的一个重要研究内容,主要用于从大量数据集中挖掘出有价值的数据项之间的关联关系.典型案例是超市的购物篮分析,主要对顾客的购买记录数据库进行关联规则挖掘,可以发现顾客的购买行为.本文依据Apriori算法的两个基本性质,即任何大项集的子集一定是大项集,非大项集的超集一定是非大项集,对经典的Apriori算法要多次扫面事务数据库的问题,作了一些改进,并进行仿真计算,结果表明,改进的算法确实减少了扫描次数.  相似文献   

15.
The k-means clustering algorithm is one of the most commonly used algorithms for clustering analysis. The traditional k-means algorithm is, however, inefficient while working on large numbers of data sets and improving the algorithm efficiency remains a problem. This paper focuses on the efficiency issues of cluster algorithms. A refined initial cluster centers method is designed to reduce the number of iterative procedures in the algorithm. A parallel k-means algorithm is also studied for the problem of the operation limitation of a single processor machine when given huge data sets. The analytical results demonstrate that these improvements can greatly enhance the efficiency of the k-means algorithm, i.e., allow the grouping of a large number of data sets more accurately and more quickly. The analysis has theoretical and practical importance for work on the improvement and parallelism of cluster algorithms.  相似文献   

16.
流数据频繁项挖掘是一项重要的研究课题,是其他流数据挖掘任务的基础。Lossy counting 算法是第一个近似的流数据频繁项挖掘的算法,并且具有空间和时间的高效性。详细分析该算法,尤其是它不能回答关于时间的查询的不足后,对其进行改进,提出了一个在多时间粒度上挖掘流数据频繁项的设想,加入时间维度。改进后的算法在时间倾斜窗口保存与合并频繁项,可以应用于各种对时间敏感的流数据查询和挖掘应用中。  相似文献   

17.
为克服半结构化数据存储复杂的缺点,提出一种基于动态树的半结构化的存储模型。对该模型进行模式抽取, 并将其引入到Apriori算法。通过设置最小支持度阀值过滤掉不必要的信息, 输出最长频繁路径的集合, 以实现半结构化数据的提取。实验结果表明, 该算法能同时有效地处理分支及环路问题, 避免了死循环的出现。  相似文献   

18.
BP网络计算机优化的实现   总被引:1,自引:1,他引:0  
反向传播算法(B-P算法),是数据挖掘算法中最基本的算法之一。面对大量的数据,怎样选择数据结构,怎样优化参数的设置,怎样优化处理过程,对于此算法的性能将会十分重要。本文主要提出了对该算法的若干改进和优化。实验显示,这些改进和优化都能够在整体上提高算法的效率,能够正确、有效、快速地实现B-P算法。  相似文献   

19.
在分析现有的Web访问挖掘数据预处理模型和会话识别算法的基础上,提出了一种改进的Web访问挖掘数据预处理模型并对基于时间和引用的启发式会话识别算法进行了改进。实验证明,改进的Web访问挖掘数据预处理模型和会话识别算法非常适合于当前搜索引擎广泛使用下的Web访问挖掘数据预处理。  相似文献   

20.
夏龄 《科学技术与工程》2012,12(35):9545-9551
数据挖掘并行算法,应该以不牺牲挖掘效率和挖掘质量为前提。通过对数据挖掘原理和并行化的深入研究,在考虑到挖掘效率,负载平衡,运行环境,节点状态等多方面因素的基础上,提出了一种新的基于动态调度的数据挖掘并行算法。该算法以规模较小的子数据集为并行挖掘单元,各个并行单元之间采用全局通讯模式—Master-Worker模式来进行互相通信。降低了并行挖掘的通信成本,提高了挖掘的效率,缩短了挖掘的时间。同时该算法对不断变化的节点状态适应能力强。最后,实验结果验证了该算法的有效性以及在大数据集挖掘应用中的优越性。该算法不但保证了挖掘结果的正确性,而且具有较高的加速比。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号