共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
3.
4.
5.
Outliers Mining in Time Series Data Sets 总被引:2,自引:0,他引:2
Zheng Binxiang Du Xiuhua & Xi Yugeng Institute of Automation Shanghai Jiaotong University Shanghai P.R.China 《系统工程与电子技术(英文版)》2002,13(1)
1 INTRODUCTIONKnowledgediscoveryindatabases,commonlyreferredtoasdatamining ,isgeneratingenormousinterestsinbothresearchandsoftwareareas.However,muchoftherecentworkhasbeenfocusedonfinding“LargePat terns”whichpresentcharacteristicsoftheinputdataexhibitedby… 相似文献
6.
数据仓库与数据挖掘技术在高校决策中的应用 总被引:8,自引:0,他引:8
在高校已有的各部门业务数据库的基础上,根据高校管理的方式和特点,阐述利用数据挖掘技术建立高校数据仓库的思路和方法,并论述将其应用于高校决策的有效性和科学性。 相似文献
7.
8.
9.
10.
11.
12.
NI Zhi-wei JIA Rui-yu .Department of Computer Science Anhui University Hefei China .Department of Computer Science University of Science Technology of China Hefei China 《系统科学与系统工程学报(英文版)》2001,10(3)
1 IntroductionAlthough there are momentous progresses and application in Expert System ( ES) [1 ] ,thereare some innate limitations resulting from its symbolic information processing mechanism.Here are some problems listed below:the bottleneck of knowledge acquisition,the frailtyof knowledge,the monotony of inference.So a lot of researchers have advanced manyfresh theories and methods. For example,the knowledge representation includes:theobject-oriented and prototype representation techniq… 相似文献
13.
金融时间序列的数据挖掘技术与经典统计模型的比较 总被引:2,自引:0,他引:2
基于对时间序列的数据挖掘思想与经典建模法的基本思路分析和比较,总结各自的优缺点,并阐述二者是在本质上不同的两类重要的时间序列分析法。 相似文献
14.
基于Hadoop云平台的并行数据挖掘方法 总被引:1,自引:0,他引:1
业界已经开始运用云平台来处理海量高维数据,将各种异构系统仿真为一个系统,其中在Hadoop环境进行数据挖掘会遇到数据模型的全局性、HDFS的文件随机写操作、数据生命周期短等问题.为解决这些问题,在Hadoop上实现高效海量数据挖掘,提出了在Hadoop上一种高效数据挖掘框架,利用数据库来模拟链表结构,管理挖掘出来的知识,提供了树形结构、图模型的分布式计算方法;在此基础上实现一个统计算法——Yscore分箱算法,以及决策树和KD树的建树算法;并利用Vega云对Hadoop集群进行仿真.实验数据表明该框架和算法实用可行,且可能拓展与数据挖掘之外的其他领域. 相似文献
15.
结合智能控制与现代控制理论,在结构控制领域,提出了直接从已有主动控制算法的成功数据样本中提取模糊控制规则的思想和方法。以顶层设置AMD控制装置的五层钢框架模型结构为例,阐述了提取模糊控制规则的步骤,仿真结果证实了所设计的二输入单输出模糊控制器的有效性和鲁棒性。通过76层Benchmark风振模型的模糊控制仿真分析,进一步验证了这种充分利用主动控制算法获取模糊规则思想的有效性。研究成果使结构振动模糊控制器的设计具有一定的依据,为AMD模糊控制走向工程应用奠定了理论基础。 相似文献
16.
在数据流挖掘中,界标窗体考虑了历史模式对当前挖掘的影响,但没考虑到随时间的推移模式衰减的问题。滑动窗口能记录最新、最有用的模式,但窗口的最佳大小无法准确确定。针对一些仿真系统中具有数据流特点的数据,提出了一种挖掘混合窗口中闭频繁项集的方法T-Moment。该方法能在单遍扫描数据流的条件下完整地记录模式信息。同时,T-Moment提出的减枝方法能很好地降低滑动窗口树F-tree的空间复杂度与闭频繁模式树T-tree的维护代价。此外,该方法提出的时间衰减机制能区分历史和最新模式。大量仿真实验结果表明,T-Moment有很好的效率和准确性。Abstract: In data mining,boundary window considers the influence of history pattern to the current mining result,but do not think over mode decaying as time passed. Sliding window can record the latest and most useful patterns,but the best size can not be accurately determined. To aim at data with the characteristics of data flow in some simulation systems,a method for mining the closed frequent patterns in the mixed window of data stream was proposed. The pattern of data stream could be completely recorded by scanning the stream only once. And the pruning method of T-Moment could reduce the space complexity of sliding window tree and the maintenance cost of the closed frequent patterns tree. To differentiate the historical and the latest patterns,a time decaying model was applied. The experimental results show that the algorithm has good efficiency and accuracy. 相似文献
17.
在线挖掘数据流滑动窗口中最大频繁项集 总被引:1,自引:0,他引:1
相对于频繁项集,最大频繁项集的数目较少,挖掘最大频繁项集的算法具有较高的时空效率.提出了一种新的基于文法顺序FP-Tree的最大频繁项集单遍挖掘算法FPMFI-DS.该算法采用了一种混合搜索空间项顺序策略,并利用我们所提出的一种新的剪枝技术-"子集等价剪枝技术",有效缩小搜索空间的大小.基于该算法,提出了一种能够在线更新挖掘数据流滑动窗口中最大频繁项集的算法FPMFI-DS+.FPMFI-DS+算法能够在任意时刻都维护数据流当前窗口中的最大频繁项集.仿真实验表明,FPMFI-DS算法的效率接近于多遍挖掘算法FPMax*,并具有良好的可扩展性,FPMFI-DS+算法更新挖掘速度快. 相似文献
18.
基于PROMETHEE的模式兴趣度评估方法研究 总被引:3,自引:0,他引:3
解释和评估模式是知识发现过程中的一个重要步骤。虽然在数据挖掘的算法中通过设置模式的重要性阚值可以消除大量无关模式,但当面对一个大的数据库时,数据挖掘的最终结果依然很大。从客观和主观两个方面分析了模式兴趣度的影响因子,并用多目标决策方法PROMETHEE对数据挖掘的结果进行综合评估,力图最终自动提交给用户的是易于理解的、潜在有用的有趣模式(知识)。最后通过实例说明了该方法的有效性和实用性。 相似文献
19.