首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 318 毫秒
1.
为了获得流格式数据集的规则挖掘以及降低挖掘过程中的计算开销,提出一种基于动态模糊频繁模式的数据挖掘方法 .首先,确定一种滑动窗口区分新旧事务,以处理连续产生的数据流;然后构建动态模糊频繁模式树(DFFMT),随着滑动窗口的变化,给每个删除的旧窗格添加相应算法,且插入新窗格;最后,当DFFMT构建完成之后,根据当前窗口推理模糊关联规则.两个公开数据集的实验验证了提出方法的有效性.与其他同类方法相比,提出的方法只需要检索数据库一次,可以处理大量的流格式数据集.同时,运行复杂度和存储复杂度表现也较优.  相似文献   

2.
应用最大频繁项集信息熵来进行数据流变化检测.采用了一种新的数据流差异度度量方法;提出了一种新的有效挖掘最大频繁项集的算法;给出了应用最大频繁项集信息熵进行数据流变化检测的算法.最后,对算法的时间效率和空间效率进行了分析.  相似文献   

3.
在数据流处理系统普遍使用滑动窗口查询模型来解决数据流的持续查询问题.对一些特殊的查询类型,在使用滑动窗口查询时无法完全达到查询要求,通过引入条件窗口对滑动窗口模型进行更一般化的扩展和改进,可以解决滑动窗口语义在处理这一类型查询中的局限性.  相似文献   

4.
结合数据流的特点,提出了一种面向数据流挖掘的过程模型PM-DSM。针对目前数据流挖掘过程中存在算法众多但利用率低的问题,提出了一种基于Web服务的数据流挖掘过程模型算法管理框架PMAMF-DSM,描述了该框架的体系结构和运行机制,并用UML活动图给出了框架的实现语义。在Eclipse上基于该框架实现了一个数据流挖掘算法管理系统,实验结果表明了该框架的灵活性与自适应性。  相似文献   

5.
隐私保护、数据丢失、网络错误等原因导致网络中大量数据存在不确定性.数据流系统中数据连续不断到达系统,故不能一次性获得全部数据,此外数据的概念特征经常发生变化.针对这种情况,构建了一个增量式分类模型来处理数据具有不确定性的隐含概念漂移的数据流分类问题.该模型采用非常快速决策树算法,在学习阶段使用霍夫丁边界理论迅速构建能处理数据不确定性的决策树模型;在分类阶段将加权贝叶斯分类器应用于决策树的叶子节点,以提高不确定数据分类的准确率;采用滑动窗口技术和替换树来处理数据流中的概念漂移现象.实验表明,无论对人工数据还是实际数据,该算法均有较高的分类准确率和执行效率.  相似文献   

6.
在Fp-growth算法的基础上,提出了一种新颖的关联规则挖掘算法.该算法将大型数据库分解成频繁1-项集的项总数个子集,然后对分解得到的各个数据库子集用Fp-growth算法进行约束项数据挖掘,待所有数据库子集的约束项数据挖掘进行完毕后,再合并这些约束频繁项得到大型数据库的频繁项集.实验结果表明新算法所采用的数据库划分策略克服了FP-growth算法对大型数据库进行挖掘时,占用内存大,运行速度慢的不足,是一种适合于大型数据库的关联规则挖掘算法.  相似文献   

7.
基于频繁模式树的约束最大频繁项目集挖掘算法研究   总被引:2,自引:0,他引:2  
目前绝大多数频繁项目集(或最大频繁项目集)挖掘算法并没有考虑相关领域知识,其结果会产生许多无关的模式.因此,发现约束频繁(或约束最大频繁)项目集是多种数据挖掘应用中的关键问题,然而,这方面的研究工作却很少.为此该文提出了一种快速的基于频繁模式树(FP-tree:一种扩展前缀树结构)的约束最大频繁项目集挖掘及其更新算法.实验结果表明该算法是快速有效的.  相似文献   

8.
利用数据空间动态网格划分的方法,对数据流空间的数据分布密度情况进行模拟,并在此基础上提出了一种基于密度的偏倚抽样方法.为验证该抽样方法的有效性,将其应用到数据流中的聚类挖掘,实验结果表明该算法具有良好的适用性和有效性.  相似文献   

9.
链接预测是大规模社会网络分析挖掘的重要研究内容之一,具有非常重要的应用前景.社会网络种类繁多,不同的网络链接类型往往需要不同的链接预测方法 .为了满足用户的个性化需求并提高链接预测的性能,该文提出了一种基于排序学习的社会网络链接预测算法.该算法以传统的链接预测方法为基础,通过排序学习方法对不同的排序结果进行学习,从而得到具有最大准确性的综合排序列表.在综合排序列表的构建中,在每个排序列表中设置一个滑动窗口,通过对滑动窗口的维护每次迭代选出一个全局最优值,从而使得最终的排序列表是最优的.实验表明,该文提出的算法与相关的链接预测算法相比较具有更高的预测性能,能找出一个预测最准确的排序结果 .  相似文献   

10.
本文提出了一种集成基于EP的分类器用于数据流入侵检测的模型EEPCDS(Ensemble of EP-based Classifiers on Data Stream)。该模型选择滑动窗口中的多个时间段数据来生成多个EP分类器,并且通过加权投票表决对未知样本进行分类,检测入侵行为。EEPCDS能适应数据流环境下的概念漂移,并且能实现较好的目标类召回率和精度的平衡,以及较高的分类准确率。  相似文献   

11.
数据流孤立点检测的主要目的是在合理的时间段内准确发现数据流中的孤立点。传统的孤立点检测算法可以有效发现静态数据集中的孤立点,在动态变化的数据流环境下并不适用,无法及时、有效地发现异常数据。针对数据流环境下对孤立点检测的实时发现、动态调整等要求以及传统算法的不适用,提出了一种新的基于网格的数据流孤立点检测算法ODGrid,ODGrid算法可以实时发现数据流中的异常数据,并根据数据流的变化情况,动态调整检测结果。通过在真实数据集与仿真数据集上的实验,证明了ODGrid算法在精度和速度上优于现有的孤立点检测算法,具有良好的伸缩性。  相似文献   

12.
一个基于频繁项集的时态数据挖掘算法   总被引:5,自引:0,他引:5  
研究了基于频繁项集的一个时态效据挖掘算法。首先,引进了基于频繁项集关联规则的概念,性质,然后,给出了基于时态约束关联规则的相关概念的定义和性质分析。最后,给出了在时态效据库中挖掘具有时态约束的最大频繁项集,并在此频繁项集生成时态关联规则的算法,由此导出了一种具有一定意义的时态关联规则挖掘方法,这种方法可以崩于商品销售。股票价格等问题的知识发现,最后讨论了该算法在股票效据分析上的一个应用。  相似文献   

13.
针对集成学习方法在处理大规模数据集时具有计算复杂度高、基分类器数目多、分类精度不理想的问题,提出一种基于频繁模式的选择性集成算法. 该算法利用频繁模式挖掘的原理,将未剪枝的集成分类器和样本空间映射为事务数据库,并利用布尔矩阵存储分类结果,然后从中挖掘频繁基分类器组成最终的集成分类器,达到选择性集成的目的. 实验结果表明,与集成分类算法Bagging、AdaBoost、WAVE 和RFW 相比,该算法减小了集成分类器的规模,提高了集成分类器的分类精度和分类效率.  相似文献   

14.
关联规则是数据挖掘中的重要研究内容之一,国内现有的关联规则算法大多是研究挖掘数据库不变的限定条件下,发现挖掘数据的各属性间的所有关联型知识.而事实上大多数挖掘数据会随时间的变化不断变化.针对数据库中追加数据时,如何有效地更新关联规则的问题,提出了一种新算法———IUAMAR算法.该算法可以有效地利用知识数据库中保留的最小非高频繁项目集产生新的候选项目集,避免了候选项目集的数量太庞大的问题.  相似文献   

15.
研究了多径衰落信道下OFDM系统的时频同步算法,分析了传统算法定时不准确的原因,提出了一种优化方法,并基于一个对称PN序列来完成时频同步. 通过寻找滑动相关求和值的第1个下降沿完成定时同步,给出了使用滑动求和值搜索窗口大小的选取方法,同时在频率同步中引入修正相关计算的概念. 仿真结果证明了该
算法在多径信道,特别是第1径不是最强径情况下的稳定性和优越性。  相似文献   

16.
针对FUP算法在频繁集增量更新时,剪枝效率低下以及候选集验证速度慢的缺陷,提出了基于支持矩阵的频繁集增量更新的高效挖掘算法—SMFUP算法.该算法不仅采用支持矩阵进行整体剪枝来提高剪枝效率,而且进一步结合频繁2项集矩阵加快候选频繁集的验证速度,从而使算法的增量更新效率大大提高.最后通过实验证明了算法改进的有效性.  相似文献   

17.
基于分枝路径分析的连续查询降载算法   总被引:1,自引:0,他引:1  
研究了在数据流系统中,由于输入数据流速率增大而引起的连续查询过载时的降载问题.分析了数据流和连续查询网络的特点以及现有降载策略的不足,给出了问题的定义及约束条件,提出了基于分枝路径分析的降载算法.理论分析和实验结果表明了该算法的有效性.  相似文献   

18.
讨论了分布式数据流处理的需求以及重叠网络的特点。在Chord模型的基础上,提出了一种支持分布式数据流处理的双层重叠网络模型,并给出了构建模型的有效算法,最后通过应用验证了该模型的有效性.  相似文献   

19.
在Apriori算法的递归链接-剪枝概念上,设计了面向海洋异常事件的关联规则挖掘算法.首先给出事件的相关概念与定义、事件的规则表达及评价指标.根据事件的定义和支持度阈值,生成事件频繁1-项集,并设计面向事件的链接-剪枝算法,实现频繁k-项集到(k+1)-项集的产生.根据事件强关联规则评价指标,提取海洋事件强关联规则.通过太平洋海洋异常事件的关联规则挖掘和典型异常事件间的关联规则分析,验证了该方法的正确性和可行性.  相似文献   

20.
提出一种电磁场表面积分方程全等形子域的重叠型区域分解算法. 该算法在全等形子域上形成一致网格并使所有子域的自作用矩阵共享一个“内-内”子矩阵,显著减少了区域分解算法的内存需求和阻抗矩阵的填充时间. 文中给出的多个算例表明,该算法能得到与矩量法和重叠型区域分解法相一致的计算结果,同时有效减少了对内存的需求和所用的计算时间,从而验证了算法的正确性和有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号