首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 218 毫秒
1.
在数据流上挖掘频繁闭项集是数据挖掘中关联性挖掘的重要研究课题之一.该文提出了一种高效的数据流频繁闭项挖掘算法——CFMoment,通过使用滑动窗口不断维护数据流中的频繁闭项集,可适用于实时性要求较高的多种数据流处理应用环境.该算法利用项目的有效比特序列表示来减少滑动窗口所需的时间和内存,进一步提升了在数据流中挖掘频繁闭项集的效率并有效降低了运行过程中的内存需求.实验表明,该算法不仅获得了高精度的挖掘结果,而且其运算速度明显快于现有的Moment算法,在数据流上挖掘频繁闭项集的内存消耗更少.  相似文献   

2.
利用数据空间动态网格划分的方法,对数据流空间的数据分布密度情况进行模拟,并在此基础上提出了一种基于密度的偏倚抽样方法.为验证该抽样方法的有效性,将其应用到数据流中的聚类挖掘,实验结果表明该算法具有良好的适用性和有效性.  相似文献   

3.
应用最大频繁项集信息熵来进行数据流变化检测.采用了一种新的数据流差异度度量方法;提出了一种新的有效挖掘最大频繁项集的算法;给出了应用最大频繁项集信息熵进行数据流变化检测的算法.最后,对算法的时间效率和空间效率进行了分析.  相似文献   

4.
讨论了分布式数据流处理的需求以及重叠网络的特点。在Chord模型的基础上,提出了一种支持分布式数据流处理的双层重叠网络模型,并给出了构建模型的有效算法,最后通过应用验证了该模型的有效性.  相似文献   

5.
通过分析当前电信网络中数据流的特点,结合当前研究成果,给出SWDM数据流入侵检测模型。模型对基于密度和基于距离的两种算法分别进行了改进,将两种算法有效结合,该模型的入侵检测效率有了较大的提高。  相似文献   

6.
传统相关性挖掘是在整个事务数据库的时间范围内进行的,但有时用户需得到某一特定时间段(如商品促销活动)内商品的相关性.该文对这类问题进行了详细的讨论,提出了一种基于统计方法的正负时态相关性挖掘算法.在详细讨论了该算法模型的基础上,给出了具体的算法设计,并通过实例检验该算法的有效性和可行性.  相似文献   

7.
计算复杂度高导致循环神经网络语言模型训练效率很低,是影响实际应用的一个
瓶颈. 针对这个问题,提出一种基于批处理(mini-batch) 的并行优化训练算法. 该算法利用
GPU 的强大计算能力来提高网络训练时的矩阵及向量运算速度,优化后的网络能同时并行处
理多个数据流即训练多个句子样本,加速训练过程. 实验表明,优化算法有效提升了RNN 语
言模型训练速率,且模型性能下降极少,并在实际汉语语音识别系统中得到了验证.  相似文献   

8.
本文提出了一种集成基于EP的分类器用于数据流入侵检测的模型EEPCDS(Ensemble of EP-based Classifiers on Data Stream)。该模型选择滑动窗口中的多个时间段数据来生成多个EP分类器,并且通过加权投票表决对未知样本进行分类,检测入侵行为。EEPCDS能适应数据流环境下的概念漂移,并且能实现较好的目标类召回率和精度的平衡,以及较高的分类准确率。  相似文献   

9.
针对局部优化物流路径时效率低下,无法在全局上实现实际需求应用的问题,建立了一种基于区域划分的物流路径优化模型ZROM(Zoning-routing optimization model),并提出了一种改进Apriori混合聚类分析的KM-A方法求解该模型。该方法利用K-Means聚类分析来划分物流区域,在区域内部利用改进的基于最小代价容忍度的频繁序列模式挖掘算法对路径进行优化。实验分析表明,KM-A方法在覆盖节点网络中目标节点数量相同的情况下可以有效提升物流路径运送的效率,结果合理且具有高度可靠性。  相似文献   

10.
基于分枝路径分析的连续查询降载算法   总被引:1,自引:0,他引:1  
研究了在数据流系统中,由于输入数据流速率增大而引起的连续查询过载时的降载问题.分析了数据流和连续查询网络的特点以及现有降载策略的不足,给出了问题的定义及约束条件,提出了基于分枝路径分析的降载算法.理论分析和实验结果表明了该算法的有效性.  相似文献   

11.
过程数据压缩研究是流数据管理中的一个重要课题,现有的流数据压缩方法都强调其动态性、持续性与海量性,没有考虑到过程数据的具体特性.为了有效利用过程数据采样的局部特性,在对过程数据进行采样时,只要采样区间不大,则相邻样本数据值之差比较少,该文提出了一种基于误差传播的压缩方法.实验表明,该方法具有高效率与低误差等优点.  相似文献   

12.
基于智能卡的高校辅助信息决策支持系统   总被引:2,自引:1,他引:1  
决策支持系统是一个集数据采集、联机分析与数据挖掘为一体的综合信息管理系统,针对目前高校基于智能卡辅助管理中存在的系统众多、无法统一管理、数据资源丰富却无法有效集成利用等问题,构建了一个基于智能卡的高校辅助信息管理决策支持系统,并详细阐述了系统的模型及体系结构,对影响系统设计及实现的元数据设计、数据采集和数据反馈等关键环节进行了讨论.  相似文献   

13.
负关联规则挖掘算法研究   总被引:5,自引:0,他引:5  
典型的正关联规则仅考虑事务中所列举的项目.负关联规则不但要考虑事务中所包含的项目,还必须考虑事务中所不包含的项目,它包含了非常有价值的信息.然而,对于负关联规则挖掘的研究却很少,仅有的几种算法也存在一定的局限性.为此,文中提出了一种快速有效的负关联规则挖掘算法MNAR,并给出了一种基于二进制形式的支持数计算方法.理论和实验结果表明算法MNAR是有效和可行的.  相似文献   

14.
频繁项目集的快速增量式更新算法   总被引:7,自引:0,他引:7  
提出了频繁项目集的快速增量式更新算法(FIUA),主要考虑最小支持度发生变化时频繁项目集的更新情况.FIUA在最坏的情况下仅需扫描数据库一遍,且无需生成候选项目集,有效地节约了存储空间,提高了频繁项目集的更新效率.  相似文献   

15.
随着Internet网络的高速发展,海量的未标签文档和相对少量的已标签文档是当前Web文档的一个普遍情形,如何有效的利用少量的已标签文档去聚类海量的未标签文档,从而更好地获取有价值的信息,即半监督学习问题,已成为当前研究的热点.本文针对目前Web文本挖掘领域的无监督学习算法的检测率不高,而监督学习算法需要大量的标签数据又不易获得的问题,将半监督中的标签绑定技术与优化球形k-均值聚类算法相结合进行Web文本挖掘,并使用真实的测试数据对Web文本挖掘系统进行实验.结果表明本文方法对有价值文本具有较高检测率及较低的误报率,整体检测性能优于基于监督和无监督学习的Web文本挖掘算法.  相似文献   

16.
董贺  荣光怡 《松辽学刊》2008,29(4):107-108
分类算法是数据挖掘中的最重要的技术之一.通过对当前提出的最新的具有代表性的分类算法,从预测精度、学习效率、健壮性等方面进行深入的分析和比较,总结每类算法的各方面特性,从而便于研究者对已有的算法进行改进,提出具有更好性能的新的分类算法,同时方便使用者在应用时对算法的选择和使用.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号