首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 453 毫秒
1.
针对传统决策树分类算法在多数据流分类的正确率和处理速度存在的不足,提出了一种基于基因表达式编程(GEP)的多数据流分类并行算法,以提高多数据流分类的正确率和处理速度.根据GEP在数据分类上的优势,运用GEP原理和数据流段中分类目标相似属性合并构造多数据流分类算法,并对多数据流分类算法进行并行设计与分析,在多核PC上进行对比实验.实验结果表明:该串行与并行分类算法均优于传统算法,且在多样本上具有较好的加速比.  相似文献   

2.
基因表达式编程方法(GEP)是一种新型的数据挖掘和建模工具,应用GEP方法对110个有机化合物的毒性进行了构效关系研究,并与人工神经网络(BP-ANN)和偏最小二乘(PLS)方法比较.结果发现,GEP方法的预测较好,且模型稳定.  相似文献   

3.
为了提高预测并行软件性能的准确性和并行软件的开发效率,提出了一种基于单程序多数据流(SPMD)并行应用软件模块化技术的性能分析预测和并行软件辅助开发方法.通过量化计算开销、通信开销、通信与计算的耦合系数,阐述了在并行计算机系统中利用该方法开发并行计算软件和预测并行计算软件性能的过程.并就影响并行软件性能预测和开发效率的模块设计、模块性能数据建模、模块组合和计算与通信重叠等技术进行了研究.实验表明,该方法提高了预测并行计算软件性能的准确性,也提高了并行计算软件的性能和开发效率.  相似文献   

4.
提出了一种基于卷积神经网络的用户感知评估建模方法,充分利用产品使用数据来定量地建立用户感知评估和产品性能参数之间的映射关系,以支持产品设计改进.首先,利用滑动窗口技术将时间序列形式的使用数据转换为一系列数据单元,并在此基础上建立适用于用户感知评估模型的卷积神经网络结构;然后,通过K-折交叉验证分析确定模型的最优超参数并改善模型的过拟合问题;最后,以智能手机用户感知建模为例验证了方法的有效性.结果表明,所提出的方法能够自动从使用数据中提取出有效特征,用于用户感知评估预测,减少了建模过程中对用户和设计师的依赖,可以帮助设计师及时准确地评估产品表现,为产品设计改进提供决策支持.  相似文献   

5.
化探异常是找矿的重要依据.传统地质统计方法具有无偏、最优等特点,但要求数据呈正态分布,而实际应用往往不符合统计假设;近年来分形理论被大量应用于地球化学异常确定,但存在需要平滑处理数据、不适合含特高品位值等问题;采用随机模拟进行空间分析往往忽视了数据空间分布的结构性特征.本研究利用基因表达式编程(Gene Expression Programming,GEP)在复杂数据建模方面的优势,提出GEP演化建模与空间结构分析有效结合的研究思路,通过克立格选择邻域样品,增强数据空间局部结构信息,采用GEP进行空间趋势分析,并利用多重演化建模技术修正趋势面模型.在云南个旧锡铜多金属矿床的应用实例表明,该研究充分利用了局部空间结构信息,强化局部区域的估值结果,提高建模精度,为有效圈定致矿异常提供新的解决途径.  相似文献   

6.
提出一种基于基因表达式编程算法(GEP)的人口预测新方法,并将该方法应用于东莞市人口预测实例问题研究。实验结果表明:由于基因表达式编程算法采用基因型与表现型相统一的编码方式、高效的遗传算子以及全局搜索的寻优方式,基于GEP算法的人口预测模型能够在样本少的情况下给出相对准确的预测结果。其验证数据的预测绝对值平均误差为0.96%,与灰色系统GM(1,1)预测模型及径向基人工神经网络预测模型相比,预测精度分别提高了18.34%、30.54%。GEP人口预测模型能够更好地挖掘人口发展的复杂非线性模式,有效防止过度拟合现象的发生,提供更为准确、合理的拟合及预测结果。  相似文献   

7.
根据微博社交平台特征,提出了一种基于神经网络的微博舆情预测方法.该方法使用单位时间内的微博发帖量作为事件趋势的量化指标,考虑影响事件发展的因素,根据样本内的数据趋势建模,使用神经网络来预测范围外的事件的未来趋势.仿真实验结果表明,该方法可以快速地对事件发展的趋势进行量化分析和建模,能够准确地预测事件的爆发点和发帖量.  相似文献   

8.
在实际生活中,需要对大量的离散数据建立数学模型对其进行分析和处理,并通过模型对此问题的结果进行预测。介绍了GEP的基本结构和过程,阐述了GEP在实际中的应用。  相似文献   

9.
数控机床热误差的最优线性组合建模   总被引:2,自引:0,他引:2  
提出数控机床热误差的最优线性组合建模方法及其相关算法.该方法通过线性和的方式对基于不同数学理论所建立的热误差模型进行综合,并以不同拓扑结构及训练算法的反向传播神经网络为例,建立了最优线性组合神经网络.通过对一台CNC机床的实际加工数据进行分析,对该建模方法进行验证,并探讨了该方法的最佳使用条件及其原因.建模结果表明,所提出的方法能够在节省建模时间的同时大幅提高所建立模型的预测精度,是一种高性价比的建模方法.  相似文献   

10.
电信客户信用风险等级评估是对电信客户的信用风险进行等级分类. 针对建立客户信用风险等级分类模型时,大量带有类标注数据难以获得的问题,提出了基于主动学习的分类器建模方法,并对基于QBC(委员会投票选择)的主动学习算法进行改进以提高分类器的预测精度. 通过对实际电信客户数据进行信用风险等级建模实验,结果表明:应用新算法,分类器使用了较少的带类标签样本数据,达到了与被动学习相同的精度,大大降低了信用专家评估数据的工作量.  相似文献   

11.
计算机网络入侵通常具有高频度特性,因此,识别是否正常访问,对数据流中重复元素的挖掘,给出频度指标,是一种重要的依据.提出一种基于数据流频繁模式的改进型AFP算法,该算法采用滑动窗口树技术,单遍扫描数据流及时捕获网络上的最新模式信息,并将该算法应用在入侵检测模型中正常数据和异常数据的在线挖掘.解决了有限存储和无限数据流的矛盾.实验结果表明,该模型有较高的报警率和较低的误报率.  相似文献   

12.
张长胜 《科学技术与工程》2013,13(23):6739-6745
提出一个数据流环境下的基于概念格和滑动窗口的频繁项集挖掘算法DSFMCL。算法在滑动窗口内分批挖掘新流入的基本窗口频繁概念后,生成概念格的Hasse图。引入最小支持度ζ和误差因子ε对非频繁概念节点进行剪枝操作。Hasse图中各节点包含频繁项集及其支持度信息。随着新基本窗口的Hasse图的生成与滑动窗口进行概念格纵向合并,最终通过对全部Hasse图节点的扫描可以输出所有频繁项集。实验结果表明,该算法具有良好的性能。  相似文献   

13.
介绍了科学管理流数据的流数据管理系统及根据BIRCH算法中聚类特征的概念,利用簇特征设计与实现了一种新的动态流数据聚类算法。这种新算法改善了基于滑动窗口流数据聚类的有效性以及空间和时间复杂度问题。理论分析和实验结果证明该算法能够有效地处理滑动窗口流数据集,使聚类算法具有良好的可扩展性。  相似文献   

14.
许颖梅 《河南科学》2014,(5):777-780
数据流聚类算法是当前数据流研究领域里的重要分支,而滑动窗口是数据流中一种关注近期数据的近似方法,提出一种采用滑动窗口处理数据的优化算法SWStream.算法采用双层架构思想,在线阶段利用滑动窗口树存储概要结构,动态调整窗口大小.而在离线阶段对上一阶段的结果进行宏聚类,得到最后的结果.实验验证本算法有更高的处理效率,也相对节约内存.  相似文献   

15.
不同数据链所支持的消息格式有所不同,因此多数据链间相互通信时难以进行互操作。针对这一问题,提出了基于消息处理平台的多数据链系统任务分配模型。该模型通过一个消息处理平台对消息格式进行转换并分发给相应的数据链,同时在分析多数据链互操作性的几个主要度量指标的基础上,给出了数据链系统分配模型的数学表达式。然后,结合多数据链消息交换的一个典型应用,采用模拟退火粒子群算法对该模型进行求解。结果表明,在低负载和中等负载情况下,多数据链系统能够在满足互操作性指标的前提下有效地进行消息交换,而且相比于采用标准粒子群算法,模型求解的收敛速度更快,粒子的全局搜索能力更强。  相似文献   

16.
针对不同时间段的数据流对当前数据流分类影响程度不同,在滑动窗口技术基础上提出了时间窗口权值的频繁模式(TWWFP)分类算法.首先,对滑动窗口中的每个基本窗口赋予一个与时间有关的窗口权值;然后,采用TWWFP-Tree结构存储当前滑动窗口中每个基本窗口中的频繁数据属性,实时更新TWWFP-Tree结构;最后,检测相邻3个滑动窗口中权值属性的平均分类误差,发现突变后及时减少下一个滑动窗口的长度可适应数据流的变化.实验证明该分类算法比没有时间窗口权值分类算法的精确度最大提高3%.  相似文献   

17.
非线性时间序列的重构及预测   总被引:1,自引:0,他引:1  
采用自适应前馈网络算法(AFN)进行非线性时序预测,对网络结构设计进行详细的探讨,并应用该方法对经典非线性时间序列数据进行预测,与传统预测方法(TAR)比较,结果证明此种方法具有较好的效果,网络的结构得到了简化。不仅满足了误差目标的要求,而且提高了网络的推广能力。且AFN方法可以对时间序列数据间的关系给出一种基于贡献率的解释。  相似文献   

18.
在海量的动态数据流中发现有价值的知识,是数据挖掘技术研究的重要问题.研究数据流聚类,根据数据流的特点,提出了一种基于滑动窗口的一趟数据流挖掘的算法,对原有的一趟数据流聚类算法进行了改进,增强了一趟数据流聚类算法的扩展性,改进了数据流聚类的质量.  相似文献   

19.
针对当前关于数据流加权最大频繁项集WMFI(weighted maximal frequent itemsets)的研究无法有效地处理频繁阈值和加权频繁阈值不一致情况下WMFI的挖掘问题,提出了完全加权最大频繁项集FWM FI(full w eighted maximal frequent itemsets)的概念.为了减少naive算法在处理滑动窗口下完全加权最大频繁项集挖掘时存在的冗余运算,提出了FWMFI-SW(FWMFI mining based on sliding window over data stream)算法.所提出的算法通过基于频繁约束条件的优化策略减少了naive算法中M ax W优化策略的无效调用次数;采用编辑距离比率作为WMFP-SW-tree的重构判别函数,可以有效减少该树的重构次数.实验结果表明FWMFI-SW算法是有效的,且比naive算法更有时间优势.  相似文献   

20.
0 IntroductionJooipner partoorcess ,sihnags ,rebceeiinvged o nreen oefw tehdei nmtoersets tex dpueen stiovein qfiuneirteymemory requirements from stream-oriented applications .Symmetric HashJoin(SHJ)[1 ,2]which was originally designedto allowa high degree of pipeliningintraditional parallel data-base systems ,is an optional approach because both ofitsinputmust be kept in bounded memory during query execution.Butit leads into thrashing on larger inputs . To rectify the situa-tion,XJoinis pro…  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号