首页 | 本学科首页   官方微博 | 高级检索  
     检索      

面向概念漂移数据流的在线集成自适应算法
引用本文:崔瑞华,綦小龙,刘艳芳,林玲.面向概念漂移数据流的在线集成自适应算法[J].南京大学学报(自然科学版),2023(1):134-144.
作者姓名:崔瑞华  綦小龙  刘艳芳  林玲
作者单位:1. 伊犁师范大学网络安全与信息技术学院;2. 龙岩学院数学与信息工程学院;3. 计算机软件国家重点实验室南京大学计算机科学与技术系
基金项目:新疆维吾尔自治区自然科学基金(2021D01C466,2021D01C467);
摘    要:概念漂移是流数据的主要特征之一,如何检测概念漂移的发生以及调整预测模型去适应概念漂移现象备受研究者的关注.目前有关概念漂移的大多数算法仅仅针对单一类型的概念漂移检测,并且需限制输入数据服从某一分布,所以在检测多种类型概念漂移时效果不理想.提出一种在线集成自适应算法(KSHPR),在自适应随机森林(Adaptive Random Forests,ARF)算法和流随机补丁(Streaming Random Patch,SRP)算法的基础上进行优化改进,采用非参数检验与滑动窗口相结合的策略进行概念漂移检测,降低窗口平均值对算法性能的影响,并以此为基础建立四个基学习者的集成学习模型,根据基学习者预测准确率,动态分配权值,有效解决流式数据中学习模型精度低的问题.实验证明,提出的算法在真实数据集和合成数据集中均表现优良,与其他算法相比,该算法的稳定性、分类准确性与多类型概念漂移适应能力均有所提升.

关 键 词:流数据  概念漂移  在线学习  集成
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号