首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 125 毫秒
1.
基于可信多数投票的快速概念漂移检测   总被引:1,自引:0,他引:1  
数据流因具有数据持续到达,概念漂移产生时刻无法预测、概念的数量不确定等特征,使得滑动窗口的大小很难事先确定,滑动窗口包含概念的数量对概念漂移检测存在影响.本文提出了基于可信多数投票的快速概念漂移检测算法(CMV_SEA),该算法使用SEA算法中的基分类器淘汰方法,使用可信多数投票实现滑动窗口中基分类器的集成.仿真实验表明:相比于SEA算法,CMV_SEA算法提高了泛化能力;能在新概念产生的第一时间内检测到概念漂移;对概念漂移的检测能力和新概念的学习能力不受滑动窗口大小的影响.  相似文献   

2.
概念漂移数据流分类是一个极具挑战性的问题。当新概念出现时,该概念下的学习样本过少,无法对分类器进行及时调整,进而导致分类精度不高。为了解决该问题,本文提出一种基于局部分类精度的概念漂移数据流分类算法——LA-MS-CDC。第一,LA-MS-CDC将k-means聚类和局部分类精度算法结合,从分类器池中挑选出最优源领域分类器;第二,将最优源领域分类器与目标领域分类器加权集成,进而对样本分类;第三,根据分类样本的真实标签分别计算各分类器的损失,并对目标领域和源领域的分类器权重进行更新;第四,再利用该分类样本对目标领域分类器、最优源领域分类器进行更新;最后,完成分类器池的更新。在公开数据集上的实验结果表明,LA-MS-CDC能够有效地将源领域知识迁移到目标领域,与现有方法相比,其分类效果具有显著性提升。算法代码可在https://gitee.com/ymw12345/LAMSCDC上获取。  相似文献   

3.
提出一种面向概念漂移集成分类的基分类器三支过滤方法.首先基于信息熵理论计算出基分类器的不确定性值,并融合其准确性作为基分类器的质量度量,然后通过预设阈值 α、β 对基分类器进行三支过滤.其过滤策略为:删除质量权值小于等于阈值 β 的基分类器;保留质量权值大于等于阈值 α 的基分类器;对于质量权值大于 β小于 α的基分类...  相似文献   

4.
概念漂移是数据流挖掘的一个研究热点与难点,判断认知收敛是研究盲区.粗糙集已被应用于概念漂移探测,但存在适应性问题,缺少增量式概念漂移的相关研究.针对上述问题,运用粗糙集理论,从单条决策规则和整体决策系统的角度出发,引入决策优势函数与漂移度,对增量式概念漂移的适应与认知收敛问题作了较为深入的研究,提出一种基于决策支持度阈...  相似文献   

5.
垃圾邮件的概念漂移及过滤技术研究   总被引:1,自引:0,他引:1  
提出了双级别的概念漂移检测算法,监视已有的垃圾邮件过滤模型在对邮件分类时是否产生了持续的分类错误,进而对概念漂移进行识别。针对由用户偏好引起的垃圾邮件概念范畴变化,基于本体提出邮件数字指纹与概念子类别之间的关联强度和隶属度算法。通过对比实验,验证了所提方法在垃圾邮件概念漂移问题上的有效性。  相似文献   

6.
概念漂移是流数据的主要特征之一,如何检测概念漂移的发生以及调整预测模型去适应概念漂移现象备受研究者的关注.目前有关概念漂移的大多数算法仅仅针对单一类型的概念漂移检测,并且需限制输入数据服从某一分布,所以在检测多种类型概念漂移时效果不理想.提出一种在线集成自适应算法(KSHPR),在自适应随机森林(Adaptive Random Forests,ARF)算法和流随机补丁(Streaming Random Patch,SRP)算法的基础上进行优化改进,采用非参数检验与滑动窗口相结合的策略进行概念漂移检测,降低窗口平均值对算法性能的影响,并以此为基础建立四个基学习者的集成学习模型,根据基学习者预测准确率,动态分配权值,有效解决流式数据中学习模型精度低的问题.实验证明,提出的算法在真实数据集和合成数据集中均表现优良,与其他算法相比,该算法的稳定性、分类准确性与多类型概念漂移适应能力均有所提升.  相似文献   

7.
商业数据流具有动态性、漂移性等特性,概念漂移特征选择是数据流挖掘的重要工作之一.本文从数据流的特点和概念漂移特性出发,提出了数据流的概念形式化分析流程和基于粒计算构建数据流的概念形式化描述模型;商业数据流的概念漂移实际上取决于其概念外延的变化,文中使用包括外延偶合度和内涵偶合度在内的概念偶合度来描述概念间的相似性;经过粒化的数据流由概念格来表示,进而通过概念格对的松弛偶合度来分析数据流特征;结合概念偶合分析和数据流变化特征,阐述了一种基于数据流概念格对的松弛匹配偶合度算法,并据此分析概念格对来选择数据流的漂移特征.通过实例验证、评价了特征选择,证明其有效性.  相似文献   

8.
F-粗糙集是一种针对信息表簇或决策表簇的新的粗糙集模型.利用F-粗糙集模型中上、下近似的思想,定义了不确定性概念漂移的一些度量,包括概念的上、下近似漂移量和概念的上、下近似耦合度等,并初步探讨了它们的性质.  相似文献   

9.
隐含概念漂移的数据流分类问题是数据挖掘领域研究的热点之一,而实际数据中的噪音会直接影响概念漂移检测及分类质量,因此具有良好抗噪性能的数据流分类方法具有重要的研究和应用价值.随机决策树的集成模型是一种有效的数据流分类模型,为此本文基于随机决策树,引入Hoeffding Bounds不等式来检测和区分概念漂移和噪音,根据检测结果动态调整滑动窗口的大小和漂移检测周期,并提出一种增量式的集成分类方法ICDC,实验结果表明,本文算法在含噪音数据流上处理概念漂移是有效的.  相似文献   

10.
带概念漂移不平衡流数据分类研究是机器学习和现实应用领域的一个难点和热点.针对带概念漂移不平衡流数据的动态性和不平衡性,本文中提出了随机平衡采样算法用于再平衡不平衡数据流.之后,在随机平衡采样算法的基础上提出了一种新的处理带概念漂移的不平衡流数据集成分类算法用于抵抗流数据的概念漂移和不平衡性.理论和实验表明本文中提出的集成分类算法对处理带概念漂移的不平衡流数据较强的多样性和泛化能力.  相似文献   

11.
提出一种改进FIRE(Fuzzy Inference Ruled by Else-action)滤波和改进Prony法相结合的低频振荡模式辨识方法.该方法用改进后具有检测层和调整层的FIRE滤波技术对数据进行快速预处理,再用改进Prony法对滤波后的信号进行分析得到电力系统的低频振荡模式.将该方法分别用于分析试验信号和IEEE 4机系统振荡信号,并同带有传统模糊滤波器的Prony分析结果比较可以看出,改进后的方法可将低频振荡的主导模式在一定的噪声环境下比较准确和快速的辨识出来,且辨识的阶数更接近于实际阶数,验证了其可靠性和实用性.  相似文献   

12.
采用间歇性扰动和加大频率扰动周期的方法提高并网逆变器主动频率偏移法孤岛效应检测的性能,减小其检测盲区.在间歇性扰动方法中,插入不施加扰动的时段,孤岛效应情况下该时段内系统工作频率为负载的谐振频率,根据谐振频率来确定扰动的方向,可获得相应扰动幅度下最小的检测盲区;加大频率扰动周期的方法可以相对较小的频率扰动幅度,在保证电流波形质量基础上进一步提高孤岛效应检测的性能.  相似文献   

13.
目的基于基概念构造面向属性概念格。方法通过每个对象对应的面向属性概念格的基概念,利用其外延与内涵逐层寻找面向属性概念。结果利用基概念找到全部面向属性概念,从而得到完整的面向属性概念格。结论利用基概念可以逐层获得所有面向属性概念,也可以解决其他类型概念格的构造问题。  相似文献   

14.
采用附加低频电源法监测矿井低压供电电缆漏电情况,其监测结果容易受到电缆对地电容变化的影响。为消除电容影响,提高监测的可靠性,通过Simulink建立分支电缆单相漏电模型,对分支电缆增设对地可调电感以进行容性电流补偿,并且在低频电源处增设总支路监测模块。仿真结果表明,改进的附加低频电源监测法提高了监测数据的准确性。  相似文献   

15.
将频率分集的思想应用在逆合成孔径雷达(inverse synthetic aperture radar,ISAR)成像中,通过单频信号合成宽带信号,可解决系统发射接收宽带信号复杂的问题.但窄带的合成可视为宽带信号的稀疏采样,由此带来了旁瓣提高等难点.提出一种基于频率分集ISAR体制的多重信号分类(multiple si...  相似文献   

16.
基于分布式概念格的分类规则挖掘   总被引:1,自引:0,他引:1  
以概念格为分类模型,引入知识合并思想,并针对大规模数据的分类求解以及过拟合问题引入剪枝策略,从而得到分类剪枝概念格模型,在此基础上提出了基于分布式概念格模型的强分类规则提取算法;通过理论证明了算法的正确性,并通过实验证明了算法的可行性。  相似文献   

17.
针对现有测试系统的低频特性不满足测试需求的情况下,在不改变原有测试系统硬件的基础上,通过软件补偿即对此测试系统的传递函数采用零极点相消的方法,使原有测试系统的低频特性从8Hz拓展到了2.5Hz左右,并利用MATLAB编程仿真,验证了此方法的可行性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号