一种改进的不平衡数据流集成分类算法 |
| |
作者姓名: | 刘剑桥 |
| |
作者单位: | 阜阳师范学院语言实验室 |
| |
摘 要: | 本文提出了一种针对类分布不平衡数据流的分类算法。首先,针对数据流的类分布不平衡,采用改进的重采样方法,建立平衡的训练子集;然后,采用支持向量机在平衡的训练子集上建立基分类器;最后,采用WE集成模型组合基分类器,构建不平衡数据流的集成分类器。该算法通过设定相邻数据块的F-value的差值大于等于某一阈值作为更新分类器的标准,同时在更新分类器时引入错分正类实例重新训练基分类器。实验结果表明该算法不仅对正类有较好的分类性能,对整体也有较好的分类性能。
|
本文献已被 CNKI 等数据库收录! |
|