模拟人工蜂群的高维数据特征选择算法研究 |
| |
引用本文: | 刘拥民,王靖枫,黄浩,徐卓农.模拟人工蜂群的高维数据特征选择算法研究[J].郑州大学学报(理学版),2023(3):57-64. |
| |
作者姓名: | 刘拥民 王靖枫 黄浩 徐卓农 |
| |
作者单位: | 1. 中南林业科技大学计算机与信息工程学院;2. 中南林业科技大学智慧林业云研究中心 |
| |
基金项目: | 国家自然科学基金项目(31870532);;湖南省自然科学基金项目(2021JJ31163);;湖南省教育科学“十三五”规划基金项目(XJK20BGD048); |
| |
摘 要: | 针对高维数据集结构复杂且冗余度高的问题,提出一种新型二进制人工蜂群算法进行特征选择。该算法在雇佣蜂蜜源搜索阶段应用差分思想,增加多项式差分变异算子,实现蜜源更新环节的多维性、高效性;在跟随蜂阶段和侦察蜂阶段分别引入交叉算子和最优保存策略,进一步打破局部最优,有效提升了人工蜂群算法的收敛效果;对蜜源的二进制初始化处理,使得算法在特征选择过程中取得了良好表现。在4个Benchmark测试函数上进行实验,结果表明,新算法的寻优精度和收敛速度优于其他4种经典搜索算法。同时,选取7个常用高维数据集进行特征选择,并与7种经典降维算法进行对比,发现新算法的特征约简程度普遍高于88%,并且随着数据集维度的增高,新算法的降维程度和分类精度优于其他7种降维算法。
|
关 键 词: | 特征选择 高维数据 人工蜂群算法 差分进化算法 |
|
|