首页 | 本学科首页   官方微博 | 高级检索  
     

基于组标签的多标签流特征选择算法
作者姓名:张展云  罗川  李天瑞  李红梅  刘盾
作者单位:1. 四川大学计算机学院;2. 西南交通大学计算机与人工智能学院;3. 西南交通大学经济管理学院
基金项目:国家自然科学基金(62076171,61573292,61976182);;四川省自然科学基金(2022NSFSC0898);
摘    要:流标签是当前多标签学习领域中一个较新颖的挑战性问题,存在标签空间未定、标签数量不断增加甚至趋于无穷等问题.在多标签学习的特征选择中,每当有新的标签到达时标签空间都将发生改变,传统的多标签特征选择算法需重新进行特征选择,所以不适用.针对此问题,采用将流标签进行分组批量处理的方式,并考虑标签之间的相关性,提出一种新的流式多标签特征选择方法,考虑分组后每组标签内部潜在的关联结构和不同标签组之间的标签差异性,赋予每组标签不同的权重来计算每个特征与标签空间的模糊互信息.同时,结合mRMR (Max-Relevance and Min-Redundancy)的特征选择策略进行冗余特征的剔除,从而挑选最优的特征子集.该方法同时适用于固定标签空间和流式标签空间中的特征选择问题.最后,选取八个多标签基准数据集,采用四种评价指标与已有相关的多标签特征选择方法进行对比实验,实验结果证明了提出方法的有效性和高效性.

关 键 词:多标签学习  特征选择  标签分组  流标签  互信息
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号