基于成对约束的主动学习半监督聚类算法 |
| |
作者姓名: | 蒋伟进 许宇晖 郭宏 许宇胜 王欣 |
| |
作者单位: | 湖南商学院计算机与信息工程学院;武汉理工大学计算机科学与技术学院;湖南商学院设计艺术学院;北方导航控制技术股份有限公司; |
| |
基金项目: | 湖南省自然科学基金项目(10JJ5064,11JJ6051);教育部人文社科研究一般规划基金项目(11YJAZH039);湖南省社会科学基金项目(07YBB239);国家自然科学基金项目(61472136,21106036);湖南省重点学科建设项目 |
| |
摘 要: | 半监督学习是近年来机器学习领域中的一个重要研究方向,其监督信息的质量对半监督聚类的结果影响很大,主动学习高质量的监督信息很有必要.提出一种纠错式主动学习成对约束的方法,算法通过寻找聚类算法本身不能发现的成对约束监督信息,将其引入谱聚类算法,利用该监督信息来调整谱聚类中点与点之间的距离矩阵.采用双向寻找的方法,将点与点间距离进行排序,使得学习器即使在接收到没有标记的数据时也能进行主动学习,实现了在较少的约束下可得到较好的聚类结果.同时,该算法降低了计算复杂度,并解决了聚类过程中成对约束的奇异问题.通过在UCI基准数据集以及人工数据集的实验表明,算法的性能好于相关对比算法,并优于采用随机选取监督信息的谱聚类性能.
|
关 键 词: | 半监督聚类 主动式学习 半监督学习 成对约束 谱聚类 |
本文献已被 CNKI 等数据库收录! |
|