一种结合Fisher编码的多示例聚类算法 |
| |
作者姓名: | 芮辰 陈艳平 |
| |
作者单位: | 1. 合肥学院实验实训中心;2. 合肥学院人工智能与大数据学院 |
| |
摘 要: | 多示例学习中的数据是由包含多个示例的包所组成的,样本之间真实的相似性被正包中大量的假正例所掩盖。为了拟合多示例数据真实的分布情况,提出了一种结合Fisher编码的多示例聚类算法MIFK-means。首先通过Fisher编码在保留数据语义的同时对多示例数据进行归一化降维,然后通过示例层次的K-means聚类算法揭示多示例数据的分布情况。在基准数据集上的实验表明,MIFK-means算法的聚类效果明显好于包层次的多示例K-means聚类算法,分类精度也可以和现有的经典多示例算法相媲美。
|
关 键 词: | 多示例学习 聚类 Fisher编码 K-means |
|
|