基于离群点检测的K-means算法 |
| |
引用本文: | 冷泳林,张清辰,赵 亮,鲁富宇.基于离群点检测的K-means算法[J].渤海大学学报(自然科学版),2014(1):34-38,48. |
| |
作者姓名: | 冷泳林 张清辰 赵 亮 鲁富宇 |
| |
作者单位: | 渤海大学高职学院;大连理工大学软件学院; |
| |
基金项目: | 辽宁省科技厅项目(No:2013020014);中国高等职业技术教育研究会规划课题(No:GZYLX2011211);辽宁省教育科学“二五”规划(No:JG12DB211) |
| |
摘 要: | K-means算法以其简单、快速的特点在现实生活中得到广泛应用.然而传统Kmeans算法容易受到噪声的影响,导致聚类结果不稳定,聚类精度不高.针对这个问题,提出一种基于离群点检测的K-means算法,首先检测出数据集中的离群点,在选择初始种子的时候,避免选择离群点作为初始种子.然后在对非离群点进行聚类完成后,根据离群点到各个聚类的距离,将离群点划分到相应的聚类中.算法有效降低离群点对K-means算法的影响,提高聚类结果的准确率.实验表明,在聚类类别数给定的前提下,在标准数据集UCI上该算法有效降低离群点对K-means算法的影响,提高了聚类的精确率和稳定性.
|
关 键 词: | 聚类 K-means算法 离群点 UCI数据集 |
本文献已被 CNKI 等数据库收录! |
|