一种新的密度加权粗糙K-均值聚类算法 |
| |
作者姓名: | 谢娟英 张琰 谢维信 高新波 |
| |
作者单位: | 陕西师范大学计算机科学学院,陕西,西安,710062;西安电子科技大学电子工程学院,陕西,西安,710071;陕西师范大学计算机科学学院,陕西,西安,710062;西安电子科技大学电子工程学院,陕西,西安,710071;深圳大学信息工程学院,广东,深圳,518060;西安电子科技大学电子工程学院,陕西,西安,710071 |
| |
基金项目: | 中央高校基本科研业务费专项资金重点资助项目,陕西省自然科学基础研究计划项目 |
| |
摘 要: | 为了克服粗糙K-均值聚类算法初始聚类中心点随机选取,以及样本密度函数定义所存在的缺陷,基于数据对象所在区域的样本点密集程度,定义了新的样本密度函数,选择相互距离最远的K个高密度样本点作为初始聚类中心,克服了现有粗糙K-均值聚类算法的初始中心随机选取的缺点,从而使得聚类结果更接近于全局最优解。同时在类均值计算中,对每个样本根据定义的密度赋以不同的权重,得到不受噪音点影响的更合理的质心。利用UCI机器学习数据库的6组数据集,以及随机生成的带有噪音点的人工模拟数据集进行测试,证明本文算法具有更好的聚类效果,而且对噪音数据有很强的抗干扰性能。
|
关 键 词: | 聚类算法 粗糙K-均值 聚类中心 加权 密度 |
收稿时间: | 2010-04-02 |
本文献已被 CNKI 万方数据 等数据库收录! |
| 点击此处可从《山东大学学报(理学版)》浏览原始摘要信息 |
|
点击此处可从《山东大学学报(理学版)》下载全文 |
|