首页 | 本学科首页   官方微博 | 高级检索  
     检索      

两阶段密度意识子空间聚类模型
引用本文:李长路,王劲林,郭志川,潘梁.两阶段密度意识子空间聚类模型[J].西安交通大学学报,2014,48(10):108-114.
作者姓名:李长路  王劲林  郭志川  潘梁
作者单位:1. 中国科学院声学研究所国家网络新媒体工程技术研究中心,100190,北京;中国科学院大学,100049,北京
2. 中国科学院声学研究所国家网络新媒体工程技术研究中心,100190,北京
基金项目:国家高技术研究发展计划资助项目,国家科技支撑计划资助项目,中国科学院战略性先导科技专项资助项目
摘    要:针对网格聚类方法在高维子空间聚类中网格规模随着维度急剧升高的问题,以及差别阈值方法引入干扰小聚簇的问题,提出一种具有两个网格划分阶段的密度意识子空间聚类模型。该模型第一阶段采用粗网格找出可能存在聚类的子空间区域,第二阶段在这些区域中进行等效精度更高的网格划分并找出所有致密单元。该模型在两个阶段处理的网格规模均远低于密度意识子空间聚类模型在相同划分精度下的网格规模,同时利用第一阶段对网格空间的筛选作用降低小聚簇干扰,提高聚类质量。合成数据集实验表明:该模型聚类精准率和查全率性能明显优于原模型;基于真实数据集实验,相比一次划分模型,该模型以损失0.4%数据点的代价提高输出聚类密度19.4%,聚类质量大幅提升。

关 键 词:数据挖掘  子空间聚类  网格聚类  高维数据

A Density Conscious Subspace Clustering Model with Two Steps
LI Changlu,WANG Jinlin,GUO Zhichuan,PAN Liang.A Density Conscious Subspace Clustering Model with Two Steps[J].Journal of Xi'an Jiaotong University,2014,48(10):108-114.
Authors:LI Changlu  WANG Jinlin  GUO Zhichuan  PAN Liang
Institution:LI Changlu;WANG Jinlin;GUO Zhichuan;PAN Liang;National Network New Media Engineering Research Center,Institute of Acoustics,Chinese Academy of Sciences;University of Chinese Academy of Sciences;
Abstract:
Keywords:data mining  subspace clustering  grid-based clustering  high-dimensional data
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号