首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 406 毫秒
1.
一种基于密度的分布式聚类算法   总被引:1,自引:0,他引:1  
对基于密度的分布式聚类算法DBDC(density based distributed clustering)进行改进,提出了一种基于密度的分布式聚类算法DBDC*.该算法在局部筛选代表点时结合贝叶斯信息准则BIC,得到少量精准反映局部站点数据分布的BIC核心点,有效降低了分布式聚类过程中的数据通信量,全局聚类时综合考虑了各站点数据的分布情况.实验结果表明,算法DBDC*的效率优于DBDC,聚类效果好.  相似文献   

2.
针对有参混合模型的聚类算法需要假设模型为某种已知的参数模型,存在模型不匹配及非参数正交多项式密度估计不是概率密度函数的问题,提出了一种基于规范化的B样条密度模型的图像聚类算法.通过构建基于规范化的B样条密度函数的非参数混合模型,利用非参数B样条期望最大(NNBEM:Non-parametric B-spline Expectation Maximum)算法估计密度模型的未知参数,并根据贝叶斯准则实现图像的聚类.该方法不需要对模型做任何假设,可有效克服有参混合模型与实际数据分布不一致问题.对模拟图像和真实图像数据进行仿真的结果表明,规范化的B样条密度模型的聚类算法比其他算法具有更好的聚类性能.  相似文献   

3.
DBSCAN算法是一种基于密度的空间数据聚类方法, 聚类速度快, 且能够有效处理噪声点和发现任意形状的空间聚类.但是数据量大时要求较大的内存支持和IO消耗, 当空间聚类的密度不均匀,聚类间距离相差很大时, 聚类质量较差.本文在DBSCAN算法的基础上提出一个划分不同密度分别聚类的算法.测试结果表明可以改善聚类效果.  相似文献   

4.
聚类分析是重要的数据挖掘方法,在商务智能、地理信息系统、医学等方面有广泛的应用.随着聚类分析的蓬勃发展,涌现出了许多聚类算法,其中最重要的算法之一是基于密度的空间聚类以及其多种变种——基于密度连通链、基于加权密度、基于引力连通集合的算法.这些算法在概念上相似但没有统一的描述.本文针对基于密度的空间聚类及其变种提出了拓扑的概念.给出了聚类拓扑结构的定义,把簇定义为拓扑连通集合.此外,本文运用全新的拓扑思想改进典型的算法,提出了一种拓扑聚类的新算法.实例证明此算法有效.  相似文献   

5.
一种基于层次树的高效密度聚类算法   总被引:2,自引:1,他引:1  
基于密度的聚类算法具有挖掘任意形状聚类和处理"噪声"数据等优势,同时也存在时间消耗大、参数问题局限及输入顺序敏感等缺陷.为此,文章提出一种基于层次树的密度聚类算法DCHT(Density Clustering Based on Hierarchical Tree),以层次树描述子聚类信息,动态调整密度参数,基于密度探测树结构中相邻子聚类得到最终的聚类簇.理论分析和实验结果表明,该算法适用于大规模、高维数据,并具有动态调整参数和屏蔽输入顺序敏感性的优点.  相似文献   

6.
针对有参混合模型的聚类算法需要假设模型为某种已知的参数模型, 存在模型不匹配及非参数正交多项式密度估计不是概率密度函数的问题, 提出了一种基于规范化的B样条密度模型的图像聚类算法。通过构建基于规范化的B样条密度函数的非参数混合模型, 利用非参数B样条期望最大(NNBEM: Non parametric B splineExpectation Maximum)算法估计密度模型的未知参数, 并根据贝叶斯准则实现图像的聚类。该方法不需要对模型做任何假设, 可有效克服有参混合模型与实际数据分布不一致问题。对模拟图像和真实图像数据进行仿真的结果表明, 规范化的B样条密度模型的聚类算法比其他算法具有更好的聚类性能。  相似文献   

7.
针对已有的基于聚类的彩色图像分割存在的问题,提出了一种基于IHLS颜色空间和密度聚类的彩色图像分割方法.利用IHLS颜色空间改善光照敏感和颜色一致性问题.由于DENCLUE聚类算法聚类速度较慢且需要提供2个用户参数,因此对于DENCLUE算法的迭代策略和参数优选方面进行了改进.实验结果证明此方法具有较好的准确度和鲁棒性...  相似文献   

8.
一种基于密度的启发性群体智能聚类算法   总被引:3,自引:0,他引:3  
提出一种基于密度的启发性群体智能聚类算法.针对以往群体智能聚类算法中分类错误率较高、算法运行时间较长等不足,提出记忆体方法和基于密度的先行(look ahead)策略.用人工数据集和真实数据集进行实验,将实验结果进行比较分析.分析结果表明,基于密度的启发性群体智能聚类算法能够得到令人满意的聚类结果,其分类错误率和运行时间明显小于其它聚类算法.  相似文献   

9.
聚类技术是数据挖掘中的一项重要技术,它能够根据数据自身的特点将集中的数据划分为簇.DBSCAN是一种经典的基于密度的聚类算法,能发现任意数量和形状的簇,但需设置Eps和MinPts参数,且聚类效果对参数敏感.提出一种改进的DBSCAN算法,该算法采用自适应的Eps参数使得DBSCAN算法能对具有不同密度的簇的数据集进行聚类.仿真实验结果验证了所提算法的有效性.  相似文献   

10.
聚类算法是数据挖掘领域中一个非常重要的研究方向.至今为止人们已经提出了许多适用于大规模的、高维的数据库的聚类算法.基于密度的聚类算法是其中一个比较典型的研究方向,文中以DBSCAN为基础,提出一种基于密度的网格动态聚类算法.新算法将网格的原理运用到基于密度的聚类算法中,并采用了动态的参数法,能自动根据数据的分布情况进行必要的参数更改,有效减少DBSCAN对初始参数的敏感度,从而提高了聚类的效率和效果,降低了算法I/O的开销.算法不仅能挖掘出各种形状的聚类,并能准确的挖掘出数据集中突出的聚类.  相似文献   

11.
在分析传统的聚类算法优越性和存在不足的基础上,基于Chameleon算法和谱平分法的思想提出了一种新的聚类方法。相比传统聚类算法而言此算法克服了如k—means算法、EM算法等传统聚类算法在聚类不为凸的样本空间时容易陷入局部最优的缺点,能在任意形状的样本空间上聚类,且收敛于全局最优解,并且可以降低噪声和离群点的影响,提高了算法的有效性。在UCI数据集和5个特殊的二维数据点组成的数据集上进行了实验,证明了本方法的有效性。  相似文献   

12.
针对传统自组织聚类方法处理数据在多维空间中存在多样性和从基本或低层次概念上发现强关联规则中的不足,提出了一种基于自组织分级聚类的数据挖掘方法.该方法采用最大似然分类自组织特征网络(MAXNET)聚类过程,利用自下而上聚合层次聚类方法,对有畸变的二值化输入模式作最大似然分类.最后对一个销售电脑商场中,与任务相关的交易数据集进行了分析,描述了从低层次概念到高层次概念的相互关系.并用matlab仿真软件把该方法和传统方法进行比较,表明了该方法的有效性.  相似文献   

13.
为了快速挖掘大规模空间数据的聚集特性,在cluster_dp密度聚类算法基础上,提出了一种基于弹性分布数据集的并行密度聚类方法 PClusterdp.首先,设计一种能平衡工作负载弹性分布数据集分区方法,根据数据在空间的分布情况,自动划分网格并分配数据,使得网格内数据量相对均衡,达到平衡运算节点负载的目的;接着,提出一种适用于并行计算的局部密度定义,并改进聚类中心的计算方式,解决了原始算法需要通过绘制决策图判断聚类中心对象的缺陷;最后,通过网格内及网格间聚簇合并等优化策略,实现了大规模空间数据的快速聚类处理.实验结果表明,借助Spark数据处理平台编程实现算法,本方法可以有效实现大规模空间数据的快速聚类,与传统的密度聚类方法相比具有较高的精确度与更好的系统处理性能.  相似文献   

14.
张选平  祝兴昌  马琮 《西安交通大学学报》2007,41(12):1387-1390,1395
针对基于密度的聚类算法由高密度区到低密度区的处理顺序所带来的不能识别低密度对象类别的缺陷,通过对聚类过程中可能存在的边界识别进行讨论,提出了一种基于边界识别的聚类算法.该算法的思想是:同簇优先权高于密度优先权,即在选择下一个对象进行聚类时,在已聚类的对象中优先选择同一簇的对象,当对象沿某一方向扩展到达簇边界时停止扩展,转而向其他方向扩展,这种处理顺序能使得类别最大化.通过分析簇边界的密度变化特征,建立了边界识别准则,并根据该准则对数据进行聚类.通过在合成数据和美国加州大学提供的知识挖掘数据库数据集上的实验结果表明,所提算法能有效地处理低密度区域的数据,与识别聚类结构的对象排序算法相比,聚类效果可提高4%左右,而时间性能相当.  相似文献   

15.
基于信息熵的符号属性精确赋权聚类方法   总被引:1,自引:1,他引:0  
对符号类型数据聚类时,一些常用算法通常随机选择初始聚类中心,然而随机选择的中心与实际类中心可能存在较大偏差,因此,会导致聚类迭代次数的增加及聚类精度上的不足。提出一种基于信息熵对符号属性进行赋权的新方法,新方法改进了以往提出的对象密度概念及计算方法,从而弥补了以往方法在计算对象密度时没有 区分每个属性在计算密度时的贡献度,从而可能选择密度大的边界点作为聚类中心,影响聚类效果的不足。提出的新方法优化了初始聚类中心的选择,一些高质量的聚类中心被选出用于聚类。最后通过Matlab编程实现新方法的聚类过程。实验显示,新方法聚类的结果在一些指标上要好于已有方法  相似文献   

16.
在源信号在非充分稀疏条件下,提出了一种改进的两步法欠定盲源分离算法.与现有的大多数稀疏分量分析算法法都是假设源信号是充分稀疏不同,该算法放宽了源信号的稀疏性.与此同时,该算法能够估计出聚类空间的个数,能够克服源信号个数未知的情况.模糊划分矩阵的应用更加有利于源信号的分离.仿真结果表明了该算法的有效性.  相似文献   

17.
18.
一种基于核的模糊聚类算法   总被引:4,自引:2,他引:4  
结合核技术与改进的模糊c均值算法聚类准则提出一 种基于核的模糊聚类算法. 通过引入核函数, 样本点被非线性变换映射到高维特征空间进行聚类, 提高了聚类性能. 同时, 算法改进了模糊c-均值聚类模型中的概率型约束条件, 使其对噪声和野值点具有较好的鲁棒性. 在真实数据和人造数据上与常用聚类算法进行了对比实验, 结果表明该算法具有较低的时间、 空间复杂度与较好的聚类性能.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号