首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
程慈  柴瑞敏 《科技信息》2008,(14):143-143
对聚类分析中聚类数的确定问题进行了研究。在SOFM神经网络的基础上,从聚类准则出发,通过试验对聚类准则的曲线特征进行了详细的分析和论证,设计出一种结构自适应的聚类神经网络,该网络能自动确定最佳的聚类数,并提出了一种减少计算量的改进算法。  相似文献   

2.
对近年来k-means算法的研究现状与进展进行总结.首先对较有代表性的初始聚类中心改进的算法,从思想、关键技术和优缺点等方面进行分析.其次选用知名数据集对典型算法进行测试,主要从就同一个数据集不同改进算法的聚类情况进行对比分析,为聚类分析和数据挖掘等研究提供有益的参考.  相似文献   

3.
针对可能性聚类对初始化参数设置依赖性较强的问题,提出一种基于中心自动融合的可能性聚类算法,并证明了算法中尺度因子的多尺度性质.该算法通过建立中心的相关性判定准则,根据数据自身分布特点动态调整聚类数目与结构,通过引入尺度参数实现对数据的多分辨率分析.与传统的模糊和可能性聚类算法相比,该算法摆脱了对聚类数目及初始化中心或隶属度矩阵设置的依赖性,易于控制.人造数据和真实数据实验结果表明,该算法能自动确定数据中不同尺度下的聚类结构,具有识别不同大小聚类结构的能力.  相似文献   

4.
针对可能性聚类对初始化参数设置依赖性较强的问题, 提出一种基于中心自动融合的可能性聚类算法, 并证明了算法中尺度因子的多尺度性质. 该算法通过建立中心的相关性判定准则, 根据数据自身分布特点动态调整聚类数目与结构, 通过引入尺度参数实现对数据的多分辨率分析. 与传统的模糊和可能性聚类算法相比, 该算法摆
脱了对聚类数目及初始化中心或隶属度矩阵设置的依赖性, 易于控制. 人造数据和真实数据实验结果表明, 该算法能自动确定数据中不同尺度下的聚类结构, 具有识别不同大小聚类结构的能力.  相似文献   

5.
传统K-means 算法对于聚类初始点的选取和距离度量的计算异常敏感,因而很可能导致K-means 算法只能收敛得到局部最优解。为此,提出一种改进的K-means 算法,即K-means 聚类算法最优匹配算法,并进行了相关的算法实验分析。该改进算法首先对传统的K-means 聚类算法进行初始点的选取,并分析聚类结果。然后,分别从初始聚类中心的选择和距离算法的确定进行实验测试,引入轮廓系数评价聚类效果,分析实验结果可知,K-means 聚类算法最优匹配算法具有较好的稳定性和较高的聚类准确率。  相似文献   

6.
为解决高多元时间序列聚类算法的问题,采用了一种基于主元分析方法的多元时间序列聚类分析方法,利用MTS序列的前z个主元与每个簇的代表元素之间的Eros距离,将原有的复杂数据降维.在此基础上通过改进K-means算法对选取的多元时间序列的主元进行聚类分析,最后得到K个MTS聚类.理论分析和实验结果表明该算法能有效解决聚类问题.  相似文献   

7.
目前大多数应用于复杂网络社团划分的算法都不能自动确定类别数目.为了解决该问题,在计算出复杂网络的拉普拉斯矩阵特征值之后,利用特征值间隔提出一种自动确定特征向量与类别数目的谱聚类算法.该算法通过数据构造拉普拉斯矩阵,得到一系列特征值,再利用特征值差值确定聚类数目以及特征向量,然后利用K-means算法对特征向量进行处理最终得到社团划分结果.用MATLAB软件对常用网络进行测试,实验结果表明,该算法对复杂网络社团的划分具有较好的分类准确性.  相似文献   

8.
一种新的确定K-均值算法初始聚类中心的方法   总被引:4,自引:0,他引:4  
针对传统的K-均值算法聚类时初始聚类中心难以确定的缺点,利用超立方体技术,并依据同类样本中多数样本具有类似的子向量的特点,将落入同一超立方体的样本认为是一类。然后以这些样本的均值作为初始聚类的中心,实现了聚类中心的确定。通过仿真实验和应用于沙尘暴和非沙尘暴样本的分类,验证了此方法的有效性。  相似文献   

9.
不确定数据聚类是数据挖掘领域中的一个重要的研究热点.本文介绍了不确定数据聚类的uk-means算法及其改进算法ck-means.由于ck-means算法必须计算每个簇到所有对象的质心的距离,因此当聚类的样本很大时,聚类效率依然不是很好.本文提出的kd-means算法只需要计算对象到部分质心的距离,因此可以很大程度地提高...  相似文献   

10.
聚类分析是数据挖掘的一个重要研究方向,而PAM算法是聚类算法中一个重要的方法.本文针对PAM算法不适应大数据集的缺点,给出一个近似的线性时间聚类算法(ALCM),并且从理论上证明了该算法复杂度为关于数据集个数的线性时间复杂度.通过比较实验表明:1)随着数据个数的增大,PAM所花费的时间将激剧增大,而ALCM花费时间与数据集个数呈近似线性增长的关系,即ALCM是适应大数据集的.2)PAM算法和AL-CM算法随数据个数增大,二者的代价函数并无明显差异.  相似文献   

11.
基于势能的快速凝聚层次聚类算法使用一种全新的相似性度量准则,可以更高效地得到聚类结果。针对该算法无法有效处理含噪声的复杂流形数据的缺陷,提出噪声环境下复杂流形数据的势能层次聚类算法。通过势能递增曲线识别噪声点,在新定义的势能最大、最小2层数据上进行自动聚类,以确定类簇的大体框架,并在此基础上对整个数据集进行层次聚类。人工数据集上的实验表明,新算法可以有效处理噪声环境下复杂流形数据;真实数据集上的实验表明,新算法具有更优的聚类效果。  相似文献   

12.
不确定性的出现使传统算法无法直接用于聚类不确定数据流。该文提出一种不确定数据流环境下基于密度的聚类算法,其中提出不确定度的概念以衡量不确定数据的分布信息,并在改进面向确定数据的聚类算法DENCLUE的基础上,提出一种可处理数据不确定度的UDENCLUE算法,以降低数据的不确定性对聚类结果产生的影响;提出滑动窗口下基于密度的不确定数据流聚类算法USDENCLUE,通过聚类特征指数直方图技术实现快速剪枝,可以高效处理噪音数据、演化数据流并生成任意形状的簇;采用真实数据集及人工合成数据集对USDENCLUE与CluStream聚类算法进行比较,实验结果表明了所提出算法的高效性和有效性。  相似文献   

13.
为了发现分布式数据流环境下的微簇,针对数据流的遗忘特性,提出一种基于时间衰减的数据流聚类算法.根据衰减模型增量式的处理局部站点,将局部模型发送给中心站点.中心站点对局部站点的微簇进行合并,生成全局聚类模型.通过真实数据和仿真数据的实验表明,该算法能够得到较好的聚类质量,并且有较好的伸缩性.  相似文献   

14.
《河南科学》2016,(3):348-351
传统K-means聚类算法中聚类初始中心点是随机确定的,实际聚类数据集中可能有孤立点,造成了每次聚类的结果不同,聚类质量不同,有时陷入局部优化状态.针对这些问题,研究者曾试图用距离法解决孤立点的判断和确定初始聚类中心.这种思路存在不科学性.因为孤立点不仅指远离其他点,同时它的周围点稀疏;另外,当数据量过大、数据特征值过多时,算法的运算量大,需要占用大量的计算机资源,运算速度过慢.对传统的K-means聚类算法进行研究,提出了基于密度参数和距离理论的初始聚类中心的确定和孤立点的判断,对传统的K-means聚类算法进行改进.  相似文献   

15.
针对KNN算法在处理推荐系统由稀疏性问题所造成的计算复杂度较大以及评分估计值有误差等问题,本文提出了K-Means聚类中心最近邻推荐算法,首先对初始数据集进行聚类运算,然后找出数据集的聚类中心;其次寻找每个用户所属的聚类中心,将聚类中心代替目标用户放入KNN算法中寻找用户的最近邻;最后做出评分预测.同时又考虑到目标用户...  相似文献   

16.
K-means初始聚类中心优化算法研究   总被引:2,自引:1,他引:1  
由于K-means算法对初始中心的依赖性而导致聚类结果可能陷入局部极小,而采用密度函数法的多中心 聚类并结合小类合并运算的聚类结果明显优于K-means的聚类结果。该算法的每一次迭代都是倾向于发现超球 面簇,尤其对于延伸状的不规则簇具有良好的聚类能力。  相似文献   

17.
针对大数据集的初始聚类中心选取问题,在基于密度的划分算法和适用于大规模数据集限定初值的采样算法基础上,提出了一种用于初始聚类中心的划分采样算法。对聚类子空间在每一维上进行均匀划分形成不同的数据区域,根据数据区域的数据点数的多少进行采样来提高采样的准确性。利用采样思想缩小了数据集的规模,保证了算法在时间上的优势。通过不同规模、不同形状的数据集对算法进行验证,实验结果表明,与其它初始聚类中心算法相比,该算法在准确率和时间上都具有一定的优势。  相似文献   

18.
针对传统聚类算法存在样本形状及孤立点敏感的问题,提出基于修剪树的优化聚类中心(Optimized Clustering Center Based on Trimmed Tree,OCT)算法.该算法自适应地寻找裁剪尺寸来修剪并分割最小生成树为森林,获取森林全部叶子结点并再次构造最小生成树,根据预设簇数n,修剪最小生成树...  相似文献   

19.
<正>客户细分[1]是20世纪50年代中期由美国学者温德尔史密斯提出,是指按照一定的标准将企业的现有客户划分为不同的客户群的行为。XuZanne Donner[1-2]认为:正确的客户细分能够有效的降低成本,同时获得更强、更有利可图的市场渗透。同属一个细分群的消费者彼此相似,  相似文献   

20.
硬聚类算法HCM的求解结果通常是局部最优解,本文将遗传算法应用于HCM聚类算法,同时考虑到该算法实现时的效率和开销,最终提出了一种新的算法MHCM聚类算法。测试数据实验表明采用MHCM聚类算法的结果90%以上能够取得全局最优解,远远超出了采用HCM算法所取得全局最优解的次数,证明了本算法的可推广性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号