共查询到20条相似文献,搜索用时 31 毫秒
1.
针对K-means算法需要人为确定聚类个数和随机选取初始聚类中心导致结果陷入局部最优的问题,结合基于密度峰值的聚类算法CFSFDP(Clustering by Fast Search and Find of Density Peaks),提出一种改进的无参数K-means算法。首先,计算样本点的局部密度和离散度。然后,建立决策图,将两个参数组成向量,计算每个点到周围5个点的距离,筛选出距离大于2倍均方差且密度大于平均密度的点作为算法的初始聚类中心,统计聚类中心个数k作为聚类个数,将初始聚类个数k以及初始聚类中心作为K-means算法的初始参数对数据进行聚类。最后,对UCI(University of California, Irvine)数据集、人工建立的高斯数据集以及真实刀具振动数据集3种不同类型的数据集进行聚类。结果表明,所提算法保持传统算法全局最优性,并验证了提出算法的有效性。由于K-means是一种无监督聚类方法,在获得较优刀具状态识别结果的同时,可减少人工数据标定、有监督训练等工作量及运算成本,这对于准确实时提取数控机床刀具运行状态具有较高的实际意义。 相似文献
2.
针对密度峰值聚类算法(DPC)中存在的截断距离难以确定、局部密度定义单一的问题,本文提出了一种基于密度万有引力改进的引力峰值聚类算法(DG-DPC算法)。该算法使用相互K近邻的方法对相似性度量和局部密度进行了重新定义,然后将引力参数引入到DPC算法中,并通过新的相对局部密度与引力参数的倒数作出决策图选取簇中心,对数据集中的点进行分配。仿真实验表明,DG-DPC算法对于人工合成数据集和UCI数据集都有效,且准确率相对于基于相对密度优化的密度峰值聚类算法(RE-DPC算法)、DPC算法、基于间隙自动中心检测的密度峰值聚类算法(GAP-DPC算法)分别平均提高了31.07%、21.60%、17.20%。 相似文献
3.
针对有参混合模型的聚类算法需要假设模型为某种已知的参数模型, 存在模型不匹配及非参数正交多项式密度估计不是概率密度函数的问题, 提出了一种基于规范化的B样条密度模型的图像聚类算法。通过构建基于规范化的B样条密度函数的非参数混合模型, 利用非参数B样条期望最大(NNBEM: Non parametric B splineExpectation Maximum)算法估计密度模型的未知参数, 并根据贝叶斯准则实现图像的聚类。该方法不需要对模型做任何假设, 可有效克服有参混合模型与实际数据分布不一致问题。对模拟图像和真实图像数据进行仿真的结果表明, 规范化的B样条密度模型的聚类算法比其他算法具有更好的聚类性能。 相似文献
4.
针对有参混合模型的聚类算法需要假设模型为某种已知的参数模型,存在模型不匹配及非参数正交多项式密度估计不是概率密度函数的问题,提出了一种基于规范化的B样条密度模型的图像聚类算法.通过构建基于规范化的B样条密度函数的非参数混合模型,利用非参数B样条期望最大(NNBEM:Non-parametric B-spline Expectation Maximum)算法估计密度模型的未知参数,并根据贝叶斯准则实现图像的聚类.该方法不需要对模型做任何假设,可有效克服有参混合模型与实际数据分布不一致问题.对模拟图像和真实图像数据进行仿真的结果表明,规范化的B样条密度模型的聚类算法比其他算法具有更好的聚类性能. 相似文献
5.
一种三维点云聚类算法的研究 总被引:1,自引:1,他引:0
在重构曲面之前,需要对点云数据进行聚类处理,以保证后续3D重建工作准确、高效地进行。基于采用传统的聚类方法处理立体视觉形成的海量数据所存在的计算与存储瓶颈问题,提出一种新型的聚类算法,即基于包围盒的密度聚类算法。它首先利用包围盒算法对给定的海量点云进行过分聚类,然后对每个过分簇求中心,用中心点代替过分簇,最后在过分簇的级别上进行基于密度的聚类来完成对整体的聚类。结果显示该方法能够有效地实现海量点云的聚类,突破计算瓶颈。它实现了原始点云的大量删减,简化率高达96.75%,并最终在过分簇的级别上将原始点云分为5类。 相似文献
6.
针对密度峰值聚类(DPC)算法在处理结构复杂、 维数较高以及同类中存在多个密度峰值的数据集时聚类性能不佳的问题, 提出一种基于K近邻和多类合并的密度峰值聚类(KM-DPC)算法. 首先利用定义的密度计算方法描述样本分布, 采用新的评价指标获取聚类中心; 然后结合K近邻思想设计迭代分配策略, 将剩余点准确归类; 最后给出一种局部类合并方法, 以防将包含多个密度峰值点的类分裂. 仿真实验结果表明, 该算法在22个不同数据集上的性能明显优于DPC算法. 相似文献
7.
8.
一种改进的聚类和孤立点检测算法 总被引:1,自引:0,他引:1
对基于距离的聚类及基于密度的孤立点检测方法进行了分析研究,提出了一种基于距离和密度的聚类和孤立点检测算法DDBCOD.该算法根据距离和密度阈值对数据进行聚类,并发现数据中的孤立点.实验表明,该算法能够识别任意形状的聚类,对高维数据有效,能够很好地识别出孤立点. 相似文献
9.
在使用K-Means进行文本聚类的研究中,针对K-Means算法缺点,提出了利用DBSACN算法确定参数K的方法,将基于密度的聚类算法应用于特征选取上,使得K值计算有了一定的确定性,从而提高了聚类质量。这种将多种算法混合运用的方法,为文本聚类算法的设计提供一个新的方向。 相似文献
10.
张横云 《西南民族学院学报(自然科学版)》2009,35(3)
新的基于网格聚类算法(GCAB)利用网格处理技术对数据进行了预处理, 并引进了网格密度阈值处理和网格中心点两种技术. 实验表明, GCAB算法不仅具有DBSCAN算法准确挖掘各种形状的聚类和很好的噪声处理能力的优点, 而且具有较高聚类速度. 相似文献
11.
为了解决密度峰值聚类算法选择密度峰值点困难以及误分配的问题,基于流形的连通性,提出了一种改进的密度峰值聚类算法。通过使用三支密度峰值聚类算法,得到初始聚类结果与簇的边界点,根据这些边界点之间的连通性判断初始聚类之间的连接情况,并利用这些信息进行聚类结果融合。重复上述过程,每次迭代中在剩余数据里寻找密度峰值候选点,并将其纳入聚类过程,得到一种对流形数据友好的聚类算法。结果表明,所提算法在人工数据集和真实数据集上均有较好的表现,聚类准确度相较现有算法更高。基于连通性的三支密度峰值聚类算法可以在不计算路径距离的前提下,有效识别流形数据,大大降低了计算成本。 相似文献
12.
《杭州师范大学学报(自然科学版)》2017,(3)
利用核密度估计的非参数检验特性,提出了一种基于核密度估计的Kmeans改进算法KernelKmeans.该算法综合了基于划分的聚类思想以及基于密度的聚类思想,首先由核密度估计算法计算样本点的密度分布,然后对密度分布栅格进行窗口计算并取极大值来初步确定聚类中心以及聚类数量,最后将聚类中心和聚类数量作为参数输入Kmeans算法得到聚类结果.以OpenStreetMap发布的京津冀城市群点数据开展实验研究,采用算法运算时间与轮廓系数为验证指标,与Kmeans算法、极大极小改进Kmeans算法进行了对比验证,结果表明Kernel-Kmeans算法的精度高于后两者. 相似文献
13.
为了实现对工程结构各平面更加全面、快速、准确的数字化检测,本文提出了一种基于三维点云的工程结构平面自动分割及表面检测方法。首先,通过无人机重建满足工程检测精度要求的高精度三维点云模型;其次,融合体素降采样方法、随机采样一致性(RANSAC)方法和基于密度的聚类算法(DBSCAN),快速、精准、自动地分割工程结构的特征平面,避免手动分割过程中存在的结果不确定及计算效率低的问题;第三,通过设计的精细分割算法有效剔除特征平面周围的噪点,准确提取结构特征平面点云,计算分析特征平面点云,数字化描述结构的表面形状;最后,通过一个在建地铁车站深基坑工程实例,系统地验证了该方法的有效性和准确性。研究结果表明:设计的三维点云平面自动分割算法能够实现工程结构各个平面快速准确的自动分割,自动分割与手动分割结果的交并比接近90%;针对工程结构平面的表面检测算法能够实现结构表面形状的准确测量,有效映射结构物理表面的状态。 相似文献
14.
基于网格和密度的随机样例的聚类算法 总被引:2,自引:0,他引:2
为提高密度聚类算法效率并处理非空间属性约束,提出了基于网格和密度的聚类算法(GDRS).它使用网格区域表示点的邻域,非空间属性被分为数值和字符类型.首先通过网格方法找到能准确反映数据空间几何特征的参考点;然后随机选择没有分类的参考点,并测试其邻域的稀疏状况、与其他聚类的关系以及非空间属性的约束来决定加入、合并聚类或形成新的聚类;最后把参考点映射回数据.把此算法和DBSCAN及DBRS算法进行了理论比较,并使用合成和真实数据集对GDRS和DBSCAN进行了对比.实验表明,GDRS具有密度算法的优点,即可发现各种形状的聚类并能屏蔽噪声点,且执行效率明显优于密度算法. 相似文献
15.
为提高噪声模型的估计精度,改善系统率失真性能,文中提出了一种基于残差子带分组聚类的自适应噪声模型估计方法.首先根据频率高低对残差子带进行分组,然后由组内子带残差样本生成特征矢量,进而利用改进的模糊c-均值聚类算法对当前解码子带进行聚类,最后计算出每类残差系数的噪声参数.实验结果表明,相比于相邻子带聚类-方差估计算法,文中所提算法能够更加准确地匹配残差分布特征,率失真性能平均提升0.60 d B,且解码时间平均节省40.59%. 相似文献
16.
聚类算法是数据挖掘领域中一个非常重要的研究方向.至今为止人们已经提出了许多适用于大规模的、高维的数据库的聚类算法.基于密度的聚类算法是其中一个比较典型的研究方向,文中以DBSCAN为基础,提出一种基于密度的网格动态聚类算法.新算法将网格的原理运用到基于密度的聚类算法中,并采用了动态的参数法,能自动根据数据的分布情况进行必要的参数更改,有效减少DBSCAN对初始参数的敏感度,从而提高了聚类的效率和效果,降低了算法I/O的开销.算法不仅能挖掘出各种形状的聚类,并能准确的挖掘出数据集中突出的聚类. 相似文献
17.
《兰州理工大学学报》2018,(6)
针对谱聚类算法在构造相似矩阵时对尺度参数敏感以及对多尺度数据集聚类效果不太理想的问题,提出了基于密度敏感的改进自适应谱聚类算法.首先利用密度差来调整簇类样本点之间的相似度构造新的相似矩阵函数,然后利用新的相似矩阵构造拉氏矩阵,选取拉氏矩阵的前k个最大特征值对应的特征向量组成新的向量空间,新的向量空间中的点与原始数据一一对应,最后引入K-means聚类算法对数据点进行聚类.该算法在降低对尺度参数敏感性的同时又改善了对多尺度数据集的处理.通过在人工数据集以及UCI数据集仿真实验结果表明,本文提出的算法具有较优的聚类效果. 相似文献
18.
拱坝的模态识别是大坝健康监测中的重要一环,模态参数识别的准确度对大坝的性能评价有重要意义.首先利用随机子空间法识别模态参数,针对该方法需要人工辨识稳定图中真实模态的不足,引入密度聚类算法(DBSCAN)对模态结果进行去噪和拾取,并利用粒子群算法改进DBSCAN算法,实现DBSCAN超参数的自动调整,提高识别效率,为DBSCAN超参数的选择提供参考.将该方法应用于一混凝土拱坝数值模型中,并分析了不同采样数据长度对识别结果的影响和该方法的抗噪性.结果表明:合理选择采样时长,能够得到更完整的模态信息,本研究提出的方法能够有效实现模态参数的自动识别并有较高的精度和抗噪性,可以为大坝的安全分析提供参考. 相似文献
19.
关于FCMBP模糊聚类方法的修正 总被引:1,自引:0,他引:1
对于基于摄动的模糊聚类方法中参数系个数的估计作了修正,并基于修正后的结果重新设计了算法。关于该算法,通过一个实际例子,分别用FCMBP模糊聚类方法和普通的传递闭包法进行聚类,把所得的2种不同结果作了分析和比较。 相似文献
20.
约束阻尼结构的振动分析及结构参数优化研究 总被引:1,自引:0,他引:1
为了准确获取约束阻尼复合结构(CLD)的振动特性,依据模态应变能(MSE)理论,针对黏弹性材料的温变和频变特性,基于大型通用有限元软件ANSYS及MATLAB进行了联合仿真,研究了CLD矩形薄板的振动特性。通过分析环境温度和阻尼层厚度等设计参数对结构固有频率和模态损耗因子的影响,建立了CLD设计参数的多目标优化模型,利用遗传优化算法对CLD结构参数进行了优化。分析结果表明:随着温度的升高,CLD结构的固有频率下降并趋于稳定;存在最佳温度点,使得CLD结构的模态损耗因子最大;在固有频率改变较小的情况下,通过结构参数的优化能够保证CLD结构具有低成本、高模态损耗因子等特性;联合仿真方法适用于阻尼复合结构振动特性研究,在阻尼减振技术中具有一定的理论和实用意义。 相似文献