首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 281 毫秒
1.
密度峰值聚类算法(DPC)具有准确率高、自动检测类别个数、识别中心点数目等优良性质.由于DPC算法用欧氏距离度量样本点之间的邻近关系,导致无法有效地提取高维复杂数据中的流形结构信息.针对密度峰值聚类算法的这个瑕疵,考虑到数据点之间的几何特性和流形结构,以测地距离替代欧氏距离,设计了一种改进的密度峰值聚类算法.数值模拟结果显示,改进的密度峰值聚类算法能够有效地处理具有流形分布特征的数据聚类问题.  相似文献   

2.
谱聚类是一种基于图谱划分理论的聚类算法,本质上是将聚类问题转化为图的最优划分问题;量子聚类可以充分挖掘数据样本的内在信息,是一种基于划分的无监督聚类算法.为了充分发挥谱聚类算法和量子聚类算法的优势,本文提出了一种基于流形距离核的谱聚类和量子聚类融合算法(MFD-NJW-QC).首先,计算数据集的流形距离核矩阵,构造相应的拉普拉斯矩阵;其次,根据拉普拉斯矩阵的若干最大特征值对应的特征向量构造新数据集,并使用量子聚类算法对新构造的数据集进行聚类,从而得到原始数据的类标签;最后,基于7个人工数据集和5个UCI数据集验证MFD-NJW-QC算法的聚类性能.结果显示,MFD-NJW-QC算法能够明显提高聚类性能,尤其对于具有流形结构,且类簇大小不平衡、密度分布不均匀的数据集优势更为突出.  相似文献   

3.
经典的密度峰聚类不再适用于复杂的流形聚类,因此提出了快速特征映射优化的流形密度峰聚类,用快速特征映射优化的流形距离取代欧式距离,可以更好地反映不同类的点间相似性.算法首先通过寻找特征点,构造无向特征图,再通过无向特征图计算任意两个点之间的流形距离,最后按照流形距离的大小完成分配.在人工数据集和UCI数据集上的实验表明,新算法具有更高的准确率.  相似文献   

4.
为了解决密度峰值聚类算法选择密度峰值点困难以及误分配的问题,基于流形的连通性,提出了一种改进的密度峰值聚类算法。通过使用三支密度峰值聚类算法,得到初始聚类结果与簇的边界点,根据这些边界点之间的连通性判断初始聚类之间的连接情况,并利用这些信息进行聚类结果融合。重复上述过程,每次迭代中在剩余数据里寻找密度峰值候选点,并将其纳入聚类过程,得到一种对流形数据友好的聚类算法。结果表明,所提算法在人工数据集和真实数据集上均有较好的表现,聚类准确度相较现有算法更高。基于连通性的三支密度峰值聚类算法可以在不计算路径距离的前提下,有效识别流形数据,大大降低了计算成本。  相似文献   

5.
一种基于流形距离的迭代优化聚类算法   总被引:4,自引:1,他引:3  
针对传统欧氏距离测度描述复杂结构的数据分布会失效的问题,引入能有效反映样本集固有的全局一致性信息的流形距离作为样本间相似度度量测度,并设计了反映类内相似度大、类间相似度小的聚类目标的准则函数,把数据聚类转化成准则函数优化问题,提出了一种迭代优化的聚类算法.通过4个人工数据集的仿真试验结果表明,新方法的参数很少且实现简单,由于实现过程中没有引入随机操作,因此结果比较确定.与标准k均值算法相比,新方法能够自动确定聚类数目,对于样本空间分布复杂的聚类问题具有良好的分类效果.  相似文献   

6.
针对距离计算对模糊C.均值聚类(Fuzzy C-Means,FCM)中心比较敏感的问题,文中提出了一种改进的模糊C.均值聚类算法(Minkowski Fuzzy C-Means,MFCM).MFCM算法采用距离指数可自动寻优的闵可夫斯基距离代替欧氏距离来计算样本集的相似度,以提高数据集的聚类准确率,减小平方误差总和.实验结果表明,Glass数据集、Balance-scale数据集和Vehicle数据集的聚类准确率分别由原来的42.52%、55.84%和45.86%提升到51.87%、62.56%和45.98%.此外,文章在开源数据挖掘Weka平台上实现了FCM和MFCM算法,弥补了Weka平台上集成少量聚类算法的不足.  相似文献   

7.
为构建行驶工况,消除K-均值算法对初始聚类中心的敏感性及噪声点的干扰,提出一种改进主成分分析和基于密度的改进K-均值聚类组合方法.结合距离优化法和密度法,构建一种数据集密度度量方法.选取距离较大、密度较高的数据点作为初始聚类中心与候选集,优化聚类结果的同时剔除了孤立点,采用较大贡献因子的特征值进行工况合成,最后对行驶工况油耗进行分析.结果表明,所提方法构建行驶工况的速度-加速度联合分布差异值为1.17%,特征参数平均相对误差较小.可见,合成的行驶工况能够很好地反映某地实际交通道路特征,拟合度较高.  相似文献   

8.
一种基于距离的聚类和孤立点检测算法   总被引:2,自引:0,他引:2  
提出了一种基于距离的聚类和孤立点检测算法(DBCOD),根据距离阈值对数据点进行聚类,在聚类过程中记录每个数据点的密度,并根据密度阈值确定数据点是否为孤立点.实验结果表明,该算法不仅能够对数据集进行正确的聚类,可以发现任意形状的聚类,算法执行效率优于DBSCAN,具有对噪音数据、数据输入顺序不敏感等优点,同时还能有效地进行孤立点检测.  相似文献   

9.
密度峰值算法依赖于欧式距离实现局部密度的选择,该算法在处理高维数据、存在密度不均匀的类簇的数据集上效果不是很理想.针对以上问题,提出一种融合流形距离与标签传播的改进密度峰值聚类算法(improved density peak clustering combining manifold distance and labe...  相似文献   

10.
密度峰值聚类(Clustering by Fast Search and Find of Density Peaks,DPC)算法是一种新型的基于密度的聚类算法,通过选取自身密度高且距离其他更高密度点较远的样本点作为聚类中心,再根据样本间的局部密度和距离进行聚类。一方面,虽然DPC算法参数唯一、简单、高效,但是其截断距离的取值是按经验策略设定,而截断距离值选取不当会导致局部密度和距离计算错误;另一方面,聚类中心的选取采用人机交互模式,对聚类结果的主观影响较大。针对DPC算法的这些缺陷,目前的改进方向主要有3个:改进截断距离的取值方式、改进局部密度和距离的计算方式以及改进聚类中心的选取方式。通过这3个方向的改进,使得DPC过程自适应。本文对DPC算法的自适应密度峰值聚类算法的研究现状进行比较分析,对进一步的工作进行展望并给出今后的研究方向:将DPC算法与智能算法有机结合实现算法自适应,对于算法处理高维数据集的性能也需要进一步探索。  相似文献   

11.
结合图论理论和局域波理论,提出了一种基于模糊图的往复式压缩机故障诊断方法.首先将往复式压缩机故障信号进行局域波时频处理,根据系统的故障状态-特征表,找出最大故障信息量特征群.基于图论理论建立最大故障信息量模糊图,通过对模糊图的分析,找出可以进行匹配的路径信息量最大的部件.该方法应用于某往复式压缩机故障诊断中,具有一定的工程实用性.  相似文献   

12.
往复压缩机的故障诊断技术能够为工业生产提供有效保障,针对传统方法诊断准确率不高的问题,提出了一种基于振动信号时频图像灰度共生矩阵-方向梯度直方图(GLCM-HOG)特征融合的往复压缩机故障诊断方法.首先,采用小波变换的方法处理往复压缩机的振动信号,生成时频图像;其次,利用灰度共生矩阵(GLCM)和方向梯度直方图(HOG)的方法提取时频图像特征,融合构建GLCM-HOG特征;最后,将融合特征输入支持向量机(SVM)进行分类,以判别往复压缩机的运行状态.实验结果表明,所提方法对设备的状态识别准确率可以达到92.33%,能够实现往复压缩机的准确诊断.  相似文献   

13.
为了解决以欧氏距离作为相似性准则的传统模糊聚类算法对多维数据处理不利的问题,采用马氏距离代替欧氏距离,对基于马氏距离的模糊聚类算法进行优化研究,以增强基于马氏距离的模糊聚类算法的聚类效果和能力。通过构造启发式搜索与k-means算法结合的初始优化方法,利用可以自动调节最佳聚类数的有效性函数,提出了一种优化算法KM-FCM,并将此新算法与FCM,FCM-M,M-FCM聚类算法在3个标准数据集上进行了实验。结果表明,KM-FCM算法有效,聚类精度比FCM,FCM-M,M-FCM高,对高维数据聚类识别能力强,具有全局优化作用,并且聚类个数无需提前设定。新算法可为基于马氏距离的模糊聚类算法的优化提供参考。  相似文献   

14.
The relationship between second-order cyclostationary method and time-frequency distribution is studied,and cyclic autocorrelation(CA) function is indicated to be one sort of special time-frequency distribution method.Furthermore,a fault diagnosis method for reciprocating compressors based on empirical mode decomposition (EMD) and CA function is proposed,and then it is applied to the fault diagnosis of reciprocating compressor valve.Firstly,the vibration signal of reciprocating compressor valve is decomposed by using EMD method,and several intrinsic mode functions (IMFs) are obtained.Secondly,the IMFs are evaluated by some denoising criterions to remove the noise and interfering ones.Finally,the CA functions of the remained IMFs are calculated,which will be used to reconstruct the CA function of the original vibration signal.Engineering application indicates that this method can sufficiently inhibit the cross-interference items of CA function.Therefore,more explicit working conditions of reciprocating compressor components can be achieved.  相似文献   

15.
一种基于网格的层次聚类算法   总被引:1,自引:0,他引:1  
传统的凝聚层次聚类算法的时间复杂度为O(n3),由于时间复杂度太高而无法应用到大的数据集.针对这一问题,提出了一种新的基于网格的层次聚类算法,先用基于网格的方法进行一次微聚类,然后再用凝聚的层次聚类算法进行聚类.在进行凝聚的层次聚类时,提出了一种新的簇间距离度量方法,该方法采用簇中权值最高的代表点的最小距离作为簇间的距离.理论分析和实验结果表明,基于网格的层次聚类算法比传统的凝聚层次算法具有更高的效率和正确性.  相似文献   

16.
为了在多维聚类分析中运用有效距离度量方法表征数据对象的邻近度,提出一种协方差测距(covariance distance measure analysis,CDM)算法,首先,采用模糊C均值(fuzzy c-means,FCM)方法对数据对象赋予权值,得到每个样本点相对类别特征的隶属度,再依据隶属度计算每个样本的差异度;其次,为了使类别分离最大化,用样本点同关联类别的协方差距离度量代替模糊聚类中欧式距离度量作为优化问题的第一个标准,使相似数据对象更为接近;最后,用样本点间的协方差距离度量作为第二个优化标准,使相异数据相互隔开,交替固定变量迭代计算最优解,使聚类指标和距离度量学习参数同时得到优化,获得更好的聚类结果。在不同数据集上的实验结果表明,与FCM-Sig和UNCA算法相比,CDM算法在聚类准确性和算法收敛性方面均有更好表现。  相似文献   

17.
定义了一种新的基于马氏距离的半监督模糊聚类算法,并推导出它的迭代公式.该算法能够提高聚类算法的运行效率.在人工数据集和真实数据集上的实验结果验证了这种方法的有效性.提取了黄瓜叶片7个色调特征,Fisher降维之后进行半监督聚类分析.对于已标识类别属性的叶片,聚类结果与已知属性的一致率达100%,而对于未标识数据,一致率也达到96%以上.  相似文献   

18.
 源数目估计是阵列信号处理中的一个重要课题,也是声纳探测领域的一个难题。通过研究特征子空间分析方法,提出了一种新的源数目估计算法。该方法在盲源分离结果的基础上,基于信号子空间和噪声子空间正交的原理,建立了子空间代价函数来估计观测空间的源数目。同时,通过仿真和水池实验,对该方法的性能做了研究,并与基于信息论准则中最小长度描述准则的源数目估计算法进行了比较。仿真和水池实验结果表明,该源数目估计算法能得到准确的源数目,并具有较好的抗噪性,在水声环境中具有更好的稳健性。  相似文献   

19.
As the core part of reciprocating compressor,piston rod is easy to cause a serious accident when abrasion and breakage fault occur to it. Therefore,it is very important to monitor its running state. At present,a small number of reciprocating compressors have been installed on-line monitoring and diagnosis system,most of which can only monitor a single vertical subsidence of piston rod and it can't fully represent the running state of piston rod. Therefore,a method of monitoring the vertical and horizontal displacement of piston rod axis orbit is simultaneously used. In view of the characteristics that the piston rod axis orbit is disordered and difficult to extract features,purification of the axis orbit is carried out based on harmonic wavelet and then features are extracted such as vibration energy,natural frequency and the axis orbit envelope area. After that,a nonlinear local tangent space manifold learning algorithm is used to reduce the dimension of the features and obtain sensitive features. By analyzing the practical cases,the effectiveness of the method for fault monitoring and diagnosis of reciprocating compressor piston rod assembly has been verified. Finally,as BP neural network has the characteristics of solving complex nonlinear problems,the validity of the fault diagnosis method of reciprocating compressor piston rod based on harmonic wavelet and manifold learning is proved by actual case data analysis based on BP neural network.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号