首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对数据集的聚类过程容易受到离群值的影响这一问题,提出了局部密度离群值检测k-means算法,即先对数据集使用局部密度离群值检测方法检测离群值,先把离群值去除,再进行k-means聚类,算法的有效性通过Davies-Bouldin指标(DB)、Dunn指标和Silhouette指标进行评价,在人工生成的数据集与UCI数据集上验证,去除离群值,再使用k-means算法得到的聚类结果相比原始数据集进行k-means算法聚类结果较好,并且用在疫情数据分析上,对安徽省、北京市、福建省、广东省等24个省、市、自治区2020年2月18日新型冠状病毒肺炎确诊人数进行聚类分析,得到的去除离群值在使用k-means算法相比原始数据集进行k-means算法聚类结果较好,该结果能帮助更好地在实际中怎么去做决策以及更好地降低经济损失。  相似文献   

2.
在模糊C-均值聚类(FCM)目标函数的基础上按聚类中心分离原则增加一个聚类中心分离项来扩展FCM算法,提出基于聚类中心分离的模糊聚类模型(FCM_CCS)。该模型可使聚类过程中的聚类中心之间距离扩大,从而得到更好的聚类效果。由于该模型和FCM一样对噪声敏感我们提出它的可能性聚类模型(PCM_CCS),最后进一步扩展成它的可能性模糊聚类模型(PFCM_CCS)。基于聚类中心分离的可能性模糊聚类模型在处理噪声数据和克服一致性聚类问题方面表现出良好的性能。对数据集的测试实验结果表明了提出的PFCM_CCS能同时产生模糊隶属度和典型值,使聚类中心间距扩大,同时具有更好的聚类准确率。  相似文献   

3.
模糊C-均值(FCM)聚类算法的改进   总被引:6,自引:0,他引:6  
付辉 《科学技术与工程》2007,7(13):3121-3123
针对目前模糊C-均值聚类算法不适用于有噪声和样本不均衡等问题,借助改进算法AFCM和WFCM的思想,提出另一种新的聚类算法。它是AFCM和WAFCM结合的一种算法,但有着更好的健壮性和聚类效果。  相似文献   

4.
模糊熵描述了一个模糊集的模糊性程度.本文将模糊熵应用于聚类有效性的分析.指出用于聚类有效性判决的划分系数是一个基于模糊熵的聚类有效性判决准则.最后通过几组数据对不同模糊熵公式的判决功能进行了比较实验.  相似文献   

5.
对于工业过程数据中的离群点,一般采用稳健估计技术处理.针对Fast-MCD算法中初值随机给定,以及当样本数据较大时,人为给定分堆个数的缺点,提出了一种基于模糊聚类的改进稳健估计算法,即采用聚类中心及聚类个数分别作为Fast-MCD算法的初值及分堆个数选择依据,从而提高计算效率,并使样本数据较大时的分堆计算更合理.将本方...  相似文献   

6.
神经元放电检测是对后续神经元放电波形的聚类分析、神经元放电串的统计分析等工作都非常关键的第一步。为了尽可能准确地把神经元放电从背景噪声中分离出来,该文首先应用数学形态学对原始记录数据进行预处理,然后再经过阈值处理把神经元放电检测出来。选择和放电波形在形状、持续时间和幅度上都相近的结构元素,数学形态学预处理步骤能有效地滤除原始记录中的背景噪声,突出放电信号。对神经元放电仿真数据集和实验记录的大鼠海马区神经元自发放电的检测结果显示:基于数学形态学预处理的神经元放电检测方法的准确率要高于常用的直接进行阈值处理的检测方法。  相似文献   

7.
散乱点云去噪算法的研究与实现   总被引:3,自引:0,他引:3  
提出了一种快速去除散乱点云数据表面噪声和离群点的鲁棒滤波算法.应用核密度估计聚类方法,通过Mean-Shift迭代过程将每一个采样点"漂移"到核密度估计函数的局部最大值点,该最大值点确定了点云数据的聚类中心并能准确逼近原始曲面,使点云曲面收敛为一个稳定的三维数字模型.算法中的似然估计函数充分考虑了散乱点的法矢方向,因此不仅可以去除不同幅度的噪点,还可以用简单的阈值条件很容易地检测出离群点的聚类,从而实现了点云数据的高效快速光顺去噪.  相似文献   

8.
用于不平衡数据分类的模糊支持向量机算法   总被引:1,自引:0,他引:1  
作为一种有效的机器学习技术,支持向量机已经被成功地应用于各个领域.然而当数据不平衡时,支持向量机会产生次优的分类模型;另一方面,支持向量机算法对数据集中的噪声点和野点非常敏感.为了克服以上不足,提出了一种新的用于不平衡数据分类的模糊支持向量机算法.该算法在设计样本的模糊隶属度函数时,不仅考虑训练样本到其类中心距离,而且考虑样本周围的紧密度.实验结果表明,所提模糊支持向量机算法可以有效地处理不平衡和噪声问题.  相似文献   

9.
核聚类算法及其在模式识别中的应用   总被引:1,自引:2,他引:1  
将核学习方法的思想和可能性聚类算法相结合,提出一种基于核的可能性聚类算法,使其能够对非超球体、含有噪音和孤立点的数据进行有效的聚类。将该方法用于模式识别中,仿真实验表明,基于核的可能性聚类算法比模糊C-均值算法以及可能性聚类算法具有更好的聚类效果,且算法能够很快地收敛。  相似文献   

10.
李恒宾 《科学技术与工程》2012,12(21):5149-5153,5162
提出了一种模糊聚类、粗糙集理论与神经网络集成的混合智能故障诊断方法。引入聚类有效性函数和点分布密度函数。对模糊c-均值聚类算法进行改进,形成了自适应模糊聚类算法并依据该算法将连续的故障特征值离散化。应用粗糙集理论处理离散化的故障诊断数据。采用基于信息熵的方法,约简冗余的故障特征。依据约简结果构建神经网络,采用遗传算法优化网络的权值和阈值。将该方法用于柴油机气门故障诊断,并与普通神经网络进行对比。结果表明,该方法提高了故障诊断的正确率。  相似文献   

11.
Clustering data with varying densities and complicated structures is important,while many existing clustering algorithms face difficulties for this problem. The reason is that varying densities and complicated structure make single algorithms perform badly for different parts of data. More intensive parts are assumed to have more information probably,an algorithm clustering from high density part is proposed,which begins from a tiny distance to find the highest density-connected partition and form corresponding super cores,then distance is iteratively increased by a global heuristic method to cluster parts with different densities. Mean of silhouette coefficient indicates the cluster performance. Denoising function is implemented to eliminate influence of noise and outliers. Many challenging experiments indicate that the algorithm has good performance on data with widely varying densities and extremely complex structures. It decides the optimal number of clusters automatically.Background knowledge is not needed and parameters tuning is easy. It is robust against noise and outliers.  相似文献   

12.
对于数量较大、维度较多、较为复杂的聚类对象,系统聚类较为复杂; 而模糊综合评判聚类方法聚类结果不够准确,其个数难以控制。为此,提出基于模糊综合评判的系统聚类算法,该方法对较为复杂的、由多种因素制约的事物或对象进行模糊综合评判处理,提取对象的整体特征,运用系统聚类对其进行聚类分析。最后通过对5 个班级的多次考试成绩进行了聚类分析,验证了该算法的有效性。实验结果表明,该方法具有准确性、整体性、可操作性以及简略性等。  相似文献   

13.
为了提高降雨量插值精度,充分挖掘降雨变量信息,利用模糊熵聚类分析算法,对流域内雨量站进行模糊熵聚类研究,通过基于可能性分布和距离判定的聚类有效性函数确定模糊熵系数和聚类数,从而得到模糊聚类结果,改进原有的插值方法。以淮河流域蚌埠站以上区域99个雨量站雨量数据,分别在一般情况下和模糊熵聚类情况下做交叉验证,结果显示,模糊熵聚类分析在反距离平方插值法中对降雨精度有所提升。  相似文献   

14.
一种确定最佳聚类数的新算法   总被引:1,自引:0,他引:1  
针对K-均值聚类算法需要事先确定聚类数K的问题,将粒度计算引入样本相似度函数,定义了新的样本相似度,用模糊等价聚类确定数据集可能的最大类簇数Kmax.以Kmax为搜索上界,利用改进全局K-均值聚类算法,以BWP(Between-Within Proportion)为聚类有效性度量指标,提出确定最佳聚类数的一种新方法.通过UCI机器学习数据库数据集以及随机生成的人工模拟数据集实验测试,证明该算法不仅能有效确定数据集的最佳聚类数,而且适用于大规模数据集,但是会受到噪音点影响.  相似文献   

15.
This paper adopts data mining(DM) technique and fuzzy system theory for robust time series forecasting.By introducing DM technique,the fuzzy rule extraction algorithm is improved to be more robust with the noises and outliers in time series.Then,the constructed fuzzy inference system(FIS) is optimized with a partition refining strategy to balance the system's accuracy and complexity.The proposed algorithm is compared with the WangMendel(WM) method,a benchmark method for building FIS,in comprehensive analysis of robustness.In the classical Mackey-Glass time series forecasting,the simulation results prove that the proposed method is able to predict time series with random perturbation more accurately.For the practical application,the proposed FIS is applied to predicting the time series of ship maneuvering motion.To obtain actual time series data records,the ship maneuvering motion trial is conducted in the Yukun ship of Dalian Maritime University in China.The time series forecasting results show that the FIS constructed with DM concepts can forecast ship maneuvering motion robustly and effectively.  相似文献   

16.
混沌粒子群优化模糊聚类的旋转机械故障诊断   总被引:1,自引:1,他引:0  
提出基于混沌粒子群优化加权模糊聚类的旋转机械故障诊断算法。该算法用混沌粒子群算法取代传统的梯度下降法,优化加权模糊C-均值算法的各个参数,并依据聚类有效性指标确定最优聚类数及聚类中心。应用表明,混沌粒子群算法有效提高了模糊聚类分析的收敛速度和精度,提高了旋转机械故障诊断的准确率。  相似文献   

17.
为了解决采用最小方差型的误差成本函数进行输入含噪系统参数学习时的随机模糊神经网络(SFNN)参数不能收敛至真值的问题,将包含噪声方差的误差成本函数推广到多入单出系统,并根据鲁棒统计学理论和目标函数在参数学习中的导向作用,对目标函数进行修正,使之对于不服从统计分布的粗大误差也能有效处理.在此基础上提出了SFNN的鲁棒参数学习算法,并且输入输出数据中的噪声方差也通过学习而得到,从而避免了需要多次测量的要求.结果表明,SFNN的鲁棒参数学习算法能抑制粗大误差和系统噪声.最后,通过仿真对比验证表明了该方法的有效性.  相似文献   

18.
为了解决以欧氏距离作为相似性准则的传统模糊聚类算法对多维数据处理不利的问题,采用马氏距离代替欧氏距离,对基于马氏距离的模糊聚类算法进行优化研究,以增强基于马氏距离的模糊聚类算法的聚类效果和能力。通过构造启发式搜索与k-means算法结合的初始优化方法,利用可以自动调节最佳聚类数的有效性函数,提出了一种优化算法KM-FCM,并将此新算法与FCM,FCM-M,M-FCM聚类算法在3个标准数据集上进行了实验。结果表明,KM-FCM算法有效,聚类精度比FCM,FCM-M,M-FCM高,对高维数据聚类识别能力强,具有全局优化作用,并且聚类个数无需提前设定。新算法可为基于马氏距离的模糊聚类算法的优化提供参考。  相似文献   

19.
罗琪 《科技信息》2011,(33):15-16
本文研究了模糊聚类方法,针对模糊C-均值(Fuzzy C-means Method,FCM)算法的不足,提出新的初始化算法方法,将其应于模糊聚类数目的初始化,结合近似K中心对FCM算法进行改进。实验表明,改进后的FCM算法要有效避免了聚类结果的局部最优,有较好的抗噪能力,从而提高模糊聚类性能和可靠性。  相似文献   

20.
鲁棒的模糊C均值和点云双边滤波去噪   总被引:1,自引:0,他引:1  
提出了一种将模糊C均值(FCM)聚类算法与双边滤波方法结合进行三维点云数据的去噪算法.该算法首先用模糊C均值聚类算法对大尺度噪声进行去除,并对小尺度噪声进行一定程度的光顺;然后用点云双边滤波器对小尺度噪声进行光顺.该算法将噪声分成大尺度和小尺度分步处理,不需迭代计算,提高了计算效率,也避免了光顺过程中产生过光顺问题.实验结果表明,本文方法可以在较好地保留尖锐特征的同时,有效地去除噪声.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号