首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
针对模糊C均值聚类(FCM)算法聚类原型最适合于球状类型簇的特点,提出了基于类间分离度和类内紧缩度加权的冗余聚类中心的FCM算法,即先将大簇或者延伸形状的簇(非凸)采用加权FCM算法分割成多个小类(冗余类),从而规避FCM算法对初始聚类中心敏感的弱点.由于隶属度划分矩阵的元素是每个样本隶属于各冗余类的隶属度值,因此将其作为各冗余类的类特征,通过对应分析得到冗余类的新特征,再次采用加权FCM算法进行冗余类合并,最后达到分类效果.以代表曲线分割和曲面分割分类问题的3个典型数据集为算例,结果表明该方法能够识别不规则的簇,解决了FCM算法对初始聚类中心敏感的缺陷.  相似文献   

2.
本文针对传统FCM(模糊C均值)聚类算法对初始中心值非常敏感,并且对数据集属性要求过高的缺陷,提出了采用信息熵的方法对聚类中心进行初始化,以此来降低算法对初始聚类中心的依赖.同时为了使算法能够对任意形状的簇进行聚类,本文引用了类合并的思想,将任意形状的簇分割成小类,再通过一定的规则将小类对进行合并.实验结果证实了在FCM基础上改进的模糊聚类新算法能够识别任意形状的簇,并大大降低了FCM算法对初始聚类中心的依赖.  相似文献   

3.
针对传统社区识别算法中需要根据先验知识设定参数、 社区划分结果具有随机性及复杂度过高的问题, 提出一种基于拓扑势的局部化重叠社区识别算法. 该算法通过引入拓扑势计算节点的影响力, 利用节点间的局部相似性度量指标, 采用标签传播策略进行重叠结构的社区识别. 在真实网络及人工合成网络上与多种经典算法进行对比实验验证了算法的高效性.  相似文献   

4.
针对局部线性嵌入算法使用欧氏距离计算非对齐样本相似性时, 受数据位置差影响较大, 导致度量精度较低, 影响算法特征提取精度的问题, 提出一种基于信息熵度量的局部线性嵌入算法. 首先利用信息熵统计样本特征间的混乱程度, 提高划分局部邻域的准确性; 然后建立局部重构模型, 挖掘出流形的本质结构; 最后利用局部结构构建低维重构模型, 以获得样本的显著特征. 通过在轴承数据集上的实验证明了该算法在特征提取方面的有效性.  相似文献   

5.
提出一种新的紧密度公式和一种影响簇发现模型,并在此基础上设计基于局部社团探测的采样算法MCMCS_LCD,以及基于MCMCS_LCD的社交圈子自动识别算法SCD_MCMCS_LCD,算法综合考虑局部模块度和节点间紧密度.在真实数据集上的实验表明,SCD_MCMCS_LCD算法在具有较快收敛速度的同时还具有较好的社交圈子识别效果.  相似文献   

6.
针对实际化工过程数据具有高维、非线性等特征而难以进行聚类分析的问题,提出一种基于扩散映射的IWO-FCM算法.该算法先利用扩散映射提取高维数据的低维流形特征,整合数据的局部特征使原始数据的几何信息得以保留,然后用IWO-FCM算法对低维流形数据进行聚类分析.试验通过对TE过程多个故障数据集进行测试,与获取数据低维特征后使用FCM算法相比,结果表明,IWO-FCM算法具有较强的稳定性和鲁棒性,比FCM算法具有更强的寻优能力和更好的收敛效果,聚类效果明显改善,能够快速有效地识别故障特征,验证了其有效性和优越性.  相似文献   

7.
为了降低谱聚类采用高斯函数作为相似性度量方式对参数的敏感性,以及能够发现多密度簇的同时降低噪声点的干扰,提出了一种将基于均衡接近度的灰关联分析结合到谱聚类中的新方法,采用加权的自适应相似性度量方式。最后用改进的FCM算法对其进行聚类。在真实数据集和人工数据集上分别对提出的算法和现有算法进行了比较分析。研究结果表明,提出的新算法能够消除参数的影响,具有更高的聚类精度。聚类精度采用F测度指标。  相似文献   

8.
基于SNN相似性和密度的聚类算法是当前主要的无监督聚类方法之一,该类算法在发现不同大小形状簇的聚类过程中都取得了较好的结果。但是该类算法也存在局限性,如Jarvis-Pat-rick算法通过单连结的方式发现簇,可能分割真正的簇或者合并应该保持分离的簇,而SNN密度类算法的Eps,MinPts参数的确定对用户来说是比较困难的。针对该类问题,本文对聚类过程中的局部集聚特征进行了分析和定义,提出了利用数据的局部集聚特征来控制聚类过程的的聚类算法。通过验证,该算法对发现不同密度以及任意形状的数据集合的聚类分析问题是有效的,突出了数据分析的局部集聚特征,改进了数据聚类的质量。  相似文献   

9.
微钙化簇是乳腺癌一个重要的早期发现,现有的检测技术为了达到高敏感性要求,产生很多假阳性数据.根据微钙化簇特点,提出一种整体和局部相组合的分类识别策略,并根据真假阳性样本错分代价的不同,使用代价敏感SVM方法进行分类学习.在构造分类器模型过程中利用粒子群进行分类器的参数优化及特征集合的选择,以提升分类学习的泛化能力.该算法在保证高敏感性的同时,降低了过多的假阳性数据,并删除了冗余和不相关的特征.实验结果表明,基于粒子群优化的代价敏感SVM组合分类算法提高了传统方法的识别能力.  相似文献   

10.
随着计算视觉技术的发展,面向视频的人脸识别在现实生活中应用愈加广泛,作用愈加重要,对识别的准确性要求也越高.面对视频这样的高维度数据,如何进一步提高人脸识别的准确性是该领域的一个研究热点.本文提出一种面向视频数据的改进的局部线性嵌入算法,通过构造样本间的协方差矩阵,将马哈拉诺比斯距离和像素距离相结合,提出了一种新的样本间的相似性度量方法,该方法充分利用了视频帧间信息的关联性.并在VidTIMIT数据集上进行识别效果的测试,同时与其它几类识别方法的实验结果进行对比.实验结果表明,本文提出的算法的识别率要高于已有的局部线性嵌入算法和其它方法.  相似文献   

11.
为了使基于模糊C均值(FCM)聚类的图像分割算法对复杂图像更具适用性,将图像结构特征融合到增强型FCM算法.首先,对原始图像进行均值滤波,将滤波结果与原始图像进行线性叠加形成新的输入图像.其次,采用二维Gabor滤波函数提取新的输入图像的纹理结构特征,以此代替灰度特征来衡量节点间的相似性.最后,采用一种改进的节点间距离度量公式来计算图像中节点与聚类中心点的差异.仿真结果表明,对结构复杂的图像所提算法获得了更加精确的分割结果.  相似文献   

12.
基于样本密度的FCM改进算法   总被引:6,自引:0,他引:6  
从聚类中心的直观属性出发,选取样本中密度较大的点作为FCM算法的初始聚类中心。解决了FCM算法对初始值敏感、收敛结果容易陷入局部极小等问题。实验结果证明这一算法的合理性和有效性。  相似文献   

13.
针对现有质心求解算法仍具有较高计算复杂度,导致区间二型模糊 C 均值聚类算法(Interval Type-2 Fuzzy C-Means, IT2FCM)运行速度不理想问题,提出了半数迭代法和一次迭代法两种近似质心求解算法。 首先,在直接 求解转换点问题质心求解算法 ( A Direct Approach for Determining the Switch Points in the Karnik – Mendel Algorithm, DA)的基础上,借助二分查找思想,构造出基于二分查找的质心求解算法;接着,以该算法为基础,通过 限制查找范围,考虑两个转换点之间关系的性质和计算差值的技巧得到半数迭代法;最后,考虑只进行一次查找得 到一次迭代法。 在 UCI 上的 5 个数据集上(IRIS、SEEDS、WINE、WIFI_LOCALIZATION 和 HTRU2)验证了两种算法 的聚类性能并没有因为求解的是近似质心而降低;进一步在 ANURAN CALLS 数据集上构造了 8 组数据量递增数 据用于验证基于不同质心求解算法的 IT2FCM 和基于提出的近似质心求解算法的 IT2FCM 运行速度,实验结果表 明:基于近似质心求解算法的 IT2FCM 运行速度较快,所以提出的近似质心求解算法能够在一定程度上缓解 IT2FCM 复杂度过高的问题。  相似文献   

14.
针对密度峰值聚类(DPC)算法存在的dc值难选择及近邻原则聚合操作在低密度区效果不佳的问题, 提出一种基于人工蜂群与CDbw聚类指标优化的密度峰值聚类(BeeDPC)算法, 以实现类簇间数据点的自动识别和合理聚类, 并解决DPC对类簇间数据点类别识别上存在的缺陷. 实验结果表明, BeeDPC算法具有自动识别并合理聚类类簇间数据点、 自动识别类簇中心点和类簇数量及自动处理任意分布数据集的优势.  相似文献   

15.
FCM聚类算法具有线性的时间复杂度,但它对初始化非常敏感。而k-中心点轮换法对初始化不太敏感,但其缺点就是时间复杂度较高,不能直接应用到海量数据集的聚类分析中。为克服这两类聚类算法的缺点,而充分利用它们的优点,很自然地提出一种基于近似类抽样的组合聚类算法。这种组合聚类算法的时间复杂度是O(n2m)。仿真实验表明,它具有稳定的聚类结果。  相似文献   

16.
提出了一种基于模糊C均值算法和生物地理学优化算法的混合聚类算法(BBO-FCM).该算法结合了生物地理学优化算法的全局搜索和FCM算法快速局部搜索的特点,利用生物地理中的迁移算子来进行各解之间的信息共享,从而有效地克服了FCM对初始值敏感、易陷入局部最优等问题.将BBO-FCM算法用于图像分割,实验表明,新算法的聚类效果评价指数更好,聚类效果明显优于原始的FCM算法.  相似文献   

17.
针对传统的基于密度的局部离群点检测算法对原始数据集没有进行预处理导致该算法在面对未知数据集时检测效果不理想,又由于其需要计算每一个数据点的离群因子,在数据量过多时,计算量大大增加的问题,通过对局部离群点检测算法的分析,提出了一种基于目标函数的局部离群点检测方法FOLOF(FCM objective function-based LOF).首先,使用肘部法则确定数据集的最佳聚类个数;然后,通过FCM的目标函数对数据集进行剪枝,得到离群点候选集;最后,利用加权局部离群因子检测算法计算候选集中每个点的离群程度.利用该方法在人工数据集和UCI数据集上进行了相关实验,并与其他相关方法进行了对比,结果显示,该算法能够提高离群点检测精度,减少计算量,有效提高离群点检测性能.  相似文献   

18.
密度峰值算法依赖于欧式距离实现局部密度的选择,该算法在处理高维数据、存在密度不均匀的类簇的数据集上效果不是很理想。针对以上问题,提出一种融合流形距离与标签传播的改进密度峰值聚类算法(Improved Density Peak Clustering Combining Manifold Distance and Label Propagation,简称DPC-ML)。DPC-ML使用流形距离进行距离度量并形成流形距离矩阵,同时定义了一种局部密度,将流形距离与局部密度融合,让局部密度反映出一定的局部距离信息。实验数据表明该算法在处理不同形状,密度不均匀的类簇上有着良好的性能。而且通过绘制决策图发现在不同的人工数据集上的实验显示DPC-ML算法重新定义的局部密度对于类簇中心点的选择区分度更高。由于引入了新的参数邻近点数,故也探究了邻近点数对聚类结果的影响,发现在聚类指标在刚成为连通图时效果最好,进一步证明了流形距离可以对聚类结果性能有所提高。  相似文献   

19.
Although k-nearest neighbors (KNN) is a popular fingerprint match algorithm for its simplicity and accuracy,because it is sensitive to the circumstances,a fuzzy c-means (FCM) clustering algorithm is applied to improve it.Thus,a KNN-based two-step FCM weighted (KTFW) algorithm for indoor positioning in wireless local area networks (WLAN) is presented in this paper.In KTFW algorithm,k reference points (RPs) chosen by KNN are clustered through FCM based on received signal strength (RSS) and location coordinates.The right clusters are chosen according to rules,so three sets of RPs are formed including the set of k RPs chosen by KNN and are given different weights.RPs supposed to have better contribution to positioning accuracy are given larger weights to improve the positioning accuracy.Simulation results indicate that KTFW generally outperforms KNN and its complexity is greatly reduced through providing initial clustering centers for FCM.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号