首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 156 毫秒
1.
为了解决以欧氏距离作为相似性准则的传统模糊聚类算法对多维数据处理不利的问题,采用马氏距离代替欧氏距离,对基于马氏距离的模糊聚类算法进行优化研究,以增强基于马氏距离的模糊聚类算法的聚类效果和能力。通过构造启发式搜索与k-means算法结合的初始优化方法,利用可以自动调节最佳聚类数的有效性函数,提出了一种优化算法KM-FCM,并将此新算法与FCM,FCM-M,M-FCM聚类算法在3个标准数据集上进行了实验。结果表明,KM-FCM算法有效,聚类精度比FCM,FCM-M,M-FCM高,对高维数据聚类识别能力强,具有全局优化作用,并且聚类个数无需提前设定。新算法可为基于马氏距离的模糊聚类算法的优化提供参考。  相似文献   

2.
聚类是数据挖掘中重要的功能算法,其主要的功能是发现数据中潜在的知识.目前文献发表的聚类算法多数仅限于处理单一数值型数据或者分类型数据,其主要原因是含有多种类型的混合型数据间的相似性很难度量.本文提出了一种混合数据相似性度量方法:对于分类型属性,利用互信息构建贝叶斯信念网络,利用贝叶斯信念网络构建关系层次,继而为层次附上距离,形成关系层次距离,而对于数值型属性则利用标准化的曼哈顿距离来度量其相似性,最后结合分类型属性与数值型属性来对整个数据集进行相似性的度量.在此基础上,设计实现了用于混合型数据聚类算法CRHD,并通过UCI中的多个数据集和已有算法进行仿真实验对比,证明了CRHD算法的有效性.  相似文献   

3.
针对基因间共调控关系的特点和现有共调控基因聚类分析方法的不足,提出一种基于广义信息论中二次互信息的广义相似性度量标准QMISM,并利用免疫遗传算法将高维样本映射到二维空间,进而实现动态模糊聚类和聚类结果可视化.对人工合成数据和真实的基因表达数据的实验结果表明,该算法能得到更好的聚类结果.  相似文献   

4.
对传统的模糊c-均值聚类算法进行改进,提出一种基于改进FCM聚类的交通信号控制时段划分方法.首先,引入模糊聚类隶属度基数,对聚类数目自动选取;然后,运用模拟退火遗传混合算法对初始聚类中心进行优化.最后,根据交叉口实际流量数据,进行时段划分,利用仿真软件进行方案效果评价.结果表明,与传统FCM算法相比,文中方法能有效实现控制时段划分,更加符合实际交通特性,且能得到全局最优解.与原有控制方案相比,FCM方案和文中方案都能有效降低车辆平均延误,文中方案效果更明显.  相似文献   

5.
模糊C-means聚类(fuzzy C-means,FCM)未考虑噪音和野值点对聚类的影响,故FCM是欠鲁棒的.为了增强鲁棒性,将FCM中的光滑距离度量改变为非光滑距离度量.由此提出了1种鲁棒的模糊聚类方法(robust FCM,RFCM).为了求解RFCM对应的非光滑优化问题,采用了(majorization-minimization,MM)框架.通过在多个数据集上的实验,将RFCM与传统FCM算法进行对比,表明RFCM比FCM具有更好的聚类效果.  相似文献   

6.
模糊C均值聚类算法(FCM)是一种比较有代表性的模糊聚类算法,主要是通过迭代更新聚类中心和隶属度矩阵,使目标函数值达到最小.FCM算法还有很多缺陷和不足,其中最主要的就是选取不同的初始中心,会得到不同的聚类结果,影响到聚类的稳定性和准确率.本文对要聚类的数据集采用数据分区技术进行预处理,根据物质质心的定义及质心运动原理...  相似文献   

7.
聚类分析是数据分析的一个重要方法.通过引用核函数,将核方法应用到模糊C均值(Fuzzy c-Means,FCM)算法中,优化FCM算法的目标函数,使样本点被非线性变换映射到高维特征空间进行聚类,不仅改善了聚类效果,而且增强了算法对噪声的鲁棒性.在真实样本集上进行了仿真实验,分类结果证实了该算法的有效性和普适性,因而是一种较为简单和实用的图像分类方法.  相似文献   

8.
【目的】在没有先验知识的前提下,采用基于粒子群优化算法(PSO)的加权模糊C-均值(WFCM)聚类算法,从30多万条记录的医疗保险数据中挖掘出疑似医疗保险欺诈的记录。【方法】首先,引用改进的欧式距离、相似性函数以及交叉熵函数并通过PSO算法极小化交叉熵函数,对属性权重进行分析;其次,选取Calinski-Harabasz(CH)有效性指标,展开聚类有效性的研究;然后,基于数据预处理的结果将数据运用于PSO算法,不断更新得到各属性的权重,并运用聚类有效性评价中的CH有效性指标来动态估计最佳聚类个数,提高FCM聚类的速度;最后,将属性权重和最佳聚类数应用于FCM聚类算法,根据隶属度矩阵聚类得到疑似医疗保险欺诈结果。【结果】基于上述研究方法,本研究根据最后的隶属度矩阵来进行聚类分析。【结论】将优化的权重应用于加权FCM聚类算法与聚类有效性评价,既提高了聚类算法的高效性,又避免了主观评价对分类的影响。  相似文献   

9.
离群点检测在是数据挖掘的重要领域,广泛应用在信用卡欺诈检测、网络入侵检测等重要方面,文中在结合层次聚类和相似性,给出高维数据的相似度量函数与类密度的概念,并基于类密度重新定义高维数据的离群点,从而提出一种基于相似度量的离群点检测算法;实验表明:算法对高维数据中的离群点检测有一定的价值。  相似文献   

10.
针对传统模糊C均值聚类算法对图像特征描述单一,易受图像复杂纹理干扰而出现误分割的问题,提出一种基于自适应结构张量的FCM算法,并将其应用于图像分割.打破传统高斯滤波器在滤波方向和角度上所受限制,采用基于各向异性滤波的结构张量;引入图像边缘密度函数,用以衡量图像节点的平滑性,自适应地计算各向异性滤波函数所占比例;定义一种自适应结构张量相似性度量标准,用以计算图像中节点与聚类中心点的结构相似性,有效地代替了传统FCM中的灰度相似性度量标准;采用一种新颖的节点间距离度量公式来计算图像中节点与聚类中心点的差异.仿真结果表明,对结构复杂的图像,改进算法获得了更加精确的分割结果.  相似文献   

11.
基于全局空间相似性的模糊聚类算法   总被引:1,自引:0,他引:1  
用传统模糊C均值聚类算法分割图像时,类内数据空间分布离散.针对这一问题,提出一种基于全局空间相似性模糊聚类算法.算法建立全局空间相似性度量标准和全局灰度相似性度量标准,分别计算图像中任意一点与聚类中心点的空间相似性和灰度相似性;通过调整参数来控制两种特征在节点间差异计算中所占的比重,增强了分割结果中类内数据样本空间分布...  相似文献   

12.
模糊C均值算法(FCM)是图像分割最常用的算法之一,这种方法需要提前确定初始聚类中心和聚类数.为此,提出了一种新的自适应模糊聚类算法(AFCM),AFCM算法中构造的观察矩阵、判断矩阵和集合划分可以自动确定合适的聚类数.为了得到更好的图像分割效果,采用核距离作为相似性度量,提出了一种鲁棒性自适应模糊C均值算法(RAFCM).实验结果表明,与FCM算法相比,AFCM和RAFCM算法不仅能自动地确定聚类数目,还可以得到更好的图像分割质量.  相似文献   

13.
Traditional clustering method is easy to slow convergence speed because of high data dimension and setting random initial clustering center. To improve these problems, a novel method combining subtractive clustering with fuzzy C-means (FCM) clustering will be advanced. In the method, the initial cluster number and cluster center can be obtained using subtractive clustering. On this basis, clustering result will be further optimized with FCM. In addition, the data dimension will be reduced through the analytic hierarchy process (AHP) before clustering calculating. In order to verify the effectiveness of fusion algorithm, an example about enterprise credit evaluation will be carried out. The results show that the fusion clustering algorithm is suitable for classifying high-dimension data, and the algorithm also does well in running up processing speed and improving visibility of result. So the method is suitable to promote the use.  相似文献   

14.
为了使基于模糊C均值(FCM)聚类的图像分割算法对复杂图像更具适用性,将图像结构特征融合到增强型FCM算法.首先,对原始图像进行均值滤波,将滤波结果与原始图像进行线性叠加形成新的输入图像.其次,采用二维Gabor滤波函数提取新的输入图像的纹理结构特征,以此代替灰度特征来衡量节点间的相似性.最后,采用一种改进的节点间距离度量公式来计算图像中节点与聚类中心点的差异.仿真结果表明,对结构复杂的图像所提算法获得了更加精确的分割结果.  相似文献   

15.
聚类是识别基因表达数据蕴含的关键基因调控模块的一种有效方法,基因表达谱的相似性度量是聚类的关键问题.然而,一般的相似性度量方法不能刻画时间序列基因表达谱数据所蕴含的时间延迟、反向相关和局部相关等复杂的基因调控关系.针对时间序列基因表达谱数据,提出一种基于近邻传播和动态规划的相似性度量方法和聚类算法.在大鼠再生肝细胞基因表达谱数据集上的聚类结果与基因功能富集分析结果高度一致,证明算法在时间序列基因表达谱数据聚类上的有效性.  相似文献   

16.
聚类方法的核心是如何度量事物间的邻近性。介绍了邮件特征的向量表示形式、构建了邮件特征矩阵,并使用变形后的极值分布函数模型拟合了邮件间通信特征信息;在此基础上提出了一个新的邻近性度量方法(ex-treme value distribution similarity,EVS),用以指导邮件社区划分;使用微聚类-宏聚类邮件社区划分算法验证了该方法的有效性。实验表明,在测试数据集上,相比余弦、PCC等经典的邻近性度量方法,以EVS作为划分依据的邮件社区划分算法能够更加有效地发现高质量的邮件社区。  相似文献   

17.
模糊C均值聚类具有较广泛的应用,但该聚类算法本身存在容易陷入局部最优、对初始值敏感的缺点.本文提出基于蝙蝠算法与模糊c均值算法相结合的BAFCM聚类算法,并通过数值实验对比,说明BAFCM聚类效果优于FCM、PFA.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号