首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 454 毫秒
1.
针对模糊C均值聚类(FCM)算法聚类原型最适合于球状类型簇的特点,提出了基于类间分离度和类内紧缩度加权的冗余聚类中心的FCM算法,即先将大簇或者延伸形状的簇(非凸)采用加权FCM算法分割成多个小类(冗余类),从而规避FCM算法对初始聚类中心敏感的弱点.由于隶属度划分矩阵的元素是每个样本隶属于各冗余类的隶属度值,因此将其作为各冗余类的类特征,通过对应分析得到冗余类的新特征,再次采用加权FCM算法进行冗余类合并,最后达到分类效果.以代表曲线分割和曲面分割分类问题的3个典型数据集为算例,结果表明该方法能够识别不规则的簇,解决了FCM算法对初始聚类中心敏感的缺陷.  相似文献   

2.
为了解决模糊关联规则挖掘算法需要用户事先给定模糊集和相应隶属度函数的问题,提出基于分布式聚类自动生成模糊集及隶属度函数的算法GFAM.该算法利用分布式K—Means聚类算法对每个数值型属性进行聚类,求得聚类中心,由此构造全局模糊集,定义全局隶属度函数.DFAR算法根据构造的全局模糊集及隶属度函数进行分布式模糊频繁项目集的快速挖掘,采用全局一局部站点模式,其中包括局部模糊频繁项目集产生算法FLF和全局模糊频繁项目集产生算法FGF.实验结果表明,该算法能准确地生成全局模糊频繁项目集,在求解全局模糊频繁项目集过程中,传送局部模糊候选项目集支持数的通信量为O(n),提高了算法的挖掘效率.  相似文献   

3.
在模糊C-均值聚类问题目标函数中使用正则化泛函,将聚类中心解的误差指标引入到模糊聚类的目标函数中,构造出新的模糊C-均值聚类算法RBFCM(Regularization based Fuzzy C-means)算法.算法RBFCM不仅具有较高的聚类精度,且计算结果具有更好的稳定性.进一步,将此RBFCM算法应用于基于T-S模糊模型的系统辨识问题.由于RBFCM算法优化了模糊系统的输入空间划分,提高了隶属度函数的精度,使得后继得到的T-S模糊系统辨识精度也有所提高,且系统辨识过程的收敛速度也有所改善.最后,通过对经典IRIS数据集、带有噪声的IRIS数据集的聚类算例和对Box-Jenkins煤气炉数据集进行辨识算例,验证了RBFCM算法的有效性和优越性.  相似文献   

4.
为了解决模糊关联规则挖掘算法需要用户事先给定模糊集和相应隶属度函数的问题,提出基于分布式聚类自动生成模糊集及隶属度函数的算法GFAM.该算法利用分布式K-Means聚类算法对每个数值型属性进行聚类,求得聚类中心,由此构造全局模糊集,定义全局隶属度函数.DFAR算法根据构造的全局模糊集及隶属度函数进行分布式模糊频繁项目集的快速挖掘,采用全局-局部站点模式,其中包括局部模糊频繁项目集产生算法FLF和全局模糊频繁项目集产生算法FGF.实验结果表明,该算法能准确地生成全局模糊频繁项目集,在求解全局模糊频繁项目集过程中,传送局部模糊候选项目集支持数的通信量为O(n),提高了算法的挖掘效率.  相似文献   

5.
基于传统的模糊聚类算法(C-means、FCM),在高斯隶属度函数的基础上给出了包含性指标的定义,提出了基于高斯隶属度的包容性指标模糊聚类算法(fuzzy inclusion-based clustering,FIC)。该方法通过获取高斯隶属度函数的包含性指标,为每个分类确定一个支持距离的半定性矩阵,来保证每个分类到所有数据类的距离和与所有数据类包含度的总和一致。通过UCI中Wine数据集进行了仿真实验,实验结果表明与FCM算法相比较,FIC算法具有更好的有效性和可行性。  相似文献   

6.
模糊c均值聚类算法(FCM)由于样本模糊隶属度归一性的约束,导致FCM算法对噪声数据敏感。提出松弛模糊C均值聚类算法(RFCM),RFCM算法在可能性c均值聚类算法(PCM)目标函数的基础上,放弃了FCM算法单个样本模糊隶属度归一化约束,转为n个样本模糊隶属度之和为n的约束,并利用粒子群算法对样本模糊隶属度进行优化估计,使得模糊指标可拓展为m>0的情况,同时采用梯度法得到RFCM算法聚类中心迭代公式。RFCM理论分析了算法对噪声数据抗噪的原理,解释了RFCM算法模糊指标m>0的合理性,讨论了RFCM算法的收敛性。基于gauss数据集和UCI数据集的仿真测试验证了所提出算法的有效性。  相似文献   

7.
在以模糊集为理论支持的聚类算法中,KFCM(kernel fuzzy c-means clustering)是一种对核函数进行优化的模糊聚类算法。KFCM算法需要人为指定数据的分类个数,对数据噪声敏感会降低其性能,且类边缘数据点相互影响会导致分类错误。针对这些问题,该文提出一种改进的C-KFCM模糊算法,先用Canopy粗聚类算法给出数据集大致的分类数,接着在聚类部分使用KFCM算法。改进了原KFCM算法的隶属度函数,在噪声点和边缘数据的隶属度中引入其邻域数据的隶属度平均值,使数据中的噪声对算法的影响减小或消失。实验结果表明,改进的C-KFCM算法能自动确定分类数,并且与原KFCM算法相比,C-KFCM将平均准确率提高了0.09%,且聚类效果更稳定。  相似文献   

8.
雷达与GPS的数据关联   总被引:3,自引:0,他引:3  
提出了基于模糊类原理的雷达与GPS数据融合的方法,该方法利用模糊C均值算法计算航在联的隶属度,并由此构成自适应的相关检测函数;通过直接将GPS子波估计航迹作为聚类中心,避免了聚类划分的迭代运算,使算法十分简便。实验分析表明,该方法能够得到可靠的航迹产联性能。  相似文献   

9.
林辉 《河南科学》2013,(10):1668-1670
针对现有客户关系管理(CRM)的局限性,引入了模糊数学相关算法,给数据对象的隶属度加上一个权值,以及在算法中用有效性函数来自动确定聚类数目C,理论分析与实验结果表明,在CRM环境下所引入的改进模糊聚类算法比传统模糊聚类算法有更好的聚类效果,更快的聚类速度.  相似文献   

10.
改进模糊聚类算法及其在入侵检测中的应用   总被引:1,自引:0,他引:1  
针对将数据集隶属度概率和为1的条件用于模糊性事件时,影响聚类的正确率的情况,在不确定理论的基础上,研究了数据隶属度问题,提出一种新的基于隶属关系不确定的可能性改进模糊聚类算法.该算法在迭代过程中将聚类的可能隶属度与不确定性隶属度引入到目标函数中,使得样本中的元素不局限于仅属于一个聚类,与现有的聚类算法相比具有更好的聚类结果.通过在KDDCUP99数据集上实验,验证了该算法在入侵检测中的检测率为95.8%, 分别高于K-均值算法的检测率(60.4%)和FCM算法的检测率(64.6%).  相似文献   

11.
为解决有限区域内分布的稀疏不均的、具有一定分布结构数据集的聚类分析难题,在近邻思想、网格化空间划分及万有引力叠加原理的启发下,提出了一种基于单元网格近邻势的聚类方法。该方法是基于近邻势的聚类方法在单元网格层次上的一种可以提高聚类速度的扩展。为有效实现并在时空效率上对这种聚类方法进行尽可能的改进,使用了单元网格、网格密度、多维网格划分法、多维索引树等一些比较重要的概念和方法。仿真实验中, 先使用多个不同类型的人工数据集将提出的算法与几个经典聚类算法在聚类精度、聚类速度等方面进行适当的比 较,采用两副图片在RGB(red, green,blue)色彩空间的像素点集来验证该算法的聚类压缩效果。仿真实验说明了这种方法比一些经典的聚类算法在聚类建设、聚类质量方面具有一定的有效性和优越性  相似文献   

12.
给出一种将网格技术、密度技术与分形理论的自相似性结合起来的一种有效聚类算法,利用分形维度变化最小同时是相似程度最大的特点来划分数据集从而得出聚类结果.实验表明该算法可以快速有效的处理多维大型数据集,识别出任意形状簇的个数,而且可以从数据集中挖掘出一些有用的分布信息.  相似文献   

13.
利用确定性退火技术的并行聚类算法   总被引:3,自引:0,他引:3  
划分聚类和分级聚类是两种基本的聚类手段。划分聚类常常可以转换为一个全局最优化问题 ,传统的划分聚类方法很难得到全局最优解。基于确定性退火技术 ,给出了解决划分聚类问题的一种算法 ,并给出了在集群系统上的并行化方案 ,推导出了参与并行计算的最佳处理机数目 ,给出了加速比的估算公式。通过模拟算例可知 ,该算法的特殊结构适合在机群系统上进行并行计算 ,特别对聚类点集相当大的聚类问题 ,由于任务间的通信开销与计算量相比很小 ,能够达到很好的并行效果  相似文献   

14.
针对模糊c均值聚类算法的一些不足之处提出了一种新的均值漂移聚类算法--无监督多尺度聚类算法.该算法不受初始化的影响,不用假定数据的聚类个数以及聚类中心的初始位置,能够利用模糊聚类的方法来获得硬的聚类划分,能够从不同的"划分尺度"揭示数据的聚类结构,并能自动的确定聚类个数.为了满足处理大数据集的需要,设计了快速无监督多尺度模糊聚类算法.通过实验证明无监督多尺度聚类算法在多数数据集上都表现良好且具有最好的总体聚类性能,并能成功揭示出数据的聚类结构.实验还证明快速无监督多尺度模糊聚类算法具有较快的速度和较高的识别精度且适用于大数据集.2个算法都取得了令人满意的实验结果.  相似文献   

15.
为了快速挖掘大规模空间数据的聚集特性,在cluster_dp密度聚类算法基础上,提出了一种基于弹性分布数据集的并行密度聚类方法 PClusterdp.首先,设计一种能平衡工作负载弹性分布数据集分区方法,根据数据在空间的分布情况,自动划分网格并分配数据,使得网格内数据量相对均衡,达到平衡运算节点负载的目的;接着,提出一种适用于并行计算的局部密度定义,并改进聚类中心的计算方式,解决了原始算法需要通过绘制决策图判断聚类中心对象的缺陷;最后,通过网格内及网格间聚簇合并等优化策略,实现了大规模空间数据的快速聚类处理.实验结果表明,借助Spark数据处理平台编程实现算法,本方法可以有效实现大规模空间数据的快速聚类,与传统的密度聚类方法相比具有较高的精确度与更好的系统处理性能.  相似文献   

16.
以基于模糊c—划分的聚类方法为基础,针对影响目标函数聚类法聚类效果的主要因素,分别从5个主要方面作了聚类算法的适用性分析。  相似文献   

17.
K-means算法是聚类方法中常用的一种划分方法.基于扩展划分的思想,提出了一种基于扩展的K-means聚类算法(EK-means),在一定程度上避免了聚类结果陷入局部解的现象,减少了原始K-means算法因采用误差平方和准则函数而出现将大的聚类簇分割开的情况.该算法使用了基于距离的技术来处理孤立点,引进了一种基于扩展的方法进行聚类.实验表明该算法可扩展性好,能够很好的识别出孤立点或噪声,并且有很好的精度.  相似文献   

18.
提出了一种基于八邻域网格聚类的多样性XML近似查询算法.首先给出了支持XML文档间语义距离计算的3种编辑操作代价模型,再利用XML文档间的语义距离建立XML文档的向量模型并设计基于八邻域网格的XML文档聚类算法,进而利用聚类过程中得到的物理和逻辑聚类中心对静态有序选择算法的查询评估策略进行优化,这样做只需定位聚类中心所在组群的局部范围,并在该范围内进行目标查询,而无需遍历整个XML数据库,从而快速返回满足用户需求的查询结果.经汽车外形智能化设计实验表明,所提算法的查询速度比静态有序选择算法平均提高了3~4倍.  相似文献   

19.
人工免疫C-均值聚类算法   总被引:13,自引:0,他引:13  
通过借鉴生物免疫系统中的克隆选择原理和记忆机制,提出了一种人工免疫C-均值混合聚类算法.该算法采用了新的克隆选择方法,通过亲和度排序和个体浓度定义了个体的选择概率,从而可确定个体的适应值评价函数,以评价和选择个体.算法还集成了一种C-均值搜索算子,用于加快收敛速度.在聚类数目已知的情况下,所提算法能够得到给定数据集下的全局最优划分,与基于遗传算法的聚类方法比较,它具有更快的收敛速度和更高的收敛精度,并可扩展到性能指标能够表示为优化聚类中心函数的聚类模型之中.仿真结果表明,所提算法是有效性的.  相似文献   

20.
提出了一种相对简单、有效的划分复杂网络社团结构的方法.该算法利用复杂网络的转移矩阵P和K均值聚类算法来划分社团结构,并且用F统计量判定最优的聚类结果,在探测社团结构明显的人工网时具有较高的准确度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号