首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
在分析谱聚类实现思路和已有算法基础上,对规范切判据,最小最大切判据和自动确定聚类数目的谱聚类典型算法进行了研究和应用,通过理论分析算法各自实现机理的联系与区别,讨论它们各自的聚类特点,并利用UCI(University of California,Irvire)机器学习数据集试验对比了三种算法的聚类效果.发现谱聚类算法实现数据聚类的有效性,以及参数及相似度度量对算法性能有很大影响,在此基础上提出了算法用于解决可建模为模式识别的工程问题的可行思路,为工程实践提供了借鉴.  相似文献   

2.
基于粗糙集的聚类算法中阈值自动选取   总被引:1,自引:0,他引:1  
输入参数影响聚类算法的可用性,利用逐差法自动选取初始化阈值,使聚类算法无须任何参数,且有效降低算法的时间复杂度。逐差法利用已有数据本身属性,对相似系数矩阵行数据进行快速排序,逐个做差,求取初始化阈值。试验结果表明,新方法保证了分类精度,提高了运行效率。逐差法的应用使得基于粗糙集的聚类算法成为一种更加客观、准确的聚类方法。  相似文献   

3.
为了对时间序列数据进行聚类分析, 提出了一种基于独立成分分析的时间序列多路归一化割谱聚类方法, 并给出了利用独立成分分析对时间序列数据进行特征提取和降维的理论解释. 该方法首先利用独立成分分析对时间序列数据进行特征提取, 然后利用多路归一化割谱聚类方法完成对时间序列特征数据的聚类分析, 从而得到了一种新的基于特征的时间序列聚类方法. 为了验证该方法的可行性和有效性, 将其应用于仿真时间序列数据和实际的股票时间序列数据聚类分析中, 取得了较好的数值结果.  相似文献   

4.
在有序粒度空间理论的基础上,提出了基于模糊邻近关系的结构聚类分析理论和方法.首先,给出了依据距离的一致聚类的概念,提出了模糊粒度空间的一致聚类特征;其次,给出了模糊邻近关系结构聚类的粒度表示,并获得了基于模糊邻近关系结构聚类的快速算法;进而,提出了获取最佳聚类的新方法,并且这一方法是全局最优的;最后,给出了通过两个模糊邻近关系的交运算获取结构聚类融合的方法.为复杂系统结构分析研究提供了一整套理论工具和方法.  相似文献   

5.
基于脉冲描述字进行雷达信号分选时,传统聚类算法需要预先人工设定聚类中心和聚类数目。针对该问题,提出一种基于数据场理论联合脉冲重复间隔(pulse repetition interval,PRI)变换与聚类的雷达信号分选新方法。首先,依据数据场理论,基于势值大小实现干扰点剔除,而后利用PRI变换算法进行PRI估计,依据PRI估计值将归一化脉冲描述字数据预分类,进而以各类数据集中心间的欧氏距离小于辐射因子为准则进行类别合并,自动得到初始聚类中心和聚类数目,最后通过改进K-Means算法完成聚类分选。仿真实验表明:所提方法能够应对存在频率捷变,重频参差、抖动、参数交叠、局部脉冲丢失的复杂信号环境,分选正确率明显提升。  相似文献   

6.
聚类有效性研究综述   总被引:1,自引:0,他引:1  
聚类是一个无监督学习过程,因此确定最佳聚类数是一项困难的工作. 聚类有效性研究是通过建立聚类有效性指标,评价聚类质量并确定最佳聚类数的过程. 首先,介绍了聚类的数学描述和聚类有效性指标的分类;然后,基于指标 构成成分的不同,分别评述了12 个仅考虑数据集几何结构信息的聚类有效性指标、6 个仅考虑隶属度的聚类有效性指标以及9 个同时考虑数据集几何结构信息和隶属度的聚类有效性指标,分析了不同类型指标的研究现状;接着,简要总结了外部性指标和稳定性指标等其他聚类有效性指标的研究现状;最后,总结并展望了聚类有效性研究面临的挑战和发展方向.  相似文献   

7.
基于模糊投影寻踪聚类的洪灾评估模型   总被引:1,自引:0,他引:1  
针对洪水灾害样本集的复杂性、随机性以及差异性,本文将模糊聚类迭代理论与投影寻踪技术进行互补融合,构建了模糊投影寻踪聚类模型.该模型采用投影值标准差和投影值欧氏距离平方和来构造投影指标函数,避免了传统投影寻踪模型由于经验性选取密度窗宽导致过于主观的问题;将高维数据低维化后进行模糊聚类运算,再通过对最优投影方向的寻优进行投影寻踪聚类运算,降低了模糊聚类迭代的运算量,实现了两种模型的双重迭代聚类.误差分析及聚类有效性评价表明,互补融合后模糊聚类与投影寻踪聚类的双重迭代聚类使得聚类精度和效果也得到了较大提高;此外,除优化算法初始化参数外,模型无需预设其它参数,也不依赖于随机训练样本,可客观依据历史样本集内在规律来进行洪灾聚类评估.实例研究和方法比较表明,提出的模型计算简洁,且能有效处理洪灾评估中的随机、模糊等主客观不确定性,能够为洪灾风险管理提供科学的决策支撑.  相似文献   

8.
针对非均匀类簇密度聚类问题,从商空间粒度理论出发,提出一种多粒度自学习聚类算法 (multi-granularity self learning clustering algorithm, MSCA)。算法通过构造聚合树结构和定义粒度函数对问题逐层求解,并在每层聚合过程中根据聚合区间以自学习的方式动态确定聚合粒度,解决了传统聚类算法从非均匀类簇密度数据中无法得到不同层次的聚合特征且参数对经验依赖性过高的问题。理论和实验表明,MSCA算法可以发现任意形状类簇,有效处理噪声,并能发现关键聚合层,具有较好的计算复杂性。  相似文献   

9.
一种基于网格密度与空间划分树的聚类算法   总被引:1,自引:0,他引:1  
基于密度的聚类是聚类分析中的一种,其主要优点是发现任意形状的聚类和对噪音数据不敏感.文章提出了一种新的基于网格密度和空间划分树的CGDSFF(Clustering based on Grid - Density andSpatial Partition Tree)聚类算法.其创新点在于,将数据空间划分成多个体积相等的单元格,然后基于单元格定义了密度、簇等概念,对单元格建立了一种基于空间划分的空间索引结构(空间划分树)来对数据进行聚类.CGDSPT算法保持了基于密度的聚类算法的上述优点,而且CGDSFF算法具有线性的时间复杂性,因此CGDSPT算法适合对大规模数据的挖掘.理论分析和实验结果也证明了CGDSPT算法的优点.  相似文献   

10.
一种改进的人工免疫文本聚类算法   总被引:1,自引:0,他引:1  
构造了一种能准确描述文本之间相似性(亲和力)的新方法,并在此基础上提出了一种改进的人工免疫文本聚类算法。仿真结果表明,与传统的文本聚类算法相比,新算法不仅能自动发现新类,而且具有聚类精度更高、数据压缩比更大、与输入初始配置无关、可增量处理的优势。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号