首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
一种鲁棒的子空间聚类算法   总被引:2,自引:1,他引:1  
针对聚类分析常面临的维数灾难和噪声污染问题,将样本加权思想与子空间聚类算法相结合,提出了一种鲁棒的子空间聚类算法.该算法结合现有子空间聚类方法,为每个类簇计算一个反映各维度聚类贡献程度的权矢量,并利用该权矢量对各维度加权组合,得到各类簇所处的子空间.此外,算法还为每个样本分配一个反映离群程度的尺度参数,以区分正常样本和离群点在聚类过程中的地位,保证算法的鲁棒性.在二维数据集、高维数据集以及基因数据集上的对比实验结果表明,对于具有不同噪声比例的各种维度数据集,该算法均能取得较高的聚类精度,表现出较好的鲁棒性.  相似文献   

2.
基于传统吸引子传播算法, 通过样本特征赋权, 克服冗余信息的影响及给出新的相似性度量方法等策略, 提出一种基于变异系数赋权的吸引子传播算法. 实验结果表明, 该算法在处理属性较多、 信息重叠的样本时, 不仅具有吸引子传播算法的快速、 高效聚类特征, 且聚类性能明显优于传统吸引子传播算法和K-均值等经典聚类算法.  相似文献   

3.
聚类分析是一种数据缩减技术,即基于数据特征的相似性将数据聚集成不同的类,是数据挖掘中一种非常有效的工具,得到了人们广泛的关注。从聚类算法中的相似性度量问题入手,采用基于流形距离的相似性度量替代传统的基于欧氏距离的相似性度量,通过二阶段聚类解决引入流形距离带来的计算量增大问题,并将这种聚类算法应用到聚类分析当中。  相似文献   

4.
针对传统的基于距离/相关系数的相似性度量方法无法有效度量基因间的时延表达特性,为了更加准确地刻画基因间的共调控关系,提出一种基于动态时间弯曲距离(DTW)的相似性度量方法,并结合可指定类数的仿射传播聚类算法进行聚类.将该算法用于人工合成数据和真实的酵母基因数据集,实验结果表明,相对于其它经典聚类算法,本文所提算法能得到更好的聚类结果.  相似文献   

5.
间歇生产过程配方的模糊聚类方法   总被引:3,自引:0,他引:3  
针对间歇生产过程的配方缺少定量分析方法,难以用于过程建模和控制策略实施的问题,提出了一种基于类核函数的配方模糊聚类算法.对ISA配方模型进行了简化,建立了配方样本的相似性测度方法;根据配方样本的模式多样性,建立配方类核来代替配方类心,通过最小化所有配方样本到配方类核距离的加权和来对配方进行聚类,从而得到聚类数目及模糊隶属度矩阵.最后对一类间歇蒸发器的配方使用该方法进行模糊聚类,通过和FCM算法的比较验证了该方法的有效性。  相似文献   

6.
为了降低谱聚类采用高斯函数作为相似性度量方式对参数的敏感性,以及能够发现多密度簇的同时降低噪声点的干扰,提出了一种将基于均衡接近度的灰关联分析结合到谱聚类中的新方法,采用加权的自适应相似性度量方式。最后用改进的FCM算法对其进行聚类。在真实数据集和人工数据集上分别对提出的算法和现有算法进行了比较分析。研究结果表明,提出的新算法能够消除参数的影响,具有更高的聚类精度。聚类精度采用F测度指标。  相似文献   

7.
提出一种新的数据分类方法,K-均值聚类分组支持向量机(CG-SVM)方法,在不删减任何样本信息的情况下,该方法使用轮廓系数作为类分离度量参数对数据的正、负类样本进行聚类、分组,对小组进行交叉结合训练,得到不同的SVM分类器,根据测试样本到聚类中心欧氏距离的加权来选择合适的SVM分类器进行类别判断,该方法实现了一个二分类问题转化为多个细分的二分类过程,效果由差变好.对所提方法分别进行了仿真数据和实际数据分类实验.实验结果表明,与传统的SVM方法相比,该算法可以有效地提高分类的准确率.  相似文献   

8.
时间序列的相似性度量是时间序列聚类、分类以及其他相关时间序列分析的基础.传统基于距离的相似性度量方法,忽视了时间序列可能存在的时间上的联系,而将时间序列看作一系列孤立点的集合.对于序列间可能存在的前后联系,基于分数阶微分的遗传特性和记忆特性,提出一种新的时间序列聚类的相似性度量.根据时间序列的分数阶微分计算新序列间的点距离,将其作为聚类算法的输入对时间序列进行聚类.仿真实验结果表明,与基于原始序列矢量距离的聚类结果相比,新的分数阶相似性度量方法表现更好.  相似文献   

9.
基于聚类和SVM的数据分类方法与实验研究   总被引:1,自引:0,他引:1  
提出一种新的数据分类方法,K-均值聚类分组支持向量机(CG-SVM)方法,在不删减任何样本信息的情况下,该方法使用轮廓系数作为类分离度量参数对数据的正、负类样本进行聚类、分组,对小组进行交叉结合训练,得到不同的SVM分类器,根据测试样本到聚类中心欧氏距离的加权来选择合适的SVM分类器进行类别判断,该方法实现了一个二分类问题转化为多个细分的二分类过程,效果由差变好.对所提方法分别进行了仿真数据和实际数据分类实验.实验结果表明,与传统的SVM方法相比,该算法可以有效地提高分类的准确率.  相似文献   

10.
研究移动物体时空轨迹局部关键地点时空相似的聚类问题.根据移动物体的运动状态提取轨迹中的有趣地点,利用最小包围盒技术对这些有趣地点进行描述,得到基于有趣地点压缩的轨迹表示形式;然后给出一个时空属性相结合的相似性度量公式,对压缩表示的轨迹进行相似性度量;基于这个相似性度量公式对轨迹进行聚类,聚类方法采用层次聚类法.实验结果表明,本文提出的方法能有效地对移动物体时空轨迹进行聚类,由于采用了增量式的轨迹压缩方法,不仅提高了聚类的速度,而且还实现了增量式的轨迹聚类.  相似文献   

11.
针对基因间共调控关系的特点和现有共调控基因聚类分析方法的不足,提出一种基于广义信息论中二次互信息的广义相似性度量标准QMISM,并利用免疫遗传算法将高维样本映射到二维空间,进而实现动态模糊聚类和聚类结果可视化.对人工合成数据和真实的基因表达数据的实验结果表明,该算法能得到更好的聚类结果.  相似文献   

12.
在无约束条件下,人脸表情、姿态、光照以及背景等复杂因素可能导致人脸图像的类内变化大于类间变化.针对如何降低较大的类内变化对人脸验证研究的影响,本文结合加权子空间,提出了一种带先验相似性和先验距离约束的相似度度量学习方法.首先,利用类内人脸对样本,学习带权重的类内协方差矩阵,通过加权子空间的投影,从人脸图像中获得鲁棒性的人脸特征表达;其次,利用样本对的相似性与差异性,建立了带先验相似性和先验距离约束的相似度度量学习模型,优化后的度量矩阵可以有效提高特征向量的类内鲁棒性和类间判别性;最后,利用优化的度量矩阵计算人脸对的相似度.在LFW(Labeled Faces in the Wild)数据集的实验验证了所提模型的有效性,与其它同类相似度度量学习方法相比,优化的度量矩阵更能准确地评估人脸间的相似性,并在受限训练集上取得了91.2%的识别率.  相似文献   

13.
将序列数据的相似度度量方法S3M引入蚁群聚类算法中,提出一种基于序列相似性的蚁群聚类算法。该算法既继承了蚁群聚类算法原有的优点,又能有效地对序列数据聚类,更适合处理序列数据。  相似文献   

14.
针对粗糙模糊C均值聚类的阈值、权重选取问题,提出了一种基于不确定性度量的参数自适应获取方法.该方法将阈值选取归结为一个最优划分寻找问题,给出一种基于方差的划分优劣评价方法;利用信息熵来度量样本归属的模糊性,基于该模糊性度量和类簇的粗糙度,提出了一种权重参数自适应计算方法.将所提方法应用于粗糙模糊C均值聚类,并将分别基于所提方法与典型参数选取方法的粗糙模糊C均值聚类算法在人工数据集和真实数据集上进行实验比较.结果表明,基于所提参数确定方法的粗糙模糊C均值聚类能获得更好的聚类有效性和准确性.  相似文献   

15.
聚类是识别基因表达数据蕴含的关键基因调控模块的一种有效方法,基因表达谱的相似性度量是聚类的关键问题.然而,一般的相似性度量方法不能刻画时间序列基因表达谱数据所蕴含的时间延迟、反向相关和局部相关等复杂的基因调控关系.针对时间序列基因表达谱数据,提出一种基于近邻传播和动态规划的相似性度量方法和聚类算法.在大鼠再生肝细胞基因表达谱数据集上的聚类结果与基因功能富集分析结果高度一致,证明算法在时间序列基因表达谱数据聚类上的有效性.  相似文献   

16.
聚类集成的目标是通过集成多个聚类结果来提高聚类算法的稳定性、鲁棒性以及精度.近些年,聚类集成受到了越来越多的关注.现有的集成聚类通常平等地对待所有基聚类,而不考虑它们的重要度.虽然学者们已经在这一方面做出了一些努力,例如使用加权策略来改进共协关系矩阵,但无论是给基聚类加权还是对类重要度评价时都忽略了样本对于其所在类贡献的差异.为此,提出了基于样本对加权共协关系矩阵的聚类集成算法,该算法利用k-means算法产生多个基聚类结果,然后对于其中的每个类再利用k-means算法产生多个小类,并计算去掉样本对所在的小类后类的不确定性变化的程度来评价该样本对的重要度,最后通过层次聚类算法得到聚类结果 .在六个UCI数据集上的实验结果表明,基于样本对加权共协关系矩阵的聚类集成算法的性能优于三种经典的基于共协关系矩阵的聚类集成算法.  相似文献   

17.
针对传统K均值算法中采取的欧氏距离计算相似性的不足,提出一种新的相似性计算方法,并将这种方法与欧氏距离的度量方法进行了比较。在UC I基准数据集上的实验表明,该方法有更稳定的聚类结果,是一种比较有效的聚类度量方法。  相似文献   

18.
聚类分析是数据挖掘与知识发现领域的一个重要研究方向.多数聚类算法中相似性是其核心概念之一,对象之间的相似性会被直接或者间接的计算出来.传统的相似性度量方法多是基于单一的粒度去观察两个被测对象.在人类认知过程中,通常采用多粒度来更合理有效地进行问题求解.本文借鉴人类的这种多粒度认知机理,提出一种新的相似性学习方法,称作全粒度相似性度量方法,基于此发展了一种全粒度聚类算法.而全粒度相似性度量从各个角度观察被测对象,进而会得到两个对象间更加真实的相似度.从UCI数据集中选取5组数据进行实验,最后通过与两种传统的聚类方法比较验证了全粒度聚类算法的合理性与有效性.  相似文献   

19.
气象条件是影响终端区航空器运行安全及效率的主要因素之一。为提高终端区气象场景模式识别精度,采用基于堆叠降噪自编码(SDAE)的聚类模型,在输入层添加随机噪声、构建3层自编码、逐层贪婪训练,降维后的特征作为聚类的输入,实现气象场景的模式识别。以天津滨海国际机场2022年气象观测数据为例,基于SDAE与欧氏距离、汉明距离、曼哈顿距离等传统相似性距离度量方法,分别使用K-medoids与FCM两种聚类方法进行验证。结果表明:基于SDAE的相似性度量在K-medoids与FCM聚类中均表现最优,与其他相似性度量相比差异率分别达到22.4%,12%,17.7%与24.8%,10.7%,11.8%,且运算时间最短,证明了基于SDAE的度量、聚类效果最优,最终识别出8个气象场景,各场景分类清晰明确。  相似文献   

20.
基于全局空间相似性的模糊聚类算法   总被引:1,自引:0,他引:1  
用传统模糊C均值聚类算法分割图像时,类内数据空间分布离散.针对这一问题,提出一种基于全局空间相似性模糊聚类算法.算法建立全局空间相似性度量标准和全局灰度相似性度量标准,分别计算图像中任意一点与聚类中心点的空间相似性和灰度相似性;通过调整参数来控制两种特征在节点间差异计算中所占的比重,增强了分割结果中类内数据样本空间分布...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号